TecnoXplora » Internet

EL INTERNET DEL FUTURO ES HABLADO

El futuro de las búsquedas será por voz: los teclados tienen las horas contadas

Dice el Génesis 3:19 que los humanos polvo somos y al polvo volveremos. Lo que no cuenta es que, además, del lenguaje oral venimos y al lenguaje oral volveremos. Los atracones de escribir que nos estamos dando desde que apareció internet son una anomalía histórica. Nunca se escribió tanto y nunca antes se teclearon tantas conversaciones. Pero le queda poco.

Una habitación en la Google House España

Una habitación en la Google House España Google Spain

Publicidad

La mayor parte de la información que los humanos han ido dejando a las generaciones posteriores era hablada. Lo hacían en forma de cuentos, leyendas, recetas, dichos... Hasta que la aparición de la imprenta de Gutenberg, en el siglo XV, hizo de la escritura algo más habitual. Pero solo algo más habitual, no lo habitual. Los libros, los periódicos o los fanzines se convirtieron en la versión más noble de la comunicación. La letra escrita empezó a tener más prestancia que la hablada.

Pero a finales del XX y principios del siglo XXI el planeta de la lengua sufrió un fuerte temblor. La llegada de los SMS, los correos electrónicos y las redes sociales trasladaron muchas conversaciones de voz a soportes escritos. El orden de las cosas había cambiado radicalmente. En esos espacios gran parte de la comunicación seguía los usos orales, aunque, formalmente, apareciera escrita. El mundo hablado se había llevado al escrito por un requerimiento puramente técnico.

Los ingenieros, desde sus puestos de investigación, observaron el fenómeno y descubrieron que los humanos escribían porque no había otra, pero, en realidad, la comunicación oral seguía siendo la más práctica y deseada. Por eso inventaron el reconocimiento de voz. Para dictar a los dispositivos y liberar a la población del teclado.

Y porque, además, el planeta se estaba llenando de móviles. Ya eran más que ordenadores de sobremesa y portátiles juntos. Y, además, millones de personas de países asiáticos y africanos solo podían conectarse a internet mediante un teléfono móvil. Es su puerta de entrada a ese lugar que William Gibson acuñó como ciberespacio. El uso de una pantalla pequeña no necesita más excusas. Mejor hablar que escribir.

Es el investigador senior de Google Pedro Moreno quien explica a TecnoXplora hacia dónde se dirige esta parte de la evolución tecnológica. El español, que trabaja en las oficinas de Nueva York de esta compañía, indica que esta forma de relacionarse con las máquinas incide también decisivamente en una de las actividades más comunes: las búsquedas de información.

“Estamos en pleno proceso de transformación. Hace unos 10 o 15 años las búsquedas estaban mediatizadas por los académicos. Nos acostumbramos a escribir en palabras clave, como si utilizáramos un lenguaje de indios, en vez de formular frases como lo hacemos cuando hablamos. Pero hoy los algoritmos son mucho más complejos y podemos relacionarnos de otro modo con los dispositivos”, comenta en las oficinas de Google en Madrid. “También hemos visto que las búsquedas se están haciendo ubicuas, es decir, desde cualquier dispositivo, y eso nos hizo plantearnos cómo hacer esta comunicación entre una persona y la máquina sin necesidad de usar teclado”.

Es ahí donde el reconocimiento de voz se hace fuerte. Cada vez más fuerte. Tanto que la idea de esta corporación que capitanea el desarrollo tecnológico actual ha puesto a sus patrullas de ingenieros a trabajar para que su buscador, Google, pase de ser “una cajita blanca de búsquedas escritas en indio a una especie de asistente personal”. Y, como ocurriría con un mayordomo, las conversaciones serán por voz.

Pedro Moreno explica que para que una máquina te entienda, primero, ha de tirar de una base de datos enorme llena de palabras. Después trasforma el sonido en una secuencia de términos lingüísticos y hace un análisis semántico.

El ingeniero dice que el español no es el idioma más complicado para que una máquina lo entienda. Más difíciles son el inglés o el danés, por ejemplo. Las lenguas más recientes también son más complicadas para que un dispositivo reconozca sus sonidos. Igual ocurre con los idiomas con mucha entonación. Y el más fácil es el italiano. Por eso, en Google, lo llaman “el idioma de Dios”.

En esta compañía utilizan modelos de redes neuronales para procesar, cada día, 5.000 horas de audio en la Península Ibérica y 14 años de audio en todo el mundo. Estas cifras suponen que en un año el servicio de reconocimiento de voz de Google crece un 20%.

En los laboratorios tecnológicos de esta compañía también trabajan en el desarrollo de la web semántica. Esto supone un paso más hacia la oralidad. De dar órdenes pasaremos a mantener una especie de conversación. “Lo que hace la web semántica es analizar la intención del usuario”, especifica Moreno. “Intentamos que el buscador entienda lo que quiere decir una persona dentro de un contexto”.

Las búsquedas, además, tienden a la personalización. El buscador se convierte, así, en un asistente virtual que recordará las conversaciones y consultas anteriores para relacionarlas con las nuevas búsquedas del usuario. Y, además, el asistente tendrá una de las cualidades de Dios. Puede ser omnipresente y estar en todos los dispositivos conectados de ese individuo. “En su coche, en su hogar, en el trabajo…”.

Dice Moreno que esperan que el asistente de Google pueda mantener conversaciones más largas de una frase en unos cinco años. Y dentro de 25 podríamos incluso tener diálogos tan sofisticados como los del software Samantha y el humano Theodore en la película 'Her', según el director del laboratorio de inteligencia artificial de Google, Ray Kurzweil.

Intel también está diseñando asistentes para el futuro. La compañía imagina, en sus laboratorios, un dispositivo basado fundamentalmente en la conversación. A diferencia de las Google Glass, que emplean audio y visuales, uno de sus prototipos (llamado Jarvis) solo utiliza el sonido. El asistente informa ya sobre información básica como el tiempo que hace, los nuevos correos electrónicos recibidos, la situación del tráfico o cómo llegar a una dirección.

En el futuro hablaremos tanto con la tecnología como los humanos lo hacían con los humanos.

Alguien debería actualizar el Génesis.

Publicidad