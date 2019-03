No es difícil resumir, a toro pasado, las razones del éxito de Skype: derribó muchas de las barreras que existían a la hora de comunicarnos con nuestros seres queridos cuando la distancia era un impedimento. Se ha convertido en una herramienta fundamental para estudiantes de Erasmus, expatriados y otros colectivos que tienen que lidiar con la barrera de la lejanía para mantener el contacto con amigos y familiares.

También, pero quizá en menor medida, se ha convertido en un estándar para hablar cara a cara con personas de otras nacionalidades que se encuentran a miles de kilómetros de distancia. Entrevistas de trabajo, reuniones... En esto, Google Hangouts y otras empresas especializadas también tienen mucho que decir, pero Skype es siempre una de las opciones que están sobre la mesa.

A todas las alternativas les falta una cosa, y sus propios responsables lo saben: ninguna ha logrado derribar la barrera del lenguaje. De momento, no existe un sistema de videoconferencia 'online' que gestione de forma elegante la diversidad de idiomas. De nuevo Skype, ahora en el seno de Microsoft, pretende ser la solución. Si todo marcha sin contratiempos, a finales de este año harán pública a modo de 'beta' su función de traducción simultánea.

Esto quiere decir que un español y un alemán podrán entenderse sin cambiar de idioma, empleando cada uno su lengua materna. La máquina se encargará de traducir de viva voz y/o subtitular lo que ambos están diciendo en tiempo real. Parece increíble que, si existen Siri, Cortana y Google Now, esto aún no estuviera disponible. Los servicios de traducción y el reconocimiento de voz están muy avanzados, pero aún no hay en el mercado un verdadero traductor simultáneo para videoconferencia marca Apple, Microsoft o Google.

En realidad, son muchas las barreras que estos gigantes tienen que superar para hacerlo posible. Los actuales traductores 'online' funcionan tirando de probabilidad y estadística. Un análisis de miles de textos disponibles en varios idiomas sirve a estas empresas para generar un corpus, una gigantesca base de datos a la que recurrirán luego los robots de traducción para buscar coincidencias. Por simplificar, si una frase ha sido traducida de la misma forma muchas veces en los textos de ese corpus, el robot ofrecerá esa equivalencia porque es la más probable.

Este sistema tiene, sin embargo, algunas carencias. La primera es que la máquina no entiende de veras lo que está traduciendo. Busca coincidencias, pero se hace un lío cuando las palabras están en un orden diferente al que esperaba o las oraciones son muy complejas y llenas de subordinadas. Esto sucede porque no entiende que los distintos idiomas tienen sintaxis diferentes. Cuando en español la norma es “sujeto + verbo + predicado”, en japonés es “sujeto + predicado + verbo”. Y las normas, por si fuera poco, están para romperse.

Este primer inconveniente lo salva Microsoft utilizando un 'software' pionero que sí tiene en cuenta la sintaxis. En lugar de limitarse a establecer equivalencias entre frases comunes, este mecanismo las divide en palabras y busca coincidencias individualmente (que es bastante más difícil).

Aun salvada esta barrera, hay otra que aleja la traducción automática de la simultánea que pronto estará disponible para Skype: los humanos no hablamos igual que escribimos. Basarse en un gigantesco corpus de textos escritos para buscar coincidencias no es suficiente cuando se trata de traducir una conversación oral.

De viva voz hacemos pausas, dudamos, utilizamos diferentes entonaciones... No es lo mismo preguntar “¿me vas a traer un regalo?” que exclamar “¡me vas a traer un regalo!” con tono de ilusión (ni tampoco que decir eso mismo mostrando enfado). Las consecuencias de una mala traducción en este caso, y en otros similares, pueden ser terribles.

Aquí es donde entran en juego las redes sociales. En Facebook, Twitter y demás plataformas escribimos de una forma más parecida a como hablamos, con expresiones propias del lenguaje oral y palabras coloquiales que no suelen aparecer en los textos escritos que componen los corpus de traducción de los gigantes.

Los investigadores de Microsoft, conscientes de ello, han utilizado las redes para enseñar a su traductor simultáneo, que pronto verá la luz en Skype, a entendernos un poquito mejor. Concretamente, han analizado mensajes de Facebook, SMS y tuits en busca de patrones que ayuden al robot a comprender cómo nos expresamos.

Lo que sucede es que, también entre las diferentes plataformas, hay diferencias. En Facebook utilizamos expresiones más emotivas, los SMS suelen ser más cortos y concisos y los mensajes que publicamos en Twitter son tal vez el término medio. Para que la máquina pueda trabajar sin reparar en ello, los de Redmond han desarrollado un sistema de normalización que adapta estas variaciones de estilo y que ha logrado incrementar la precisión de las traducciones basadas en redes sociales en un 6%.

Así las cosas, el sistema de traducción simultánea de Skype que verá la luz en los próximos meses seguramente no será perfecto, ni mucho menos, pero dará el pistoletazo de salida a una carrera en la que los participantes se cuentan con los dedos de una mano. Solo gigantes como Microsoft, Google o Yahoo pueden tomar parte en esta competición, pues solo ellos –gracias a sus respectivos buscadores– cuentan con la enorme cantidad de textos necesaria para establecer la base de datos inicial. Aquí, en principio, no hay 'startups' que valgan.