Google desarrolla, a través del laboratorio Deepmind, responsable de la Inteligencia Artificial (IA) de la compañía, una voz sintética de una precisión casi idéntica a la generada por un ser humano.
Desde el portal Quartz indican que una de las novedades de esta versión es la capacidad de pronunciar nombres y palabras difíciles, así como distinguir los signos de puntuación o si una parte del texto requiere ser pronunciada con una entonación diferente.
Este sistema permite transformar el texto en discurso primero, recreando el texto en un espectrograma, es decir, plasmando de forma gráfica las palabras en forma de ondas para que el software de Google Wavenet las interprete y posteriormente las transforme en voz.
Hasta el momento, Tacotron 2 se encuentra en fase de prueba, disponible únicamente en inglés e interpretado por una voz femenina, como se puede comprobar en la página de Google en GitHub, donde la compañía ha compartido ejemplos de audio.