IA GENERATIVA

Alibaba muestra su nueva IA que fusiona audios e imágenes para crear vídeos

La IA generativa tiene otro competidor en el mercado, se trata del gigante chino Aibaba, que ha mostrado los primeros resultados de su IA, que crea vídeos a partir de imágenes y audios.

Publicidad

La carrera por la IA generativa cada vez cuenta con más competidores, y es que a los habituales OpenAI, Google o Microsoft, ahora se une también uno de los gigantes chinos, como es Alibaba, que también ha desvelado una IA capaz de transformas imágenes fijas en vídeos. Algo que no es nuevo, pero que ahora se muestra mucho más pulido que en anteriores ocasiones. De momento se trata de una IA experimental, pero que ya nos está mostrando todo su potencial que, si bien no es tan sorprendente como el Sora de OpenAI, sí que nos ofrece una interesante propuesta de futuro.

Así es EMO, la nueva IA de Alibaba

Esta nueva IA lo que nos ofrece principalmente es una herramienta para convertir una imagen fija en un vídeo. Este puede ofrecer una versión animada de esa foto en diferentes situaciones, ya sea cantando o hablando animadamente. Y todo ello realizando una adaptación creíble del aspecto original de la imagen y llevándolo a un vídeo creado de forma generativa por la IA. La duración del vídeo puede ser cualquiera que necesitemos, aunque también dependerá del audio que queramos añadir a la imagen original, adaptándose así el vídeo a la pista sonora.

Sus creadores nos han mostrado diferentes variantes de esta IA, que muestran a las imágenes fijas convertidas en vídeos donde no solo gesticulan mientras hablan, sino que también se transforman en cantantes con un aspecto muy creíble. Por tanto, se trata de una IA que puede fusionar tanto la imagen de entrada como la longitud del audio fuente al nuevo vídeo creado generativamente. Esta IA también puede generar vídeos a partir de imágenes en cualquier idioma.

De tal forma que el vídeo resultante muestre a cualquier persona hablando en un idioma diferente y gesticulando perfectamente como si se tratara de una locución original. Son muchos los ejemplos que ha mostrado Alibaba, con fotos en blanco y negro y en color, mostrando a celebridades del cine y personas comunes, incluso personajes de animación, transformados en alguien animado y con un aspecto completamente real.

No es una IA tan espectacular como Sora de OpenAI, pero desde luego nos demuestra que cada vez mas actores se van subiendo a la ola de la IA, y por supuesto, los asiáticos, que tienen un gran mercado al que ofrecer estas soluciones que cada vez son más comunes en nuestro día a día. Por tanto, estamos ante una nueva herramienta de generación de retratos y vídeos a partir de audio, por tanto, sería una manera sencilla de llevar a la vida a fotografías con un sonido personalizado.

Y desde luego una nueva herramienta que pone de manifiesto que el gran reto al que nos tendremos que enfrentar en nuestro futuro día a día será el del Deppfake, ya que cada vez son más y mejores las herramientas que pueden crear vídeos creíbles a partir de diferentes fuentes. Ya sea como en este caso con imágenes y pistas de audio, o como en el caso de Sora, desde unas simples líneas de texto. De momento esta tecnología de Alibaba solo es experimental, y no parece que tengamos cerca una herramienta de acceso masivo.

TecnoXplora» Internet

Publicidad