No hay semana en la que la IA no nos sorprenda con alguna nueva funcionalidad o modalidad de uso que nos deje con la boca abierta. Esto avanza a una velocidad que es difícil de seguir para muchos usuarios, que no tienen tiempo material de sacarle partido a estas inteligencias artificiales tan espectaculares en su conjunto. Google es una de las tecnológicas más activas a la hora de lanzar nuevas modalidades de IA, ya que cuentan con unos laboratorios de herramientas experimentales que facilitan y mucho la generación de nuevos formatos de IA. Y Whisk desde luego nos ha dejado perplejos por la manera tan sencilla y eficiente que tiene de funcionar.

Los prompts son cosa del pasado

Al menos cuando hablamos de un prompt de texto. Como sabéis, estos son la base para crear cualquier cosa mediante IA generativa. Un texto que describe lo que queremos crear, ya sea en una imagen, o también en un video, como nos permite hacer Sora de OpenAI o el nuevo Veo de Google. Lo que propone Whisk es un método totalmente diferente, y mucho más sencillo de generar la imagen soñada. Y es que, en lugar de texto, utilizamos otras imágenes para inventar una nueva.

El modo de funcionar de esta IA es realmente sencillo, y como reza la principal frase asociada a este proyecto, que dice algo así como menos Prompts y más jugar, todo se basa en imágenes que inspiran a otras imágenes. Esto quiere decir que en lugar de llegar a esa nueva imagen mediante un texto determinado que describa lo que estamos buscando, podemos sumar dos o tres imágenes para crear una totalmente nueva.

Lo que hará Whisk es sumar los elementos más personales de cada imagen, en una nueva. Si en una de las imágenes aparece una persona o animal, este se convertirá en la base de la nueva imagen, y el estilo de la resultante, será producto de la suma visual de las otras imágenes que hemos añadido. Por tanto, si añades una foto tuya, acompañada de un paisaje fantástico extraterrestre, y otra más con un mundo, por poner un ejemplo, creado con nubes de chocolate, el resultado de la nueva imagen será la mezcla de esos tres estilos, con nosotros como protagonistas.

Whisk en todos los casos extrae el aspecto clave de cada imagen, para plasmarlo en la nueva y crear así algo totalmente nuevo, pero basado en esos contenidos visuales que hemos aportado, y que pueden brindar una perspectiva diferente de la imagen. Lamentablemente, salvo que usemos una buena VPN, no vamos a poder utilizar todavía Whisk, ya que su uso está limitado a territorio estadounidense, por lo que a España de momento no va a llegar. Además, solo es una prueba, por lo que no se le puede dar carácter de herramienta definitiva por parte de Google.

Pero sin duda verla en acción es algo sorprendente, que nos demuestra que los prompts comienzan a ser algo del pasado, ya no se lleva escribir para generar nuevos contenidos.