La tecnológica Microsoft dio un pasó más adelante en la carrera de la inteligencia artificial (IA) y recientemente presentó un nuevo sistema llamado VASA-1, capaz de generar avatares hiperrealistas a partir de imágenes estáticas y fragmentos de voz.

El modelo incorpora herramientas de IA como StyleGAN2 y DALL·E-3 para darle vida a una imagen y hacer que la persona que se muestra en la foto gesticule en sincronización con el audio, a la vez que realiza diferentes expresiones faciales y movimientos de cabeza naturales.  

Microsoft: qué es VASA-1 y para qué sirve

Microsoft just introduced VASA-1.

It’s a new AI model that can turn 1 photo and 1 piece of audio into a fully lifelike human deepfake.

Wild to drop this right before the election %uD83D%uDE2Cpic.twitter.com/MuLkZVOKRM

— Rowan Cheung (@rowancheung) April 18, 2024

La tecnología detrás de VASA-1 se basa en una red neuronal profunda que fue entrenada con un conjunto de datos de imágenes y videos de personas. Esto permite al modelo de inteligencia artificial aprender las complejas relaciones entre el habla, las expresiones faciales y los movimientos de la cabeza, para así generar videos que son indistinguibles de lo real.

La creación de estos videos no se limita a imágenes de personas reales. También se pueden utilizar otros tipos de contenido, como imágenes animadas, pinturas o diseños generados por IA.

Los usuarios en las redes sociales no tardaron en reaccionar a los resultados hiperrealistas, que además de sorprender también causaron preocupación respecto a los potenciales usos de estos modelos para desinformar, suplantar identidades o generar deepfakes. 

Basado en El Cronista

Exit mobile version