Suscríbete a Merca2.0. Haz clic aquí

EMO, la IA de Alibaba que hace convierte una foto en video

EMO de Alibaba es una IA generativa que da vida a las fotos. Con solo una imagen, crea videos ultrarrealistas donde la persona habla o canta.
  • Se estima que la IA mejorará el PIB de la industria de energía, servicios públicos y minería en un 5,5 por ciento en términos de productividad.

  • El término inteligencia artificial se refiere a un modelo creado para resolver un problema específico o brindar un servicio en particular.

  • Para este 2023 se espera que haya un incremento en el valor del mercado de la IA de 165 mil millones de dólares.

La innovadora herramienta EMO, desarrollada por un equipo de investigadores de Alibaba Group, ha revolucionado la producción de vídeos a partir de imágenes y sonido.

En los últimos días, hemos sido testigos de un rápido avance en la IA, lo que ha resultado en nuevas formas de interacción entre las personas y los dispositivos, de acuerdo con Statista, el mercado de la IA tiene un tamaño considerable y se prevé que crezca más de 200 mil millones de dólares en 2023, superando el billón de dólares en 2028. Este crecimiento representa un aumento anual de aproximadamente el 40 por ciento, una cifra que difícilmente se puede igualar en otros mercados y que demuestra la influencia de la tecnología en industrias, mercados y empleo. La automatización ya es una realidad constante, pero se anticipa que la IA potenciará aún más la productividad al optimizar trabajos y automatizar tareas monótonas. A nivel global, se espera que el crecimiento con la IA sea casi un 25 por ciento mayor que el que se lograría solo con la automatización, sin la influencia de la IA.

EMO, la IA de Alibaba que hace convierte una foto en video

Mediante una técnica revolucionaria denominada Difusión de Audio a Video, EMO es capaz de generar animaciones realistas que capturan expresiones faciales y movimientos de manera sorprendentemente precisa, sin necesidad de utilizar modelos 3D o puntos de referencia faciales convencionales.

En el proceso de EMO, encontramos dos fases cruciales que es la difusión y la codificación de marcos. En la primera fase, se emplea una red neural conocida como ReferenceNet para extraer los rasgos distintivos de la imagen de referencia, así como los movimientos faciales. Por otro lado, en la etapa de codificación de marcos, un codificador de audio preentrenado procesa el sonido, generando así la base del vídeo mediante la combinación de máscaras faciales y ruido, el cual se ajusta posteriormente para capturar con precisión las sutilezas de los movimientos y hasta su estado de ánimo.

Cabe recalcar que una característica que destaca de EMO reside en su habilidad para trabajar con audio en múltiples idiomas, lo que posibilita que los personajes ofrezcan actuaciones en una amplia variedad de estilos lingüísticos y culturales. Esta versatilidad abre nuevas oportunidades para la creación de contenido digital globalizado, permitiendo que personajes icónicos, como la Audrey Hepborn, recite música de Queen.

Es así que este avance promete transformar la producción y el consumo de contenido audiovisual a nivel global.

Es muy probable que en el futuro surjan herramientas similares impulsadas por el crecimiento constante de la inteligencia artificial (IA). Con los avances en algoritmos de aprendizaje profundo y el procesamiento de datos cada vez más potente, además es probable que veamos nuevas herramientas que puedan generar contenido audiovisual a partir de datos mínimos, como una imagen de referencia y un archivo de audio. Estas herramientas podrían mejorar aún más en términos de realismo, personalización y capacidad para trabajar con una variedad de idiomas y estilos culturales. Además, podrían integrarse con otras tecnologías emergentes, como la realidad aumentada y la realidad virtual, para ofrecer experiencias aún más inmersivas y personalizadas.

 

 

 

 

Ahora lee:

La máquina expendedora de Lego para entretenerte en lo que esperas tu vuelo

Consumidor revela la fecha exacta para conseguir liquidaciones en Liverpool

Esto gana una “neni” en un día de ventas

Obtén un més gratis a Merca2.0 premium

Cancela en cualquier momento
Acceso exclusivo a rankings y radiografías.
Análisis profundos y casos de estudio de éxito.
Historial de la revista impresa en formato digital.

¡Disfruta de lo mejor del marketing sin costo alguno por un mes!

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

Populares

Únete a más de 150,000 lectores

Regístrate a nuestro newsletter en la siguiente forma y recibe a primera hora las noticias más importantes de mercadotecnia, publicidad y medios en tu correo.

Más de Merca2.0

Artículos relacionados

You don't have credit card details available. You will be redirected to update payment method page. Click OK to continue.