OpenAI, la compañía de investigación detrás de ChatGPT y DALL-E, presentó Sora, un nuevo modelo de inteligencia artificial que convierte texto en video.
Sora OpenAI se une a la familia de herramientas creativas de esta empresa, abriendo nuevas posibilidades para la creación de contenido multimedia.
¿Qué es Sora OpenAI?
Sora es un modelo de lenguaje multimodal que puede generar videos realistas a partir de descripciones textuales. Los usuarios simplemente necesitan escribir una descripción de la escena que desean ver, y Sora se encarga de darle vida. El modelo puede crear videos de hasta 60 segundos, con una calidad comparable a la de un video producido por un equipo profesional.
Este modelo representa la primera incursión de OpenAI en la generación de videos mediante inteligencia artificial, ampliando su repertorio de herramientas tecnológicas que incluyen el generador de texto ChatGPT y el generador de imágenes DALL-E.
Este avanzado modelo no solo genera imágenes; va más allá al calcular la física de los objetos dentro de su entorno y renderizar un video basado en estos cálculos detallados.
¿Cuándo estará disponible Sora?
Sora aún se encuentra en fase de desarrollo y no está disponible públicamente. OpenAI ha comenzado a ofrecer acceso a un pequeño grupo de investigadores y creativos para que prueben la herramienta y brinden comentarios. Se espera que Sora se lance al público en general en una fecha aún por determinar.
¿Cómo funciona?
Utiliza un modelo de difusión para generar videos. Esto implica que comienza con un video que parece estar lleno de ruido estático y lo suaviza gradualmente hasta obtener una versión pulida y coherente.
Los usuarios pueden indicar a Sora que genere videos escribiendo simplemente unas pocas oraciones, eligiendo entre un estilo fotorrealista o animado, y obteniendo resultados sorprendentes en cuestión de minutos.
Este modelo destaca sobre competidores como Midjourney y Stable Diffusion por su capacidad para crear videos más largos, dinámicos y fluidos. A diferencia de los modelos de la competencia, que pueden parecer una secuencia de imágenes de IA en stop-motion, Sora logra producir videos que se sienten completamente reales y cohesivos.
Sin embargo, OpenAI ha reconocido que Sora todavía tiene áreas que requieren mejora, incluida su comprensión de la causa y el efecto, así como la conciencia espacial. Estos desafíos, junto con las preocupaciones de seguridad relacionadas con el potencial para crear deepfakes engañosos, son aspectos críticos en los que OpenAI aún trabaja.
Videos generados por Sora OpenAI
En redes sociales se han viralizado algunos videos generados con Sora, los cuales muestran una muy alta calidad.
Sam Altman, CEO de OpenAI, compartió algunos de los videos generados con su nuevo modelo.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX
— Sam Altman (@sama) February 15, 2024
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
https://t.co/P26vJHlw06 pic.twitter.com/AW9TfYBu3b
— Sam Altman (@sama) February 15, 2024
https://t.co/SOUoXiSMBY pic.twitter.com/JB4zOjmbTp
— Sam Altman (@sama) February 15, 2024