Durante las últimas horas, Sora de OpenAI se ha convertido en parte de la conversación en redes sociales.
Este nuevo modelo de Inteligencia Artificial promete revolucionar la manera en que concebimos los videos, ofreciendo la capacidad de generar contenido audiovisual a partir de simples descripciones textuales. Sin embargo, la sofisticación de Sora ha generado tanto admiración como preocupación, abriendo el debate sobre las implicaciones éticas de su uso.
¿Qué es Sora OpenAI y qué hace?
Sora, descrito por OpenAI como un modelo de lenguaje multimodal, puede crear videos realistas que duran hasta 60 segundos.
¿Cómo hacer videos con Sora?
De acuerdo a lo revelado por OpenAI, Sora funciona de una manera muy similar a ChatGPT y DALL-E.
Es decir, bastará un prompt descriptivo para tener resultados. Por ejemplo, el prompt “Un gato despierta a su dueño dormido exigiéndole el desayuno. El dueño intenta ignorar al gato, pero el gato intenta nuevas tácticas y finalmente el dueño saca un alijo secreto de golosinas de debajo de la almohada para mantener alejado al gato un poco más”, genera el siguiente video.
this could be the "holy shit" moment of AI. OpenAI has just announced Sora, its text-to-video AI model. This video isn't real, it's based on a prompt of "a cat waking up its sleeping owner demanding breakfast…" ? https://t.co/xKy3iQBKwT pic.twitter.com/HPm2p1jbgo
— Tom Warren (@tomwarren) February 15, 2024
Otro ejemplo de los videos que pueden generarse con Sora. El prompt: “Primer plano del ojo de una mujer de 24 años parpadeando, de pie en Marrakech durante la hora mágica, película cinematográfica filmada en 70 mm, profundidad de campo, colores vivos, cinemática”.
Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic #Sora #OpenAI pic.twitter.com/gt4VM7aMAN
— Sora (@ForInitial) February 16, 2024
Un tercer ejemplo de lo que se puede hacer con un prompt descriptivo en Sora. “La ciudad de Nueva York se sumergió como la Atlántida. Peces, ballenas, tortugas marinas y tiburones nadan por las calles de Nueva York”.
Some of the best AI-generated OpenAI Sora text to video AI model videos I have seen so far (25). #OpenAI #Sora #SoraAI pic.twitter.com/whQPc9aMHI
— Techverse (@intechverse) February 16, 2024
Texto a video
Sora no es el primer modelo de inteligencia artificial que es capaz de generar video a partir de un texto. Sin embargo, hay factores que destacan su irrupción.
Su capacidad para interpretar instrucciones textuales y convertirlas en escenas complejas, completas con personajes emocionalmente expresivos y detalles ambientales precisos, es sin duda impresionante. Los usuarios pueden elegir entre estilos fotorrealistas o animados, lo que sugiere una amplia gama de aplicaciones, desde la creación de contenido educativo hasta la producción de entretenimiento.
Sin embargo, lo que hace que Sora sea particularmente inquietante es su habilidad para generar videos que son indistinguibles de la realidad.
Los videos compartidos por OpenAI generan escenas que nunca sucedieron, con personajes que nunca existieron. Nada de lo que ves aquí es real, pero lo parece.
Sora OpenAI y el dilema ético
El uso de un modelo de difusión para suavizar videos a partir de ruido estático hasta lograr una claridad impresionante es una hazaña técnica, pero también plantea preguntas sobre el potencial de abuso. Los deepfakes, videos manipulados para hacer parecer que alguien dice o hace algo que nunca ocurrió, ya son una preocupación significativa. Con tecnologías como Sora, el temor es que tales falsificaciones puedan volverse aún más convincentes y difíciles de detectar.
OpenAI es consciente de estas preocupaciones y ha señalado que Sora aún está en desarrollo, con acceso limitado a un pequeño grupo de investigadores y creativos para pruebas y retroalimentación.
La compañía ha reconocido que, aunque Sora supera a competidores como Midjourney y Stable Diffusion en la creación de videos más largos y fluidos, todavía hay áreas que requieren mejora, especialmente en comprensión de la causa y el efecto y la conciencia espacial.
Las expectativas en torno a Sora son muchas. Su capacidad para generar contenido educativo personalizado, recreaciones históricas detalladas o visualizaciones de futuros productos son solo algunas de las aplicaciones potenciales.
LEE TAMBIÉN. Cómo acceder a Sora OpenAI para generar videos a partir de texto
OpenAi's Sora can do a lot more than just generate text to video. This example shows an objectively beautiful morph between one subject into another. The VFX implications here are staggering pic.twitter.com/uSKlprJZCi
— Paul Trillo (@paultrillo) February 16, 2024