¿La Inteligencia Artificial (IA) es singular? ¿Qué tan original o diferente puede ser el resultado si utilizas el mismo prompt en diferentes modelos? Pensemos, por ejemplo en Sora OpenAI y Midjourney.
Recientemente, OpenAI presentó su modelo de inteligencia artificial Sora, a partir del cual será posible generar videos de alta calidad, a partir de texto.
Sora representa la primera incursión de OpenAI en la generación de videos mediante IA, ampliando su repertorio de herramientas tecnológicas que incluyen el generador de texto ChatGPT y el generador de imágenes DALL-E.
Los resultados de Sora han causado admiración por parte de los usuarios y especialistas en IA. Al respecto, Nick St. Pierre, director creativo, hizo el ejercicio de replicar los prompts de Sora OpenAI en Midjourney, y el resultado fueron varias imágenes muy similares.
I ran all of the Sora prompts through Midjourney
Interesting how similar some are
side-by-sides against vids:
— Nick St. Pierre (@nickfloats) February 16, 2024
An extreme close-up of an gray-haired man with a beard in his 60s, he is deep in thought pondering the history of the universe as he sits at a cafe in Paris, his eyes focus on people offscreen as they walk as he sits mostly motionless, he is dressed in a wool coat suit coat… pic.twitter.com/sUOLsmz0xy
— Nick St. Pierre (@nickfloats) February 16, 2024
An adorable happy otter confidently stands on a surfboard wearing a yellow lifejacket, riding along turquoise tropical waters near lush tropical islands, 3D digital render art style. –ar 16:9 –style raw pic.twitter.com/rdDB4fnxt9
— Nick St. Pierre (@nickfloats) February 16, 2024
Historical footage of California during the gold rush. –ar 16:9 –style raw pic.twitter.com/dVcprOyFOU
— Nick St. Pierre (@nickfloats) February 16, 2024
A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors. –ar 16:9 –style raw pic.twitter.com/mcoU8JQohZ
— Nick St. Pierre (@nickfloats) February 16, 2024
Archeologists discover a generic plastic chair in the desert, excavating and dusting it with great care. –ar 16:9 –style raw pic.twitter.com/mvX7vjbkfC
— Nick St. Pierre (@nickfloats) February 16, 2024
A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle puff, the… pic.twitter.com/MBxlJdTRCG
— Nick St. Pierre (@nickfloats) February 16, 2024
The camera rotates around a large stack of vintage televisions all showing different programs — 1950s sci-fi movies, horror movies, news, static, a 1970s sitcom, etc, set inside a large New York museum gallery. –ar 16:9 –style raw pic.twitter.com/OoJkzDwYdo
— Nick St. Pierre (@nickfloats) February 16, 2024
Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes. –ar 16:9 –style raw pic.twitter.com/50OH1BaLIG
— Nick St. Pierre (@nickfloats) February 16, 2024
A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in. –ar 16:9 –style raw pic.twitter.com/bNLRBxWwM8
— Nick St. Pierre (@nickfloats) February 16, 2024
¿Qué es Midjourney?
Midjourney es una herramienta de inteligencia artificial que ha revolucionado el mundo de la creación visual. Permite a los usuarios generar imágenes realistas a partir de descripciones textuales, abriendo un nuevo mundo de posibilidades para artistas, diseñadores y cualquier persona que quiera dar rienda suelta a su creatividad.
Con Midjourney se pueden crear todo tipo de imágenes, desde paisajes realistas hasta personajes fantásticos. La única limitación es la imaginación del usuario.
¿Quién creó Midjourney?
Midjourney es el producto de la mente de David Holz, un emprendedor e inventor con una larga trayectoria en el mundo de la tecnología. Holz es conocido por su trabajo en la creación de Leap Motion, un dispositivo de control por gestos que fue adquirido por Google en 2019.
¿Qué es Sora OpenAI?
Sora es un modelo de lenguaje multimodal que puede generar videos realistas a partir de descripciones textuales.
Los usuarios simplemente necesitan escribir una descripción de la escena que desean ver, y Sora se encarga de darle vida. El modelo puede crear videos de hasta 60 segundos, con una calidad comparable a la de un video producido por un equipo profesional.
¿Cómo hacer videos con Sora?
De acuerdo a lo revelado por OpenAI, Sora funciona de una manera muy similar a ChatGPT y DALL-E. Es decir, bastará un prompt descriptivo para tener resultados.
Texto a video
Sora no es el primer modelo de inteligencia artificial que es capaz de generar video a partir de un texto. Sin embargo, hay factores que destacan su irrupción.
Su capacidad para interpretar instrucciones textuales y convertirlas en escenas complejas, completas con personajes emocionalmente expresivos y detalles ambientales precisos, es sin duda impresionante. Los usuarios pueden elegir entre estilos fotorrealistas o animados, lo que sugiere una amplia gama de aplicaciones, desde la creación de contenido educativo hasta la producción de entretenimiento.
Sin embargo, lo que hace que Sora sea particularmente inquietante es su habilidad para generar videos que son indistinguibles de la realidad.
Los videos compartidos por OpenAI generan escenas que nunca sucedieron, con personajes que nunca existieron. Nada de lo que ves aquí es real, pero lo parece.
LEE TAMBIÉN. Sora OpenAI. Otras 5 cosas que podrás hacer con esta inteligencia artificial
Sora OpenAI y el dilema ético
El uso de un modelo de difusión para suavizar videos a partir de ruido estático hasta lograr una claridad impresionante es una hazaña técnica, pero también plantea preguntas sobre el potencial de abuso. Los deepfakes, videos manipulados para hacer parecer que alguien dice o hace algo que nunca ocurrió, ya son una preocupación significativa. Con tecnologías como Sora, el temor es que tales falsificaciones puedan volverse aún más convincentes y difíciles de detectar.
OpenAI es consciente de estas preocupaciones y ha señalado que Sora aún está en desarrollo, con acceso limitado a un pequeño grupo de investigadores y creativos para pruebas y retroalimentación.
La compañía ha reconocido que, aunque Sora supera a competidores como Midjourney y Stable Diffusion en la creación de videos más largos y fluidos, todavía hay áreas que requieren mejora, especialmente en comprensión de la causa y el efecto y la conciencia espacial.
Las expectativas en torno a Sora son muchas. Su capacidad para generar contenido educativo personalizado, recreaciones históricas detalladas o visualizaciones de futuros productos son solo algunas de las aplicaciones potenciales.