Durante los últimos días, Sora OpenAI ha causado un interés creciente por su capacidad de crear videos de alta calidad y realismo a partir de texto.
Pero, más allá de generar videos a partir de descripciones textuales o prompts, Sora de OpenAI también puede para transformar imágenes en video. También es capaz de extender la duración de un video.
Este avance representa un hito en el campo de la IA, ya que permite a los usuarios no solo idear contenido desde cero sino también reimaginar y expandir material ya existente. Las aplicaciones de esta tecnología varían desde la animación de imágenes estáticas hasta la extensión de clips de video, pasando por la creación de bucles perfectos, lo que abre un abanico de posibilidades para creativos y profesionales del sector.
Al respecto, el reporte técnico de OpenAI sobre Sora detalla lo siguiente:
1. Indicaciones con imágenes y videos
Todos los resultados anteriores y en nuestra página de inicio muestran ejemplos de conversión de texto a video. Pero a Sora también se le pueden solicitar otras entradas, como imágenes o vídeos preexistentes. Esta capacidad permite a Sora realizar una amplia gama de tareas de edición de imágenes y videos: crear videos en bucle perfecto, animar imágenes estáticas, extender videos hacia adelante o hacia atrás en el tiempo, etc.
2. Animar imágenes de DALL·E
Sora es capaz de generar videos siempre que una imagen y un mensaje como entrada. A continuación mostramos vídeos de ejemplo generados a partir de imágenes de DALL·E 231 y DALL·E 330.
Imagen de Dall-E y video de Sora @OpenAI pic.twitter.com/q56KXSQduS
— Laura Islas (La chica del SEO) (@ella_laquesefue) February 18, 2024
Imagen generada por DALL-E y animada como video con Sora pic.twitter.com/iMYFkNdytF
— Laura Islas (La chica del SEO) (@ella_laquesefue) February 18, 2024
3. Ampliar videos generados
Sora también es capaz de extender videos, ya sea hacia adelante o hacia atrás en el tiempo. A continuación se muestran cuatro videos que se extendieron hacia atrás en el tiempo a partir de un segmento de un video generado. Como resultado, cada uno de los cuatro videos comienza de manera diferente a los demás, pero los cuatro videos conducen al mismo final.
Sora también es capaz de extender videos, ya sea hacia adelante o hacia atrás en el tiempo pic.twitter.com/SrVxfQYzY8
— Laura Islas (La chica del SEO) (@ella_laquesefue) February 18, 2024
4. Combinación de videos
También podemos usar Sora para interpolar gradualmente entre dos videos de entrada, creando transiciones perfectas entre videos con temas y composiciones de escenas completamente diferentes. En los ejemplos siguientes, los vídeos del centro se interpolan entre los vídeos correspondientes de la izquierda y la derecha.
Sora sirve también para interpolar gradualmente entre dos videos de entrada pic.twitter.com/t0MEyFooyU
— Laura Islas (La chica del SEO) (@ella_laquesefue) February 18, 2024
5. Videos con consistencia en 3D
Sora puede generar videos con movimiento dinámico de la cámara. A medida que la cámara se desplaza y gira, las personas y los elementos de la escena se mueven consistentemente a través del espacio tridimensional.
[SOCIEDAD] OpenAI presentó "Sora", la inteligencia artificial que convierte texto en video: puede crear piezas de hasta 60 segundos de altísima calidad, con movimientos cinematográficos y múltiples personajes. ?pic.twitter.com/9g3NWZaQRY
— ElCanciller.com (@elcancillercom) February 16, 2024
Texto a video
Sora no es el primer modelo de inteligencia artificial que es capaz de generar video a partir de un texto. Sin embargo, hay factores que destacan su irrupción.
Su capacidad para interpretar instrucciones textuales y convertirlas en escenas complejas, completas con personajes emocionalmente expresivos y detalles ambientales precisos, es sin duda impresionante. Los usuarios pueden elegir entre estilos fotorrealistas o animados, lo que sugiere una amplia gama de aplicaciones, desde la creación de contenido educativo hasta la producción de entretenimiento.
Sin embargo, lo que hace que Sora sea particularmente inquietante es su habilidad para generar videos que son indistinguibles de la realidad.
Los videos compartidos por OpenAI generan escenas que nunca sucedieron, con personajes que nunca existieron. Nada de lo que ves aquí es real, pero lo parece.
LEE TAMBIÉN. Cómo acceder a Sora OpenAI para generar videos a partir de texto
Sora OpenAI y el dilema ético
El uso de un modelo de difusión para suavizar videos a partir de ruido estático hasta lograr una claridad impresionante es una hazaña técnica, pero también plantea preguntas sobre el potencial de abuso. Los deepfakes, videos manipulados para hacer parecer que alguien dice o hace algo que nunca ocurrió, ya son una preocupación significativa. Con tecnologías como Sora, el temor es que tales falsificaciones puedan volverse aún más convincentes y difíciles de detectar.
OpenAI es consciente de estas preocupaciones y ha señalado que Sora aún está en desarrollo, con acceso limitado a un pequeño grupo de investigadores y creativos para pruebas y retroalimentación.
La compañía ha reconocido que, aunque Sora supera a competidores como Midjourney y Stable Diffusion en la creación de videos más largos y fluidos, todavía hay áreas que requieren mejora, especialmente en comprensión de la causa y el efecto y la conciencia espacial.
Las expectativas en torno a Sora son muchas. Su capacidad para generar contenido educativo personalizado, recreaciones históricas detalladas o visualizaciones de futuros productos son solo algunas de las aplicaciones potenciales.
LEE TAMBIÉN.Coca Cola tendrá un nuevo sabor ¡y será picante!
⇒ SUSCRÍBETE A NUESTROS CONTENIDOS EN GOOGLE NEWS