-
El software de Samsung identifica regiones generales de un retrato, como ojos, boca, nariz y cejas
-
Tras el análisis, el programa superpone la imagen de referencia a un video previo de otra persona hablando
-
Así pues, en teoría, se podrían crear “video-entrevistas” o declaraciones que nunca ocurrieron
El potencial de la Inteligencia Artificial (IA) parece realmente ilimitado. A través de complejos sistemas de Machine Learning, los programas de computadora pueden aprender a jugar videojuegos, componer música y hasta monitorear contenidos tóxicos. Pero su habilidad de aprender patrones también les permite crear fotografías de personas, animales o casas que nunca han existido. Y Samsung ha llevado la tecnología a una nueva frontera: el video.
Investigadores de Samsung en Rusia recientemente publicaron un estudio sobre un nuevo sistema de software. Éste programa puede tomar un limitado número de fotografías, incluso una sola imagen, de alguna persona. Después de un análisis, la máquina puede generar un video que simula una conversación natural, incluido movimientos de rostro, boca y ojos. Si bien el resultado todavía no es perfecto, es un notable avance de anteriores sistemas.
La investigación demuestra que la tecnología para crear “deepfakes” es más efectiva. Otros proyectos requerían una buena cantidad de fotografías para crear un video convincente. Así, el riesgo se limitaba principalmente a figuras públicas, como actores, políticos e influencers. Sin embargo, el software de Samsung puede utilizar una sola imagen para sus videos. Por supuesto, entre más material de referencia haya disponible, mejor será el producto final.
Potencial y riesgos del proyecto de Samsung
Ya se ha puesto en perspectiva el problema de software como el de Samsung. En 2018, la actriz Scarlett Johansson habló al respecto con el Washington Post. Apuntó, a pesar, que no podía evitar que su rostro siguiera colocándose en material pornográfico en línea. Asimismo, el cofundador de Reddit, Alexis Ohanian, advirtió de su impacto en la desinformación. Y hace unos días, la startup Dessa incluso pudo replicar la voz de un famoso comentarista deportivo.
Ciertamente hay dos formas de analizar el problema. Hay agentes que apuntan que tecnología como la de Samsung puede servir para desencadenar una revolución creativa. Conforme las máquinas se vuelven más efectivas para crear contenido, queda en manos de los humanos diseñar estrategias más innovadoras y que generen empatía. Y como demostró el (fallido) experimento de Calvin Klein, hay nuevas fronteras listas para atravesarse y romperse.
A la vez, el potencial de abuso de la tecnología es enorme. Samsung logró replicar, casi naturalmente, el habla y movimiento de personas y hasta obras de arte. Si ya hay celebridades que deben enfrentarse a los riesgos de los deepfake, esta tecnología abre la oportunidad a que cualquier persona sea un objetivo. Con algunos años de desarrollo, una simple fotografía de perfil podría ser suficiente para crear videos convincentes de casi cualquier persona.
No hay una solución sencilla al problema. Así como Samsung desarrolló la tecnología, cualquier otro equipo de expertos puede hacerlo con suficiente tiempo. De esta forma, no es cuestión de limitar la comercialización del sistema. Con el tiempo, también sería casi imposible desarrollar software que pueda detectar entre video real y ficticio. La autorregulación parece el camino más efectivo. Sin embargo, con el precedente actual, la perspectiva es aterradora.