-
Una investigaciĆ³n de The New York Times asegura que OpenAI ha utilizado mĆ”s de un millĆ³n de horas de video paraĀ entrenar a su IA.
-
YouTube asegurĆ³ que no quiere que OpenAI use sus vĆdeos para entrenar a Sora
-
OpenAIĀ no ha clarificado completamente los mĆ©todos utilizados para entrenar su nueva inteligencia artificial.
Recientemente, el director ejecutivo de YouTube, Neal Mohan, ha manifestado que, en caso de que los videos de creadores de contenido publicados en su plataforma hayan sido utilizados por OpenAI para entrenar su modelo de Inteligencia Artificial (IA) Sora, la compaƱĆa estarĆa llevando a cabo una āclara violaciĆ³nā de las polĆticas de YouTube.
Precisamente, Mohan ha explicado que se trata de un uso indebido del contenido de la plataforma ya que los creadores de contenido que deciden publicar videos en YouTube esperan que su trabajo estĆ© realmente protegido por los tĆ©rminos del servicio. āCuando un creador sube su arduo trabajo a nuestra plataforma, tiene ciertas expectativasā, seƱalĆ³ el lĆder, al tiempo que ha especificado que una de estas expectativas es que no se permita la descarga de su contenido, como transcripciones o fragmentos de video.Hay que tener en cuenta que esta advertencia surge en un contexto donde OpenAIĀ no ha clarificado completamente los mĆ©todos utilizados para entrenar su nueva inteligencia artificial. Mohan seƱalĆ³ que, si bien ciertos datos como el nombre del canal o el tĆtulo del video pueden ser rastreados para aparecer en motores de bĆŗsqueda, los tĆ©rminos de uso de YouTube prohĆben la descarga de videos y transcripciones.
Aumenta tensiĆ³n entre OpenAI y Youtube
Un estudio de The New York Times afirma que OpenAI ha empleado mĆ”s de un millĆ³n de horas de video para el entrenamiento de Whisper, su inteligencia artificial encargada de convertir audio en texto. Esta iniciativa tiene como objetivo aprovechar las transcripciones generadas para contribuir al desarrollo de GPT-4.
SegĆŗn lo afirmĆ³ el medio, el laboratorio de inteligencia artificial habĆa agotado todos los recursos de textos confiables en inglĆ©s disponibles en Internet durante el desarrollo de su Ćŗltima generaciĆ³n de sistemas de IA, requerĆan de mĆ”s datos para entrenar la prĆ³xima iteraciĆ³n de su tecnologĆa.
Por ello, los investigadores de OpenAI idearon una herramienta de reconocimiento de voz llamada Whisper. Esta herramienta serĆa capaz de transcribir el audio de videos de YouTube, generando nuevo texto conversacional que potenciarĆa la inteligencia de los sistemas de IA.
Algunos empleados de OpenAI debatieron sobre cĆ³mo esta medida podrĆa violar las reglas de YouTube, segĆŗn tres personas familiarizadas con las conversaciones.Ā Y es que YouTube, propiedad de Google, prohĆbe el uso de sus videos para aplicaciones “independientes” de la plataforma.
Es asĆ que un equipo de OpenAI transcribiĆ³ mĆ”s de un millĆ³n de horas de videos de YouTube, afirmaron las fuentes. Este equipo incluĆa a Greg Brockman, presidente de OpenAI, quien participĆ³ personalmente en la recopilaciĆ³n de los videos. Posteriormente, los textos se integraron en un sistema llamado GPT-4, que fue ampliamente reconocido como uno de los modelos de IA mĆ”s poderosos del mundo y sirviĆ³ de base para la Ćŗltima versiĆ³n del chatbot ChatGPT.