Investigación revela que Apple y NVIDIA entrenan su IA con videos de YouTube

Internacional, Marcas, Mercadotecnia

Una investigación ha revelado que tanto Apple como NVIDIA utilizan videos de YouTube para entrenar sus sistemas de inteligencia artificial (IA).

Los videos usados incluían contenido de youtubers famosos como MrBeast, PewDiePie y MKBHD.
Las empresas de IA requieren grandes cantidades de texto de alta calidad para construir modelos que imiten el habla y la escritura humana.
Apple, NVIDIA, Anthropic y Salesforce usan videos de YouTube para entrenar sus sistemas de inteligencia artificial.

Se ha dado a conocer en una reciente investigación la noticia de que empresas influyentes en el mercado como lo es Apple o NVIDIA hicieron uso de los videos de YouTube como parte fundamental del entrenamiento de sus sistemas de inteligencia artificial (IA).

En ese sentido, las empresas tecnológicas que desarrollan inteligencia artificial (IA) enfrentan un desafío crucial: la necesidad de grandes cantidades de texto de alta calidad para entrenar modelos que puedan imitar el habla y la escritura humana con precisión. Este requisito es fundamental para el avance de la esta herramienta, ya que la calidad y cantidad de los datos de entrenamiento determinan la eficacia y precisión de los modelos desarrollados.

Y es que un desafío significativo es la obtención de estos datos sin infringir derechos de autor. A menudo, el contenido utilizado proviene de fuentes accesibles públicamente, pero no siempre con el consentimiento explícito de los creadores originales. Esto ha generado controversias sobre la ética y legalidad del uso de dichos datos.

Investigación revela que Apple y NVIDIA entrenan su IA con videos de YouTube

Una investigación reciente ha revelado que tanto Apple como NVIDIA están utilizando videos de YouTube para entrenar sus sistemas de inteligencia artificial (IA). La investigación de ProofNews encontró que estas compañías, junto con Anthropic y Salesforce, han empleado contenido no autorizado para este fin.

Las empresas han entrenado sus modelos de lenguaje utilizando subtítulos de videos de youtubers famosos como MrBeast, PewDiePie y MKBHD. De hecho, se apoyaron en un conjunto de datos que incluye subtítulos de 173,536 videos provenientes de más de 48,000 canales de YouTube. Esta práctica resalta la dependencia de estas empresas en grandes volúmenes de datos de alta calidad para mejorar la capacidad de sus modelos de IA de imitar el habla y la escritura humana.

La investigación realizada por Proof News determinó que, el proceso de identificar la fuente exacta de los videos en el conjunto de datos fue complejo, en donde usaron identificaciones de video del conjunto de datos, además de consultar herramientas de acceso público de YouTube para obtener metadatos detallados como títulos, canales y categorías. Si bien las empresas como Anthropic y Salesforce han confirmado el uso de conjuntos de datos de entrenamiento como Pile, que incluye subtítulos de videos de YouTube, niegan haber actuado de manera irregular. En contraste, representantes de Nvidia optaron por no hacer comentarios, mientras que Apple, Databricks y Bloomberg tampoco respondieron a las solicitudes de comentarios.

Apple has sourced data for their AI from several companies

One of them scraped tons of data/transcripts from YouTube videos, including mine

Apple technically avoids “fault” here because they’re not the ones scraping

But this is going to be an evolving problem for a long time https://t.co/U93riaeSlY

— Marques Brownlee (@MKBHD) July 16, 2024

Este descubrimiento resalta la creciente dependencia de la industria de la IA en grandes cantidades de datos de alta calidad para entrenar modelos que imiten el lenguaje humano. A menudo, estos datos provienen de una variedad de fuentes, incluidos libros, blogs, y, en este caso, contenido de plataformas de video populares como YouTube, a menudo sin el conocimiento explícito de los creadores originales.

Y es que recientemente YouTube declaró que no quiere que OpenAI use sus vídeos para entrenar a su modelo de inteligencia artificial Sora.

AHORA LEE:

Plataformas digitales promueven acceso a seguridad social para repartidores

Encontró en el Sam’s las pantuflas más lindas de Hello Kitty

CeraVe sorprende con interesante telenovela para promocionar sus productos

Obtén un més gratis a Merca2.0 premium

Cancela en cualquier momento
Acceso exclusivo a rankings y radiografías.
Análisis profundos y casos de estudio de éxito.
Historial de la revista impresa en formato digital.

¡Disfruta de lo mejor del marketing sin costo alguno por un mes!

Jennifer Sánchez Dimas

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

PREMIUM

¿Cómo serán los presupuestos de marketing en 2025?

25-12-2024

PREMIUM

La importancia de los programas de loyalty este 2025

25-12-2024

PREMIUM

Nuevas tendencias de marketing deportivo

25-12-2024

Populares

PERSONAJES DE SANRIO HELLO KITTY KUROMI 2024 CHARACTERS

How many characters does Sanrio have? This is the list of Hello Kitty and Kuromi’s friends

US government sues Walmart for $10 million

Únete a más de 150,000 lectores

Regístrate a nuestro newsletter en la siguiente forma y recibe a primera hora las noticias más importantes de mercadotecnia, publicidad y medios en tu correo.

Investigación revela que Apple y NVIDIA entrenan su IA con videos de YouTube

Los videos usados incluían contenido de youtubers famosos como MrBeast, PewDiePie y MKBHD.

Las empresas de IA requieren grandes cantidades de texto de alta calidad para construir modelos que imiten el habla y la escritura humana.

Apple, NVIDIA, Anthropic y Salesforce usan videos de YouTube para entrenar sus sistemas de inteligencia artificial.

Investigación revela que Apple y NVIDIA entrenan su IA con videos de YouTube

AHORA LEE:

Plataformas digitales promueven acceso a seguridad social para repartidores

Encontró en el Sam’s las pantuflas más lindas de Hello Kitty

CeraVe sorprende con interesante telenovela para promocionar sus productos

Obtén un més gratis a Merca2.0 premium

Jennifer Sánchez Dimas

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

¿Cómo serán los presupuestos de marketing en 2025?

La importancia de los programas de loyalty este 2025

Nuevas tendencias de marketing deportivo

Populares

How many characters does Sanrio have? This is the list of Hello Kitty and Kuromi’s friends

US government sues Walmart for $10 million

Únete a más de 150,000 lectores

Artículos relacionados

Por estrés, un repartidor de Amazon abandona 80 paquetes en el bosque

Viralizan juguete de Hello kitty que desea Feliz Cumpleaños

¿Cuándo es la preventa de la Gran Barata Liverpool 2024? Aquí te lo contamos

¿Cómo serán los presupuestos de marketing en 2025?

Únete a la comunidad de mercadólogos más grande del mundo.

Otros de nuestros sitios:

Servicios

Mercadotecnia