Medios comienzan a prohíbir usar su contenido para entrenar modelos de IA

Contenido

The New York Times da el primer paso buscando evitar que su contenido sea empleado en el entrenamiento de modelos de inteligencia artificial.

The New York Times es el primero de los grandes medios que busca resguardar su contenido de la inteligencia artificial (IA).
Es la primera respuesta de un medio grande a la tendencia de recolección de datos por parte de bots de entrenamiento de modelos de generación de texto generativo.
Cambiaron los términos y habla de que sus textos no pueden ser empleados sin el permiso por escrito de la publicación.

En lo que podría considerarse como un movimiento preventivo ante la avanzada de las nuevas tecnologías, The New York Times busca evitar que su contenido sea empleado en el entrenamiento de modelos de inteligencia artificial (IA).

De acuerdo con lo informado por Adweek este lunes 14 de agosto, el 3 de agosto pasado el NYT actualizó sus “Términos de servicio” para prohibir que su material, incluyendo texto, imágenes, clips de audio/video, metadatos y compilaciones sean utilizados en el desarrollo de “cualquier programa de software, incluyendo pero no limitado al entrenamiento de sistemas de aprendizaje automático o inteligencia artificial (IA)”.

Estas actualizaciones ahora también detallan que herramientas automatizadas, como rastreadores de sitios web diseñados para acceder o recolectar dicho contenido, no pueden ser empleadas sin el permiso por escrito de la publicación.

No cumplir con estas restricciones podría acarrear multas o sanciones, aunque estas no han sido detalladas.

A pesar de estas nuevas disposiciones, el archivo robots.txt del NYT, que instruye a los motores de búsqueda qué URLs pueden acceder y cuáles no, aparentemente no fueron alteradas, dice The Verge.

The New York Times busca resguardar su contenido de la inteligencia artificial (IA).

Los medios, el contenido y la IA

Esta medida podría ser una respuesta a la reciente actualización de la política de privacidad de Google, que dejó en evidencia su nueva capacidad para recolectar datos públicos de la web con fines de entrenar sus diversas soluciones de IA, como Bard o Cloud AI.

Muchos de los modelos de lenguaje que impulsan populares servicios de IA, como ChatGPT de OpenAI, se entrenan con grandes conjuntos de datos que podrían contener material protegido por derechos de autor extraído de la web (sin permiso, obviamente).

A pesar de esto, en febrero, el NYT firmó un acuerdo de 100 millones de dólares con Google, permitiendo que este presente contenido del Times en sus plataformas durante los próximos tres años.

Ambas compañías colaborarán en la distribución de contenido, suscripciones, publicidad y experimentación, lo que sugiere que estos cambios en los términos de servicio podrían apuntar a otras empresas como OpenAI o Microsoft.

OpenAI anunció la semana anterior que los operadores de sitios web pueden bloquear su rastreador web GPTBot para evitar el raspado de sus páginas.

Microsoft también ha añadido nuevas restricciones a sus propios términos y condiciones, prohibiendo el uso de sus productos de IA para mejorar otros servicios de IA, y prohibiendo el raspado de datos de sus herramientas de IA.

A principios de agosto, varias organizaciones de noticias, incluyendo The Associated Press y el Consejo Europeo de Editores, emitieron una carta abierta pidiendo a legisladores en todo el mundo que establezcan reglas que exijan transparencia en los conjuntos de datos de entrenamiento y el consentimiento de los titulares de derechos antes de emplear esos datos en capacitación.

Ahora lee:

Wendy Guevara gana, pero ¿Para qué usara el dinero?

Wendy Guevara se corona como ganadora de La Casa de los Famosos México

Obtén un més gratis a Merca2.0 premium

Cancela en cualquier momento
Acceso exclusivo a rankings y radiografías.
Análisis profundos y casos de estudio de éxito.
Historial de la revista impresa en formato digital.

¡Disfruta de lo mejor del marketing sin costo alguno por un mes!

Pablo Petovel

Pablo Petovel es periodista y redactor publicitario. Estudió en la Universidad Nacional de Córdoba (Argentina). Lleva ejerciendo el periodismo durante más de 20 años, tanto en medios nacionales como internacionales. Se especializa en economía, finanzas públicas, marketing, publicidad, negocios y empleo. BLUESKY: @nabuko.bsky.social

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

PREMIUM

¿Cómo el Big Data está transformando las fintech?

25-04-2025

PREMIUM

¿Cómo Digital PR transforma tu estrategia SEO?

24-04-2025

PREMIUM

Ad Tech: El motor de cambio en la industria publicitaria

24-04-2025

Populares

¿Qué significa la licencia bancaria de Nu México?

Al estilo de Stanley, Coca-Cola lanza vaso térmico; pero todos recuerdan el Pepsilindro

Marca peruana le gana a Coca-Cola y obtiene registro oficial

Únete a más de 150,000 lectores

Regístrate a nuestro newsletter en la siguiente forma y recibe a primera hora las noticias más importantes de mercadotecnia, publicidad y medios en tu correo.

Medios comienzan a prohíbir usar su contenido para entrenar modelos de IA

Los medios, el contenido y la IA

Obtén un més gratis a Merca2.0 premium

Pablo Petovel

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

¿Cómo el Big Data está transformando las fintech?

¿Cómo Digital PR transforma tu estrategia SEO?

Ad Tech: El motor de cambio en la industria publicitaria

Populares

¿Qué significa la licencia bancaria de Nu México?

Marca peruana le gana a Coca-Cola y obtiene registro oficial

Únete a más de 150,000 lectores

Artículos relacionados

¿Qué significa la licencia bancaria de Nu México?

Marca peruana le gana a Coca-Cola y obtiene registro oficial

Nintendo Switch 2 en PREVENTA durante la Venta Especial Liverpool 2025 y tiene promoción especial

Presidente de Farmacias Similares reconoce al Dr.Simi viral

Únete a la comunidad de mercadólogos más grande del mundo.

Otros de nuestros sitios:

Servicios

Mercadotecnia