-
Las IA necesitan grandes volúmenes de datos reales para aprender lenguaje, patrones de comportamiento y matices culturales.
-
Se estima que más del 60% de los datasets usados en IA generativa provienen de contenidos en línea, incluyendo redes sociales, según MIT Technology Review.
-
El objetivo es crear asistentes virtuales más precisos y competitivos frente a rivales como OpenAI o Google.

La ambición de Meta por dominar el terreno de la inteligencia artificial ha dado un nuevo paso en Europa. Desde esta semana, la compañía comenzará a utilizar el contenido público compartido por usuarios adultos en Facebook, Instagram y WhatsApp, es decir el conglomerado de Meta, como materia prima para alimentar sus modelos de IA. Esto incluye desde publicaciones y comentarios hasta nombres y fotografías.
La medida, que había sido aplazada por preocupaciones sobre privacidad, ahora entra en vigor tras la luz verde de la Junta Europea de Protección de Datos. Con esto, Meta se suma oficialmente a la carrera global por desarrollar asistentes más potentes, capaces de interpretar no solo idiomas, sino también los matices culturales y las formas particulares de interacción digital en Europa.
A diferencia de otras regiones, donde este tipo de recolección ya era una realidad, en la Unión Europea la decisión marca un cambio profundo en el tratamiento de la información personal. Aunque la empresa asegura que se utilizarán solo contenidos públicos y de mayores de edad, la escala y el tipo de datos implicados abren nuevas discusiones sobre los límites del consentimiento y la explotación de datos digitales.
El argumento de Meta es claro: sin grandes volúmenes de información, su IA no puede avanzar. Sin embargo, para los usuarios, esta situación plantea una disyuntiva: participar pasivamente en el entrenamiento de una tecnología que no han solicitado, o bien tomar medidas para limitar su exposición.
Los mensajes ya han comenzado a llegar a los correos electrónicos de los usuarios, notificando esta nueva política. Afortunadamente, aún es posible ejercer el derecho a oponerse. El proceso representa una herramienta valiosa para quienes deseen mantener cierto control sobre cómo se usa su huella digital.
Y es que, en el desarrollo de modelos de inteligencia artificial generativa, como los asistentes virtuales, los chatbots o los sistemas de recomendación, los datos se han convertido en el nuevo oro. Entrenar una IA requiere millones, incluso miles de millones de ejemplos reales que permitan al sistema identificar patrones, aprender el lenguaje y anticipar comportamientos. Y ahí es donde entra el contenido generado por usuarios.
Las publicaciones en redes sociales, los comentarios, las imágenes compartidas e incluso las reacciones y hábitos de navegación son algunos de los datos que las grandes tecnológicas aprovechan para alimentar sus modelos. Según un estudio del MIT Technology Review, más del 60% de los datasets utilizados por sistemas de IA generativa incluyen información extraída de internet, gran parte de la cual proviene de redes sociales o foros públicos.
Empresas como OpenAI, Google, Amazon y ahora Meta, están en una carrera por crear los modelos más avanzados del mercado. Sin embargo, esa competencia ha reavivado el debate sobre los límites éticos y legales del uso de datos personales.
Además, una encuesta de Pew Research Center de 2024 revela que el 81% de los usuarios de internet no están cómodos con que sus datos públicos sean usados para entrenar sistemas de inteligencia artificial, incluso si están accesibles en la red. Esta tensión entre el avance tecnológico y la protección de la privacidad ha obligado a organismos como la Unión Europea a establecer normativas más estrictas, como el Reglamento General de Protección de Datos (GDPR), que exige transparencia, consentimiento y la posibilidad de oposición.
En este nuevo panorama, la transparencia informativa y el derecho a decidir sobre los propios datos se vuelven esenciales. Si bien la IA promete avances espectaculares en productividad, comunicación y automatización, su desarrollo no puede avanzar a costa de ignorar el consentimiento de quienes alimentan, sin saberlo, el corazón de estos sistemas: sus propios datos.
Ahora lee:
Exhiben a empresa residencial que promueve la gentrificación en Baja California
Entró a una tienda Louis Vuitton con una bolsa fake y la comparó con la original
Mexicanos identifican campaña anti-inmigrantes de Trump en TV nacional