La larga batalla entre los medios de comunicación y las grandes empresas tecnológicas por el uso de contenido para el entrenamiento de la Inteligencia Artificial (IA) acaba de dar un giro crucial. Se ha introducido un nuevo estándar digital cuyo objetivo es establecer un mecanismo formal para que los propietarios de sitios web puedan cobrar a las compañías que extraigan y utilicen su material.
Este hito representa un intento por nivelar el campo de juego, exigiendo una compensación económica por el valor que el contenido editorial e informativo genera para la formación de los grandes modelos de lenguaje (LLMs).
I. El Problema: El ‘Raspado’ (Scraping) Ilegal
Hasta ahora, la mayoría de los modelos de IA se han entrenado con vastas cantidades de datos obtenidos mediante scraping (raspado) masivo de internet, incluyendo artículos de noticias, imágenes y contenido original, a menudo sin consentimiento explícito ni compensación.
El lanzamiento de este nuevo estándar busca poner fin a la barra libre de datos:
Identificación: El estándar permite a los sitios web etiquetar su contenido de una manera específica, indicando que es material protegido y que su uso para entrenamiento de IA requiere una licencia o pago.
Mecanismo de Pago: Al detectar esta etiqueta, la compañía de IA estaría obligada a negociar o pagar una tarifa preestablecida por el uso del material, transformando la extracción de datos en un acto transaccional.
II. ¿Cómo Funciona el Nuevo Estándar de Cobro?
Este sistema se basa en un protocolo técnico que las compañías de IA (como Google, Meta o desarrolladores de modelos LLM) deberán implementar en sus rastreadores o crawlers. Similar al archivo robots.txt que gestiona el indexado en buscadores, este nuevo mecanismo gestionaría el acceso para el entrenamiento de IA.
La intención es crear una barrera digital y legal que clasifique el uso de la información en dos categorías:
Uso Indexado (Gratuito): Permitir que el contenido sea indexado para aparecer en búsquedas tradicionales.
Uso de Entrenamiento (Pagado): Requerir una licencia o pago por el uso del contenido para la alimentación y mejora de modelos de IA.
III. El Impacto Legal y la Repercusión
Este desarrollo tiene enormes implicaciones legales y económicas. Si este estándar es adoptado masivamente por los principales sitios web y reconocido por las grandes compañías tecnológicas, podría:
Cambiar el Modelo de Negocio de la IA: Las empresas de IA tendrían que añadir un costo significativo por la adquisición de datos de calidad, encareciendo el desarrollo de sus modelos.
Beneficiar a los Creadores: Los medios, que han visto mermados sus ingresos por el uso no compensado de su trabajo, podrían obtener una nueva fuente de financiación esencial para la sostenibilidad del periodismo de calidad.
La implementación exitosa de este estándar dependerá ahora de la presión de los reguladores y de la disposición de las grandes tecnológicas a adaptarse a estas nuevas reglas de compensación en la era de la inteligencia artificial.
Noticias Mundo 360 » ¡Únete a nosotros!
Telegram –https://t.me/noticiasmundo360
Whatsapp –https://acortar.link/lTvyna
Twitter –twitter.com/notimundo_360
Instagram –instagram.com/noticiasmundo_360
TikTok –tiktok.com/@noticiasmundo360














