Si desea defender sus derechos de autor y proteger su contenido informativo del rastreo por parte de la Inteligencia Artificial (IA) y otros, contar con metadatos seguros adjuntos a su contenido es cada vez más la única opción, ya que son legibles por máquinas, pueden viajar con el contenido a donde sea que vaya y son obligatorios según ciertas regulaciones.
La mayoría de los productos informativos tienen alcance global y, en algún momento, atraviesan jurisdicciones, como Europa, que han promulgado regulaciones integrales sobre derechos y obligaciones de contenido, o se visualizan en Estados Unidos, donde se están debatiendo interpretaciones legales de la ley de derechos de autor en los tribunales para contemplar el ecosistema digital.
Entre las protecciones en Europa se encuentra una cláusula estricta en el artículo 53 del Acta IA de la UE, que entró en vigor en agosto, que prohíbe a la IA entrenarse con fines comerciales en contenido marcado con una cláusula – “opt-out” - de exclusión voluntaria legible por máquina. También exige que los sistemas de IA documenten las fuentes de información con las que se han entrenado.
Estados Unidos trabaja con un modelo de inclusión voluntaria – “opt-in” - donde la protección de los derechos de autor es un hecho. Sin embargo, especialmente en el sector informativo, este modelo se ve cuestionado por los alegatos de "uso legítimo" que las empresas de IA utilizan para justificar su recolección indiscriminada y masiva de noticias de internet, la materia prima de los resúmenes de noticias de IA.
Los metadatos son importantes en ambos regímenes, aunque por diferentes razones, según Paul Reinitz, experto en los aspectos legales y comerciales de la gobernanza de los derechos de autor de la IA, quien proporcionó una amplia orientación para este artículo.
En un sentido muy práctico, saber dónde y cómo se utiliza el contenido e informar claramente sobre la identidad del propietario podría ayudar a definir el alcance de los daños, así como los términos de un acuerdo de licencia a futuro, afirmó.
También podría ayudar a desactivar las defensas de la IA basadas en argumentos de que era imposible identificar a los propietarios del contenido o determinar si este estaba protegido.
"La clave aquí es que la misma infraestructura de metadatos puede abordar múltiples requisitos regulatorios simultáneamente", afirmó Reinitz en una reunión reciente del Consejo Internacional de Telecomunicaciones de Prensa (IPTC).
"Ya sea que se trate de requisitos de exclusión voluntaria de la UE, mandatos de divulgación de Estados Unidos o leyes estatales de transparencia, la implementación consistente de metadatos proporciona una base que realmente se adapta a todas las jurisdicciones", dijo.
La creciente importancia de los metadatos para proteger el contenido y garantizar la transparencia no ha pasado desapercibida en la industria. Ha impulsado la creación de múltiples soluciones a través de esfuerzos colaborativos de actores de la industria, así como de empresas del libre mercado, que buscan abordar los desafíos que plantea la gestión de contenido digital frente a la limpieza masiva y a menudo indiscriminada de contenido por parte de iniciativas de IA, así como la desinformación y el fraude en línea.
Gran parte de este esfuerzo se centra en el estándar de procedencia digital de código abierto C2PA (Coalición de Procedencia y Autenticidad de Contenido), respaldado por la Iniciativa de Autenticidad de Contenido, con casi 6 mil miembros, una iniciativa colaborativa y multisectorial de actores de la industria.
El IPTC ha realizado adaptaciones para su uso en la industria periodística. Al final de este artículo se incluye una lista de muchas de las soluciones disponibles.
Reinitz, quien entre 2016 y 2024 fue director de Getty Images y asesoró sobre temas como el cumplimiento de los derechos de autor y la IA, afirmó que una de las conclusiones clave es la importancia de los metadatos.
"Conservar los metadatos como norma y adoptar los requisitos de transparencia", afirmó. "Familiarízate con la firma de contenido mediante C2PA; si necesitas ayuda para empezar, el IPTC ha publicado una excelente guía al respecto. En segundo lugar, es importante desarrollar una estrategia de ‘scraping’ y licencias".
El estándar C2PA se desarrolló originalmente con el objetivo declarado de combatir la desinformación brindando al público acceso a las "etiquetas nutricionales" digitales sobre la procedencia del contenido, restaurando así la confianza, que se había debilitado, tanto en las noticias como en la actividad en línea en general.
Sin embargo, un extenso informe sobre C2PA, publicado a principios de septiembre por el Foro Mundial de Privacidad, ofreció más contexto y señaló que los metadatos de C2PA tienen múltiples usos.
“Algunos artistas, creadores de contenido, marcas de medios y entretenimiento, empresas y agencias gubernamentales desean utilizar C2PA para marcar, rastrear y proteger su contenido, reflejar los derechos de propiedad intelectual, indicar el consentimiento o las restricciones relacionadas con los datos de entrenamiento de IA, o ayudar a distinguir su contenido como confiable.
Estos usuarios de C2PA podrían querer incorporar sus identidades en los metadatos de procedencia de C2PA”, según el informe del Foro de Privacidad.
El estándar de procedencia también está diseñado para “apoyar las infraestructuras de medios digitales con datos granulares, automatizados, compartibles y legibles por máquina, y señales de confianza sobre el contenido digital y sus creadores. Los datos codificados que genera están diseñados para ser fácilmente asimilados, analizados e intercambiados por todos los sistemas compatibles con C2PA, desde pequeñas herramientas de software de código abierto hasta enormes redes de distribución de contenido en la nube”, según el informe.
Un informe recién publicado por el Grupo de Trabajo sobre Infraestructura de Derechos de Autor (CITF) de Europa confirmó que el artículo 53 de la Ley de IA de la UE, que en particular reafirmó el artículo 4 de la Ley de Derechos de Autor del Mercado Único Digital de 2019, había elevado la importancia de los metadatos para la defensa y el cumplimiento normativo.
"En la era de la IA, modernizar la infraestructura de derechos de autor es un componente crucial para que la legislación sobre derechos de autor funcione en la práctica", según el informe, titulado "Datos de derechos de autor interoperables, fiables y legibles por máquina en la era de la IA".
Mientras que Europa ha sido más agresiva en el establecimiento de regulaciones relacionadas con la defensa de los derechos de autor, Estados Unidos, a nivel federal, ha dejado en manos de los tribunales muchas decisiones relacionadas con la IA y el ámbito de los derechos de autor.
“Más de 22 demandas se están tramitando en tribunales federales”, declaró Reinitz en una entrevista tras su presentación en la reunión del IPTC.
La doctrina del “uso legítimo”, que permite el uso limitado de material protegido por derechos de autor para noticias, comentarios o informes académicos sin el consentimiento de los autores, será la defensa clave para las empresas de IA.
“La cuestión del uso legítimo dependerá de los hechos específicos de cada caso, incluyendo qué obras se utilizaron, de qué fuentes, con qué fines y con qué salvaguardas técnicas contra la reproducción de contenido protegido por derechos de autor”, afirmó Reinitz.
En febrero, Thomson Reuters ganó un caso de “uso legítimo” contra Ross Intelligence, que había extraído partes específicas de la base de datos Westlaw de la empresa. El tribunal determinó que el uso del contenido por parte de Ross Intelligence no fue lo suficientemente transformador y que su naturaleza fue comercial.
En los casos contra Meta y Anthropic, los jueces determinaron que el uso de libros por parte de la IA para formación fue altamente transformador y, en ese sentido, no contradecía las disposiciones de “uso legítimo”.
Sin embargo, en el caso de Anthropic, se determinó que el uso constituía una infracción debido a que Anthropic había obtenido sus datos de entrenamiento de una base de datos de libros pirateados. Esto condujo a una propuesta de acuerdo por 1,500 millones de dólares.
"De ahora en adelante, creo que los casos probablemente girarán en torno a cómo los tribunales gestionan el cuarto factor de uso legítimo, es decir, el efecto del uso sobre el valor potencial de mercado o el valor de la obra protegida por derechos de autor", declaró Reinitz. "Dicho esto, cada caso es muy sensible a los hechos, lo que dificulta predecir precedentes legales con certeza".
Por lo tanto, para Estados Unidos, añadió, "la conclusión clave aquí es que, debido a la incertidumbre jurídica, existe un fuerte incentivo para que los desarrolladores de IA obtengan datos de fuentes legítimas y licencien obras protegidas por derechos de autor cuando sea necesario".
Como muestra el estudio del CITF, aún queda mucho trabajo por hacer para que los metadatos funcionen en toda la infraestructura digital, y no es el menor de ellos lograr un uso generalizado y perfeccionar la tecnología para garantizar que los metadatos, o credenciales de contenido, sean duraderos y resistentes a la piratería y/o la eliminación.
La falta de una alternativa y la urgente necesidad de una mayor certeza en todos los aspectos del origen y la naturaleza del contenido se citan como el principal impulsor del movimiento hacia un ecosistema digital organizado con metadatos, lo que explica en gran medida el auge de diversas soluciones para abordar los problemas de derechos de autor y transparencia.
Entre las numerosas iniciativas para abordar estos desafíos se encuentran:
• El estándar de procedencia C2PA, de código abierto, desarrollado en los últimos cinco años por la Coalición para la Procedencia y la Autenticidad del Contenido. C2PA permite a la IA generar una etiqueta nutricional segura para ser transparente sobre su papel en la creación de contenido. También permite a los creadores de contenido enviar mensajes de exclusión voluntaria legibles por máquina, marcar todo el contenido con información de marca y mejorar el valor del contenido al proporcionar información detallada sobre el origen y la historia del contenido, ya sea real o sintético, lo que contribuye a la lucha contra la desinformación y el fraude en línea. El estándar cuenta con el apoyo de una comunidad multisectorial de casi 6 mil personas organizada bajo el paraguas de la Iniciativa de Autenticidad del Contenido.
El IPTC, organismo global de normalización para los medios de comunicación, ha incorporado y adaptado el estándar C2PA específicamente para su uso por parte de los editores de noticias, incluyendo el establecimiento de una Lista de Editores de Noticias de Origen Verificado, que ayudará a certificar el rol de los miembros de la lista como proveedores de noticias.
Cloudflare, la red de datos de contenido que gestiona el 20% del tráfico digital, se convirtió en febrero en el primer proveedor en permitir que los metadatos de C2PA permanezcan adjuntos al contenido. También ha lanzado una función para bloquear la extracción no autorizada de contenido por parte de la IA, así como una alternativa que permitiría a la IA "pagar por rastreo", esencialmente licenciando contenido en nombre de los propietarios.
Real Simple Licensing (RSL) es un estándar web y una organización de derechos colectivos que busca automatizar el licenciamiento de contenido, buscando una compensación justa para editores y creadores. RSL se lanzó públicamente en septiembre y se basa en el modelo Real Simple Syndication (RSS), establecido en los inicios de Internet.
IMATAG es una empresa que ofrece servicios de marca de agua digital y está diseñada para proteger el contenido y ayudar a confirmar su autenticidad. No reemplaza los metadatos de IPTC, C2PA, RSL o Cloudflare, pero respalda estas soluciones con una red de seguridad que reúne un archivo original con sus metadatos después de que estos hayan sido eliminados, se hayan vulnerado las cadenas de procedencia o no se hayan respetado los marcos de cumplimiento.
(El autor de la nota es consultor en América Latina de la Iniciativa de Autenticidad de Contenido. La información en esta nota está presentado a título personal).