6. Socioeconómico y Ambiental1 - Pre-despliegue

Desafíos de derechos de autor (entrenamiento con salida protegida)

Las empresas de Inteligencia Artificial generativa son objeto recurrente de acusaciones por infringir la legislación de derechos de autor. La controversia se centra en el hecho de que sus modelos son entrenados utilizando obras protegidas (una cantidad considerable de documentos y libros) que son incorporadas a los conjuntos de datos sin la debida autorización de los titulares ni el pago de una compensación económica.

Fuente: MIT AI Risk Repositorymit700

ENTIDAD

1 - Humano

INTENCIÓN

1 - Intencional

TIEMPO

1 - Pre-despliegue

ID del riesgo

mit700

Linea de dominio

6. Socioeconómico y Ambiental

262 riesgos mapeados

6.3 > Devaluación económica y cultural del esfuerzo humano

Estrategia de mitigacion

1. Implementar un marco riguroso para la obtención de licencias de derechos de autor (o recurrir al dominio público y licencias abiertas) antes de incorporar obras en los conjuntos de datos de entrenamiento, asegurando la debida compensación económica a los titulares de derechos. 2. Explorar y priorizar el desarrollo y la utilización de datos sintéticos generados artificialmente como material de entrenamiento. Este enfoque permite imitar las propiedades estadísticas de los datos reales sin replicar contenido protegido por derechos de autor, lo cual previene la infracción en origen. 3. Establecer protocolos de transparencia técnica para que los titulares de derechos puedan verificar el uso legal de sus obras, junto con sistemas de trazabilidad que permitan auditar el cumplimiento de las condiciones pactadas en las licencias (incluyendo el respeto a los mecanismos de exclusión voluntaria o "opt-out").