Volver al repositorio MIT
3. Desinformación2 - Post-despliegue

Contaminación del ecosistema de información

La contaminación del sustrato informativo público se refiere a la inyección, intencionada o no, de datos falsos o inexactos dentro de las fuentes de conocimiento accesibles a todos. Este fenómeno no solo degrada la calidad del contenido que consumen los ciudadanos, sino que también introduce sesgos y errores estructurales en los modelos de inteligencia artificial entrenados con dicho material, comprometiendo su fiabilidad y la toma de decisiones derivada.

Fuente: MIT AI Risk Repositorymit264

ENTIDAD

2 - IA

INTENCIÓN

3 - Otro

TIEMPO

2 - Post-despliegue

ID del riesgo

mit264

Linea de dominio

3. Desinformación

74 riesgos mapeados

3.2 > Contaminación del ecosistema de información y pérdida de la realidad consensuada

Estrategia de mitigacion

- Implementar un régimen riguroso de gobernanza de datos Esto incluye realizar auditorías y verificaciones sistemáticas de las fuentes de datos para asegurar su legitimidad e integridad, mitigando el riesgo de introducir sesgos o inexactitudes estructurales en los modelos de IA entrenados. - Establecer mecanismos de validación de resultados (output validation) Es fundamental filtrar y monitorear proactivamente la información generada por los Modelos de Lenguaje Grande (LLM) antes de su difusión, con el fin de detectar y contener la propagación de contenido erróneo o alucinatorio. - Fortalecer la seguridad cibernética de los modelos internos Implementar controles de acceso estrictos y seguimiento de versiones para prevenir el envenenamiento intencionado o no intencionado de datos maliciosos que comprometan la fiabilidad del sistema.

EVIDENCIA ADICIONAL

Un ejemplo de riesgo es la saturación de los bienes comunes digitales (como Wikimedia) con contenido generado sintéticamente o con inexactitudes fácticas (Huang y Siddarth, 2023).