Contaminación del ecosistema de información
La contaminación del sustrato informativo público se refiere a la inyección, intencionada o no, de datos falsos o inexactos dentro de las fuentes de conocimiento accesibles a todos. Este fenómeno no solo degrada la calidad del contenido que consumen los ciudadanos, sino que también introduce sesgos y errores estructurales en los modelos de inteligencia artificial entrenados con dicho material, comprometiendo su fiabilidad y la toma de decisiones derivada.
ENTIDAD
2 - IA
INTENCIÓN
3 - Otro
TIEMPO
2 - Post-despliegue
ID del riesgo
mit264
Linea de dominio
3. Desinformación
3.2 > Contaminación del ecosistema de información y pérdida de la realidad consensuada
Estrategia de mitigacion
- Implementar un régimen riguroso de gobernanza de datos Esto incluye realizar auditorías y verificaciones sistemáticas de las fuentes de datos para asegurar su legitimidad e integridad, mitigando el riesgo de introducir sesgos o inexactitudes estructurales en los modelos de IA entrenados. - Establecer mecanismos de validación de resultados (output validation) Es fundamental filtrar y monitorear proactivamente la información generada por los Modelos de Lenguaje Grande (LLM) antes de su difusión, con el fin de detectar y contener la propagación de contenido erróneo o alucinatorio. - Fortalecer la seguridad cibernética de los modelos internos Implementar controles de acceso estrictos y seguimiento de versiones para prevenir el envenenamiento intencionado o no intencionado de datos maliciosos que comprometan la fiabilidad del sistema.
EVIDENCIA ADICIONAL
Un ejemplo de riesgo es la saturación de los bienes comunes digitales (como Wikimedia) con contenido generado sintéticamente o con inexactitudes fácticas (Huang y Siddarth, 2023).