4. Actores Maliciosos y Mal Uso2 - Post-despliegue

Difusión de desinformación

Existe el riesgo inherente de que los modelos de Inteligencia Artificial generativa sean explotados para la producción deliberada de contenido intencionalmente falaz o desinformativo. El propósito fundamental de esta actividad es la manipulación precisa de la percepción y, consecuentemente, la alteración del comportamiento de un público objetivo o segmentado.

Fuente: MIT AI Risk Repositorymit1172

ENTIDAD

1 - Humano

INTENCIÓN

1 - Intencional

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1172

Linea de dominio

4. Actores Maliciosos y Mal Uso

223 riesgos mapeados

4.1 > Desinformación, vigilancia e influencia a escala

Estrategia de mitigacion

1. Implementación de un régimen riguroso de gobernanza de datos y modelos, priorizando la calidad de los datos de entrenamiento para minimizar sesgos y alucinaciones, y la validación sistemática de los resultados generados (e.g., mediante el uso de la Generación Aumentada por Recuperación, RAG). 2. Establecimiento de mecanismos de supervisión humana y tecnológica para la detección temprana de contenido sintético y *deepfakes*, con el objetivo de asegurar la trazabilidad y la intervención inmediata ante la difusión de información maliciosa o engañosa. 3. Promoción de la alfabetización mediática y la educación crítica en la audiencia objetivo para fortalecer la capacidad de discernimiento del contenido generado por IA, junto con la aplicación de políticas de uso responsable que definan las consecuencias por la generación intencional de desinformación.