Estafas
Los agentes maliciosos pueden emplear la inteligencia artificial generativa para crear contenido adaptable con el fin de impulsar campañas, agendas políticas o posturas de odio, distribuyendo esta información de manera veloz y a bajo costo a través de múltiples plataformas. Esta proliferación acelerada de contenido falso o engañoso, conocida como desinformación facilitada por la IA, puede instaurar un efecto cíclico con consecuencias críticas para la propia IA generativa. Específicamente, cuando una gran cantidad de esta desinformación es introducida en el ecosistema digital y se utiliza, por ejemplo, para entrenar nuevos sistemas generativos mediante métodos como el aprendizaje por refuerzo, los datos de entrada sesgados o erróneos terminan produciendo resultados que son progresivamente más incorrectos
ENTIDAD
1 - Humano
INTENCIÓN
1 - Intencional
TIEMPO
2 - Post-despliegue
ID del riesgo
mit479
Linea de dominio
4. Actores Maliciosos y Mal Uso
4.3 > Fraude, estafas y manipulación dirigida
Estrategia de mitigacion
1. Implementar medidas rigurosas de **calidad e integridad de los datos** en las fases de entrenamiento, incluyendo auditorías periódicas de las fuentes para verificar su legitimidad y manipulación, y **reforzar la seguridad** de los modelos internos con controles de acceso y seguimiento de versiones para prevenir el envenenamiento intencionado o no intencionado de los datos. 2. Establecer protocolos de **validación de resultados** (filtrado de la salida del LLM y supervisión de patrones de uso) y garantizar la **transparencia** mediante el etiquetado obligatorio (marcas de agua digitales) de todo contenido generado o manipulado por IA, en cumplimiento con marcos regulatorios, para permitir a los usuarios discernir la autenticidad del contenido. 3. Desarrollar un **plan de respuesta a incidentes de desinformación** que abarque la detección rápida, la contención del daño y la comunicación pública clara a través de canales oficiales. Paralelamente, promover activamente el **criterio humano crítico** para evaluar la fuente, la intención y la veracidad de los contenidos antes de su consumo o difusión.