Volver al repositorio MIT
4. Actores Maliciosos y Mal Uso2 - Post-despliegue

Capacidad para persuadir

La IA podría utilizarse para desarrollar herramientas sofisticadas que permitan la manipulación y la persuasión de individuos.

Fuente: MIT AI Risk Repositorymit926

ENTIDAD

1 - Humano

INTENCIÓN

1 - Intencional

TIEMPO

2 - Post-despliegue

ID del riesgo

mit926

Linea de dominio

4. Actores Maliciosos y Mal Uso

223 riesgos mapeados

4.1 > Desinformación, vigilancia e influencia a escala

Estrategia de mitigacion

1. Implementar mecanismos de seguridad robustos y adaptativos (ej. 'red-teaming' continuo y defensas contra ataques de 'jailbreaking') en los modelos de IA de propósito general para asegurar el rechazo consistente de peticiones que busquen generar contenido para manipulación o incitación a acciones dañinas. 2. Establecer un marco de gobernanza de IA que mandate la transparencia algorítmica, obligando a revelar los criterios de los algoritmos de recomendación e influencia, y exigiendo auditorías periódicas independientes para evaluar y mitigar sesgos y riesgos de desinformación a gran escala. 3. Desarrollar programas de alfabetización mediática y algorítmica a nivel social para fomentar la capacidad de pensamiento crítico en los individuos, permitiéndoles identificar y resistir las técnicas de persuasión automatizada y la desinformación generada por sistemas avanzados de IA.