Volver al repositorio MIT
4. Actores Maliciosos y Mal Uso2 - Post-despliegue

Riesgos de Mal Uso

Riesgos de Explotación Intencional de la IA. Este concepto aborda los peligros que emergen cuando actores maliciosos hacen uso deliberado y estratégico de las capacidades de los modelos de inteligencia artificial con el fin de generar un daño significativo. Dicho perjuicio puede manifestarse en múltiples niveles: individual, afectando a personas; organizacional, comprometiendo entidades e instituciones; o sistémico, impactando negativamente a la sociedad en su totalidad.

Fuente: MIT AI Risk Repositorymit1297

ENTIDAD

1 - Humano

INTENCIÓN

1 - Intencional

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1297

Linea de dominio

4. Actores Maliciosos y Mal Uso

223 riesgos mapeados

4.0 > Uso malicioso

Estrategia de mitigacion

1. Implementar evaluaciones de seguridad rigurosas, incluyendo ejercicios de "Red Teaming" (equipo rojo) y pruebas adversariales antes y después del despliegue del modelo, con el objetivo de identificar proactivamente vulnerabilidades y capacidades de explotación que podrían ser utilizadas por actores maliciosos. 2. Integrar mecanismos técnicos de control de uso y contenido, tales como el "fine-tuning" (ajuste fino) del modelo, sistemas de filtrado de entrada y salida, y la aplicación de "restricciones éticas" de diseño para prevenir la generación de contenido o acciones dañinas o prohibidas. 3. Establecer un sistema de monitoreo continuo y post-despliegue (Post-Deployment Monitoring) para evaluar la eficacia de las estrategias de mitigación implementadas, documentar los incidentes de mal uso detectados y refinar las prácticas de detección y respuesta para cerrar las brechas de rendimiento identificadas.