Riesgos de Mal Uso
Riesgos de Explotación Intencional de la IA. Este concepto aborda los peligros que emergen cuando actores maliciosos hacen uso deliberado y estratégico de las capacidades de los modelos de inteligencia artificial con el fin de generar un daño significativo. Dicho perjuicio puede manifestarse en múltiples niveles: individual, afectando a personas; organizacional, comprometiendo entidades e instituciones; o sistémico, impactando negativamente a la sociedad en su totalidad.
ENTIDAD
1 - Humano
INTENCIÓN
1 - Intencional
TIEMPO
2 - Post-despliegue
ID del riesgo
mit1297
Linea de dominio
4. Actores Maliciosos y Mal Uso
4.0 > Uso malicioso
Estrategia de mitigacion
1. Implementar evaluaciones de seguridad rigurosas, incluyendo ejercicios de "Red Teaming" (equipo rojo) y pruebas adversariales antes y después del despliegue del modelo, con el objetivo de identificar proactivamente vulnerabilidades y capacidades de explotación que podrían ser utilizadas por actores maliciosos. 2. Integrar mecanismos técnicos de control de uso y contenido, tales como el "fine-tuning" (ajuste fino) del modelo, sistemas de filtrado de entrada y salida, y la aplicación de "restricciones éticas" de diseño para prevenir la generación de contenido o acciones dañinas o prohibidas. 3. Establecer un sistema de monitoreo continuo y post-despliegue (Post-Deployment Monitoring) para evaluar la eficacia de las estrategias de mitigación implementadas, documentar los incidentes de mal uso detectados y refinar las prácticas de detección y respuesta para cerrar las brechas de rendimiento identificadas.