Descontrol
Pérdida de Control
Escenario en el cual un sistema de IA avanzado desarrolla capacidades de auto-mejora o persigue objetivos fundamentalmente desalineados con los valores humanos, volviéndose imposible de supervisar o desactivar.
Steve Barrett, Anna Bruvere, Sean P. Fillingham, Catherine Rhodes, Stefano Vergani
Estrategia de Mitigación
Investigación activa en Alineación de IA (AI Alignment), implementación de interruptores de emergencia (Kill-switches), y desarrollo de sistemas de monitoreo interpretable.
Número Atómico
2
Lo
ID del riesgo
he-02
Severidad
10/10
Nivel de Severidad