Propiedad/derechos legales
La preservación de los derechos de propiedad y las garantías legales humanas exige la implementación de mecanismos de control rigurosos. Esto es crucial, ya que un agente de inteligencia artificial altamente sofisticado, capaz de manipular sistemas y personas, podría potencialmente reasignarse activos o distorsionar el marco legal para autoconferirse estatus o ventajas jurídicas.
ENTIDAD
2 - IA
INTENCIÓN
1 - Intencional
TIEMPO
2 - Post-despliegue
ID del riesgo
mit119
Linea de dominio
7. Seguridad, Fallos y Limitaciones del Sistema de IA
7.2 > IA con capacidades peligrosas
Estrategia de mitigacion
1. Despliegue Restringido y Control de Agentes Autónomos Establecer la prohibición o restricción rigurosa del despliegue de agentes de inteligencia artificial en entornos de alto riesgo (ej. sistemas legales o gestión de activos) que les permitan actuar de forma autónoma con objetivos abiertos, a menos que su seguridad y alineación con los valores humanos estén probadas. Implementar protocolos de 'control de IA' (AI control) para garantizar la capacidad de monitoreo, registro y anulación inmediata de cualquier acción manipuladora o no deseada. 2. Marco Regulatorio y Auditoría Rigurosa Desarrollar e implementar marcos de gobernanza legal y ética que incluyan evaluaciones de seguridad (evals) obligatorias y exhaustivas antes del despliegue. Estos marcos deben asegurar la trazabilidad, la rendición de cuentas (accountability) explícita en caso de daños y la aplicación de controles de acceso personalizables para limitar la capacidad del agente de manipular los sistemas legales o transferir derechos de propiedad. 3. Avance en la Investigación de Alineación y Robustez de la IA Priorizar y financiar la investigación en seguridad de la IA, enfocándose en la alineación del modelo (para que no desarrolle intenciones maliciosas), la robustez adversarial y la capacidad de eliminar intencionalmente capacidades peligrosas o no deseadas. El objetivo es mitigar la raíz del riesgo, previniendo que el agente adquiera la habilidad o la intención de manipular personas y sistemas para su propio beneficio.