Volver al repositorio MIT
2. Privacidad y Seguridad2 - Post-despliegue

Exposición de información personal

El concepto se enmarca dentro de los riesgos de seguridad de la IA, específicamente en la denominada *fuga de datos* o *filtración de información*. Este fenómeno ocurre cuando se incorpora *información de identificación personal* (IIP) o *información personal sensible* (IPS) en alguna etapa crucial del modelo, ya sea durante su entrenamiento, en el proceso de ajuste fino (*fine-tuning*) o incluso al ser introducida directamente por el usuario como parte de la instrucción o *prompt*. El riesgo inherente es que el modelo retenga y, subsiguientemente, revele o exponga esta información privada en el contenido que genera. Es, en esencia, la externalización involuntaria y no deseada de datos privados que deberían haber permanecido confinados al entorno interno del sistema.

Fuente: MIT AI Risk Repositorymit1187

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1187

Linea de dominio

2. Privacidad y Seguridad

186 riesgos mapeados

2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible

Estrategia de mitigacion

1. **Prioridad Alta (Diseño y Desarrollo)** Implementar el principio de minimización de datos y el uso de Tecnologías de Mejora de la Privacidad (PETs), como la privacidad diferencial o el entrenamiento con datos sintéticos, para reducir intrínsecamente la cantidad de IIP/IPS disponible y, por ende, el riesgo de memorización y filtración en los conjuntos de entrenamiento y ajuste fino. 2. **Prioridad Media (Gobernanza y Operación)** Establecer políticas rigurosas de clasificación de datos, asegurando la aplicación del Principio de Mínimo Privilegio (PoLP) y el control de acceso estricto a los entornos de entrenamiento, a los modelos y, crucialmente, a los usuarios que interactúan con el sistema a través de *prompts* con información sensible. 3. **Prioridad Continuada (Post-Despliegue y Monitoreo)** Integrar soluciones de detección de fugas de datos (Data Leakage Detection) en la capa de inferencia y salida para monitorizar y filtrar el contenido generado en tiempo real, identificando y censurando proactivamente cualquier IIP o IPS antes de que sea expuesta al usuario final.