Exposición de información personal
El concepto se enmarca dentro de los riesgos de seguridad de la IA, específicamente en la denominada *fuga de datos* o *filtración de información*. Este fenómeno ocurre cuando se incorpora *información de identificación personal* (IIP) o *información personal sensible* (IPS) en alguna etapa crucial del modelo, ya sea durante su entrenamiento, en el proceso de ajuste fino (*fine-tuning*) o incluso al ser introducida directamente por el usuario como parte de la instrucción o *prompt*. El riesgo inherente es que el modelo retenga y, subsiguientemente, revele o exponga esta información privada en el contenido que genera. Es, en esencia, la externalización involuntaria y no deseada de datos privados que deberían haber permanecido confinados al entorno interno del sistema.
ENTIDAD
2 - IA
INTENCIÓN
2 - Involuntario
TIEMPO
2 - Post-despliegue
ID del riesgo
mit1187
Linea de dominio
2. Privacidad y Seguridad
2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible
Estrategia de mitigacion
1. **Prioridad Alta (Diseño y Desarrollo)** Implementar el principio de minimización de datos y el uso de Tecnologías de Mejora de la Privacidad (PETs), como la privacidad diferencial o el entrenamiento con datos sintéticos, para reducir intrínsecamente la cantidad de IIP/IPS disponible y, por ende, el riesgo de memorización y filtración en los conjuntos de entrenamiento y ajuste fino. 2. **Prioridad Media (Gobernanza y Operación)** Establecer políticas rigurosas de clasificación de datos, asegurando la aplicación del Principio de Mínimo Privilegio (PoLP) y el control de acceso estricto a los entornos de entrenamiento, a los modelos y, crucialmente, a los usuarios que interactúan con el sistema a través de *prompts* con información sensible. 3. **Prioridad Continuada (Post-Despliegue y Monitoreo)** Integrar soluciones de detección de fugas de datos (Data Leakage Detection) en la capa de inferencia y salida para monitorizar y filtrar el contenido generado en tiempo real, identificando y censurando proactivamente cualquier IIP o IPS antes de que sea expuesta al usuario final.