Reidentificación
La anonimización no es absoluta. Aun después de la eliminación rigurosa de datos de identificación personal (PII) y sensibles (SPI), persiste el riesgo de reidentificación. Esto se debe a que la correlación entre las características restantes del conjunto de datos (rasgos que, por sí solos, no son identificativos) puede generar una huella digital de datos única que, al ser cotejada con información externa, permite inferir o reconstruir la identidad del individuo. Este fenómeno enfatiza la naturaleza ilusoria de la privacidad por simple eliminación de variables
ENTIDAD
3 - Otro
INTENCIÓN
2 - Involuntario
TIEMPO
1 - Pre-despliegue
ID del riesgo
mit1147
Linea de dominio
2. Privacidad y Seguridad
2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible
Estrategia de mitigacion
1. Implementación Rigurosa de Privacidad Diferencial (PD): Aplicar mecanismos de ruido estadístico controlado a los datos de entrenamiento para establecer un límite formal en la capacidad de inferir la presencia de un individuo específico, incluso a través de análisis de correlación avanzados. Esta constituye la mitigación de más alta prioridad para la protección formal contra la reidentificación. 2. Utilización de Técnicas de Anonimización Basadas en Propiedades de Conjunto: Emplear métodos como el k-anonimato, la l-diversidad o la t-cercanía para asegurar que cada combinación de cuasi-identificadores en el conjunto de datos de entrenamiento se corresponda con un número mínimo de 'k' individuos o que la distribución de atributos sensibles dentro de esos grupos sea suficientemente diversa, elevando la dificultad computacional de la reidentificación. 3. Adopción Estricta de la Minimización de Datos y la Agregación: Limitar la recolección de datos al mínimo estrictamente necesario para el objetivo del modelo. Antes del entrenamiento, aplicar técnicas de agregación y generalización para reducir la granularidad de los atributos restantes, disminuyendo así la unicidad y el potencial de correlación de las "huellas digitales de datos".