Información confidencial en datos
Es factible que información de carácter confidencial sea inadvertidamente incorporada a los conjuntos de datos que se emplean para el entrenamiento o el ajuste de precisión del modelo.
ENTIDAD
1 - Humano
INTENCIÓN
2 - Involuntario
TIEMPO
1 - Pre-despliegue
ID del riesgo
mit1149
Linea de dominio
2. Privacidad y Seguridad
2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible
Estrategia de mitigacion
1. **Establecer un Inventario Detallado y Clasificación de Datos** Implementar un proceso riguroso de inventario de datos para identificar, categorizar y determinar la sensibilidad y criticidad de toda la información destinada al entrenamiento del modelo. Esta actividad fundamental permite la priorización de esfuerzos de protección y la aplicación del principio de mínimo privilegio sobre los conjuntos de datos que contengan cualquier tipo de información confidencial. 2. **Aplicación Obligatoria de Técnicas de Preservación de la Privacidad (PETs)** Antes de la ingesta para el entrenamiento, aplicar sistemáticamente métodos de desidentificación o enmascaramiento, tales como la pseudonimización, anonimización total (generalización/agregación) o la privacidad diferencial (adición de ruido), para alterar o enmascarar la información de carácter confidencial o los identificadores personales, minimizando el riesgo de filtración o inferencia. 3. **Realización de Evaluaciones de Riesgo de Reidentificación (Pre-despliegue)** Ejecutar auditorías y evaluaciones de riesgo de forma periódica sobre los conjuntos de datos pre-procesados para validar la eficacia de las técnicas de desidentificación aplicadas. Esto implica realizar análisis de reidentificación de riesgo para asegurar que la información confidencial haya perdido la granularidad y unicidad suficientes para prevenir su recuperación o inferencia antes de ser utilizada en el entrenamiento del modelo.