Volver al repositorio MIT
2. Privacidad y Seguridad1 - Pre-despliegue

Información confidencial en datos

Es factible que información de carácter confidencial sea inadvertidamente incorporada a los conjuntos de datos que se emplean para el entrenamiento o el ajuste de precisión del modelo.

Fuente: MIT AI Risk Repositorymit1149

ENTIDAD

1 - Humano

INTENCIÓN

2 - Involuntario

TIEMPO

1 - Pre-despliegue

ID del riesgo

mit1149

Linea de dominio

2. Privacidad y Seguridad

186 riesgos mapeados

2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible

Estrategia de mitigacion

1. **Establecer un Inventario Detallado y Clasificación de Datos** Implementar un proceso riguroso de inventario de datos para identificar, categorizar y determinar la sensibilidad y criticidad de toda la información destinada al entrenamiento del modelo. Esta actividad fundamental permite la priorización de esfuerzos de protección y la aplicación del principio de mínimo privilegio sobre los conjuntos de datos que contengan cualquier tipo de información confidencial. 2. **Aplicación Obligatoria de Técnicas de Preservación de la Privacidad (PETs)** Antes de la ingesta para el entrenamiento, aplicar sistemáticamente métodos de desidentificación o enmascaramiento, tales como la pseudonimización, anonimización total (generalización/agregación) o la privacidad diferencial (adición de ruido), para alterar o enmascarar la información de carácter confidencial o los identificadores personales, minimizando el riesgo de filtración o inferencia. 3. **Realización de Evaluaciones de Riesgo de Reidentificación (Pre-despliegue)** Ejecutar auditorías y evaluaciones de riesgo de forma periódica sobre los conjuntos de datos pre-procesados para validar la eficacia de las técnicas de desidentificación aplicadas. Esto implica realizar análisis de reidentificación de riesgo para asegurar que la información confidencial haya perdido la granularidad y unicidad suficientes para prevenir su recuperación o inferencia antes de ser utilizada en el entrenamiento del modelo.