2. Privacidad y Seguridad3 - Otro

Privacidad

Los sistemas de Inteligencia Artificial Generativa se sitúan en el epicentro de un debate crucial: su potencial amenaza a la privacidad y a los marcos de protección de datos vigentes, un riesgo que comparten con el aprendizaje automático tradicional. La preocupación fundamental radica en la capacidad, ya sea por extracción intencionada o por una fuga inadvertida, de estos Grandes Modelos de Lenguaje (LLM) para exponer información sensible o privada que haya formado parte de su entrenamiento. Para contrarrestar esta vulnerabilidad, la investigación en seguridad propone dos estrategias principales: la higienización de los datos de entrenamiento, que implica la eliminación sistemática de información confidencial, o la alternativa de recurrir a datos sintéticos para el proceso de aprendizaje del modelo.

Fuente: MIT AI Risk Repositorymit74

ENTIDAD

3 - Otro

INTENCIÓN

3 - Otro

TIEMPO

3 - Otro

ID del riesgo

mit74

Linea de dominio

2. Privacidad y Seguridad

186 riesgos mapeados

2.1 > Compromiso de la privacidad por filtración o inferencia de información sensible

Estrategia de mitigacion

1. Implementar la higienización rigurosa y la minimización de los datos de entrenamiento, utilizando técnicas de **anonimización** (enmascaramiento, seudonimización) o el empleo de **datos sintéticos** para reducir el riesgo de memorización y la posterior extracción o inferencia de información sensible. 2. Establecer **controles de acceso estrictos** basados en roles (RBAC) y **cifrado robusto** de extremo a extremo para los datos en tránsito y en reposo, asegurando que solo el personal autorizado y los procesos validados puedan acceder a la información crítica del modelo y sus *logs*. 3. Integrar principios de **Privacidad por Diseño** (*Privacy by Design*), incluyendo la aplicación de **privacidad diferencial** durante el entrenamiento para inyectar 'ruido' estadístico y prevenir ataques de inferencia, y la implementación de **filtros a nivel de *token*** para la redacción automática de PII en las respuestas generadas.