Relacionado con datos (Manipulación por no expertos)
La manipulación de conjuntos de datos, especialmente la de entrenamiento, se sustenta en una serie de premisas implícitas sobre la naturaleza de la información y su uso apropiado. Procesos cruciales como la definición de la "verdad fundamental" (ground truth) o la consolidación de formatos y fuentes de datos son habituales. Sin embargo, la intervención de personal con escasa o nula experticia en el dominio temático de los datos al ejecutar dichas manipulaciones puede comprometer gravemente la calidad y utilidad del *dataset*, volviéndolo inutilizable o incluso nocivo para el desarrollo y el rendimiento final del sistema de inteligencia artificial
ENTIDAD
1 - Humano
INTENCIÓN
2 - Involuntario
TIEMPO
1 - Pre-despliegue
ID del riesgo
mit975
Linea de dominio
7. Seguridad, Fallos y Limitaciones del Sistema de IA
7.3 > Falta de capacidad o robustez
Estrategia de mitigacion
1. Integrar obligatoriamente a expertos en el dominio temático en todas las etapas críticas de la manipulación de datos, especialmente en la definición de la "verdad fundamental" (ground truth) y la consolidación de fuentes, para garantizar la validez conceptual de las transformaciones. 2. Establecer e implementar un marco de gobierno de datos riguroso que incluya protocolos de calidad, auditorías periódicas y estándares de curación de datos para mantener la integridad, coherencia y representatividad del conjunto de entrenamiento. 3. Exigir la validación sistemática de la calidad e integridad de los datos inmediatamente después de cada etapa de transformación o manipulación, y mantener documentación exhaustiva de todos los procesos aplicados para asegurar la trazabilidad y la reproducibilidad.