Datos de entrenamiento incompletos o sesgados
La inclusión de datos de entrenamiento incompletos o que reflejan sesgos preexistentes resulta en la propagación o amplificación de dichas parcialidades, manifestándose en decisiones o predicciones algorítmicas inherentemente discriminatorias.
ENTIDAD
3 - Otro
INTENCIÓN
2 - Involuntario
TIEMPO
2 - Post-despliegue
ID del riesgo
mit951
Linea de dominio
1. Discriminación y Toxicidad
1.1 > Discriminación injusta y tergiversación
Estrategia de mitigacion
1. Recolección, curación y auditoría rigurosa de los datos de entrenamiento Asegurar la representatividad y diversidad de los conjuntos de datos con respecto a la población objetivo mediante la realización de auditorías de datos periódicas y la aplicación de técnicas de preprocesamiento, como el remuestreo o la ponderación, para mitigar la incompletitud y los sesgos históricos o de muestreo. 2. Aplicación de metodologías de modelado sensibles a la equidad Integrar métricas de equidad (p. ej., paridad demográfica, igualdad de oportunidades) y algoritmos con restricciones de imparcialidad (p. ej., debiasing adversario o funciones de pérdida ajustadas como MinDiff) directamente en el proceso de entrenamiento del modelo para minimizar el impacto predictivo de los atributos sensibles. 3. Establecimiento de un marco de monitoreo y supervisión continua Implementar mecanismos de revisión humana ("human-in-the-loop") y auditorías post-despliegue para detectar y corregir proactivamente el "sesgo de deriva" y los resultados discriminatorios en tiempo real, asegurando la alineación constante del sistema con los principios éticos y regulatorios.