1. Discriminación y Toxicidad2 - Post-despliegue

Datos de entrenamiento incompletos o sesgados

La inclusión de datos de entrenamiento incompletos o que reflejan sesgos preexistentes resulta en la propagación o amplificación de dichas parcialidades, manifestándose en decisiones o predicciones algorítmicas inherentemente discriminatorias.

Fuente: MIT AI Risk Repositorymit951

ENTIDAD

3 - Otro

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit951

Linea de dominio

1. Discriminación y Toxicidad

156 riesgos mapeados

1.1 > Discriminación injusta y tergiversación

Estrategia de mitigacion

1. Recolección, curación y auditoría rigurosa de los datos de entrenamiento Asegurar la representatividad y diversidad de los conjuntos de datos con respecto a la población objetivo mediante la realización de auditorías de datos periódicas y la aplicación de técnicas de preprocesamiento, como el remuestreo o la ponderación, para mitigar la incompletitud y los sesgos históricos o de muestreo. 2. Aplicación de metodologías de modelado sensibles a la equidad Integrar métricas de equidad (p. ej., paridad demográfica, igualdad de oportunidades) y algoritmos con restricciones de imparcialidad (p. ej., debiasing adversario o funciones de pérdida ajustadas como MinDiff) directamente en el proceso de entrenamiento del modelo para minimizar el impacto predictivo de los atributos sensibles. 3. Establecimiento de un marco de monitoreo y supervisión continua Implementar mecanismos de revisión humana ("human-in-the-loop") y auditorías post-despliegue para detectar y corregir proactivamente el "sesgo de deriva" y los resultados discriminatorios en tiempo real, asegurando la alineación constante del sistema con los principios éticos y regulatorios.