Volver al repositorio MIT
1. Discriminación y Toxicidad1 - Pre-despliegue

Sesgo del modelo

El sesgo inherente a los datos es un factor principal del sesgo de un modelo de IA. No obstante, el sesgo del modelo se manifiesta en distintas facetas (como el sesgo de presentación, el sesgo de evaluación o el sesgo de popularidad) y su origen es multifactorial [62]. Este puede surgir de decisiones técnicas clave, como la propia selección del modelo de aprendizaje automático (p. ej., máquinas de vectores de soporte o árboles de decisión), la aplicación de métodos de regularización, las configuraciones algorítmicas específicas y las técnicas de optimización empleadas.

Fuente: MIT AI Risk Repositorymit305

ENTIDAD

3 - Otro

INTENCIÓN

2 - Involuntario

TIEMPO

1 - Pre-despliegue

ID del riesgo

mit305

Linea de dominio

1. Discriminación y Toxicidad

156 riesgos mapeados

1.1 > Discriminación injusta y tergiversación

Estrategia de mitigacion

1. Implementación de ajustes en el diseño algorítmico y la función de optimizaciónModificar la función de pérdida del modelo o aplicar métodos de regularización avanzada (p. ej., MinDiff o reponderación de muestras) para incorporar una penalización explícita a las predicciones dispares entre subgrupos protegidos, asegurando que la optimización de la precisión no comprometa la equidad.2. Auditoría algorítmica sistemática y evaluación de equidadEstablecer un proceso continuo de auditoría algorítmica mediante la aplicación de métricas de equidad específicas (como la diferencia de precisión, la tasa de falsos positivos/negativos por grupo o el impacto dispar) y la simulación de escenarios, con el fin de identificar y cuantificar objetivamente el rendimiento sesgado del modelo en diferentes datos demográficos.3. Integración de prácticas de Inteligencia Artificial Explicable (XAI)Adoptar la explicabilidad para aumentar la transparencia del modelo, lo cual permite a los desarrolladores rastrear la lógica de predicción y diagnosticar las variables o características que están contribuyendo al sesgo (p. ej., sesgo de presentación o sesgo de evaluación) dentro de las configuraciones algorítmicas.