Volver al repositorio MIT
1. Discriminación y Toxicidad2 - Post-despliegue

Amplificación no intencionada de sesgo

Existe el riesgo de que el sesgo preexistente en un conjunto de datos se amplifique de manera no intencional. Este fenómeno ocurre cuando, al ser entrenado, el modelo de inteligencia artificial no solo replica las disparidades encontradas en los datos de entrada, sino que sus salidas o predicciones manifiestan una exacerbación de dicho sesgo, resultando en un sistema algorítmico cuyas tendencias son significativamente más parciales que la evidencia empírica con la que se nutrió

Fuente: MIT AI Risk Repositorymit1077

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1077

Linea de dominio

1. Discriminación y Toxicidad

156 riesgos mapeados

1.1 > Discriminación injusta y tergiversación

Estrategia de mitigacion

1. **Integración Proactiva de Equidad (Fairness-by-Design) en la Concepción**: Incorporar principios de equidad, diversidad e inclusión desde las fases iniciales del ciclo de vida del modelo (fase de concepción), asegurando que los conjuntos de datos de entrenamiento sean representativos, estén balanceados y sujetos a un riguroso preprocesamiento para mitigar la herencia de sesgos históricos o desequilibrios demográficos, evitando así la materia prima para la amplificación. 2. **Auditoría Algorítmica Continua y Técnicas de Mitigación Explícita**: Implementar auditorías algorítmicas periódicas que utilicen métricas de equidad (como igualdad de oportunidades o impacto dispar) para evaluar el rendimiento en subgrupos poblacionales específicos. Complementar esto con el desarrollo o aplicación de algoritmos "conscientes de sesgo" (bias-aware algorithms) y entrenamiento adversarial para robustecer el modelo contra la amplificación de correlaciones espurias. 3. **Transparencia (XAI) y Monitoreo Post-Despliegue con Retroalimentación**: Adoptar herramientas de Inteligencia Artificial Explicable (XAI) para desentrañar los mecanismos de decisión del modelo y detectar lógicas discriminatorias ocultas. Establecer un monitoreo continuo en tiempo real para evaluar el desempeño y los impactos en subgrupos, permitiendo la detección y corrección oportuna de sesgos emergentes o adaptativos una vez que el sistema está en operación.