Amplificación no intencionada de sesgo
Existe el riesgo de que el sesgo preexistente en un conjunto de datos se amplifique de manera no intencional. Este fenómeno ocurre cuando, al ser entrenado, el modelo de inteligencia artificial no solo replica las disparidades encontradas en los datos de entrada, sino que sus salidas o predicciones manifiestan una exacerbación de dicho sesgo, resultando en un sistema algorítmico cuyas tendencias son significativamente más parciales que la evidencia empírica con la que se nutrió
ENTIDAD
2 - IA
INTENCIÓN
2 - Involuntario
TIEMPO
2 - Post-despliegue
ID del riesgo
mit1077
Linea de dominio
1. Discriminación y Toxicidad
1.1 > Discriminación injusta y tergiversación
Estrategia de mitigacion
1. **Integración Proactiva de Equidad (Fairness-by-Design) en la Concepción**: Incorporar principios de equidad, diversidad e inclusión desde las fases iniciales del ciclo de vida del modelo (fase de concepción), asegurando que los conjuntos de datos de entrenamiento sean representativos, estén balanceados y sujetos a un riguroso preprocesamiento para mitigar la herencia de sesgos históricos o desequilibrios demográficos, evitando así la materia prima para la amplificación. 2. **Auditoría Algorítmica Continua y Técnicas de Mitigación Explícita**: Implementar auditorías algorítmicas periódicas que utilicen métricas de equidad (como igualdad de oportunidades o impacto dispar) para evaluar el rendimiento en subgrupos poblacionales específicos. Complementar esto con el desarrollo o aplicación de algoritmos "conscientes de sesgo" (bias-aware algorithms) y entrenamiento adversarial para robustecer el modelo contra la amplificación de correlaciones espurias. 3. **Transparencia (XAI) y Monitoreo Post-Despliegue con Retroalimentación**: Adoptar herramientas de Inteligencia Artificial Explicable (XAI) para desentrañar los mecanismos de decisión del modelo y detectar lógicas discriminatorias ocultas. Establecer un monitoreo continuo en tiempo real para evaluar el desempeño y los impactos en subgrupos, permitiendo la detección y corrección oportuna de sesgos emergentes o adaptativos una vez que el sistema está en operación.