Efecto Intervencional
Este concepto describe un *ciclo de retroalimentación algorítmica* que resulta en la *amplificación del sesgo*. Las disparidades preexistentes en los datos de entrenamiento se manifiestan como experiencias de usuario diferenciadas en el sistema, y esta interacción asimétrica genera nuevos datos que refuerzan y magnifican el sesgo inicial, perpetuando así la desigualdad de manera sistemática.
ENTIDAD
2 - IA
INTENCIÓN
2 - Involuntario
TIEMPO
2 - Post-despliegue
ID del riesgo
mit476
Linea de dominio
1. Discriminación y Toxicidad
1.1 > Discriminación injusta y tergiversación
Estrategia de mitigacion
1. Monitorización Continua y Auditoría Algorítmica de Sesgo Post-despliegue Establecer un sistema de vigilancia y auditoría algorítmica continuo en producción para la detección proactiva de la amplificación del sesgo en tiempo real. Esto incluye el monitoreo de patrones de uso diferenciados y la calidad de la experiencia por subgrupo demográfico para identificar y cuantificar el ciclo de retroalimentación algorítmica perjudicial, permitiendo intervenciones rápidas. 2. Re-equilibrio Activo y Aumento de la Representación de Datos Implementar técnicas avanzadas de preprocesamiento, como el reponderado (reweighting) de los datos de entrenamiento para aumentar la importancia de los subgrupos subrepresentados. Paralelamente, desarrollar estrategias de recolección de datos dirigidas a obtener muestras representativas de los grupos que experimentan un servicio deficiente. El objetivo es mitigar la experiencia inicial deficiente que inicia el ciclo de desenganche. 3. Imposición de Restricciones de Equidad (Fairness Constraints) y Transparencia (XAI) Aplicar restricciones de equidad (fairness constraints) durante el reentrenamiento del modelo para asegurar resultados no discriminatorios y equitativos, incluso si persisten las disparidades de datos. Complementariamente, utilizar la Explicabilidad de la IA (XAI) para rastrear y comprender cómo las decisiones del sistema impactan de manera diferenciada a los subgrupos, facilitando la identificación y corrección de las variables que perpetúan el efecto intervencional.
EVIDENCIA ADICIONAL
Si un Modelo de Lenguaje Grande (LLM) proporciona una experiencia deficiente a un grupo de usuarios debido a la falta de datos de entrenamiento, esta situación tiende a agravarse al disminuir la interacción de dicho grupo con el servicio, lo que genera barreras para la futura recolección de datos y consolida el sesgo algorítmico original.