Volver al repositorio MIT
5. Interacción Humano-Computadora2 - Post-despliegue

Efectos a largo plazo de sesgos en juicio del usuario

La exposición inicial a los sesgos inherentes a un modelo de inteligencia artificial puede generar un **efecto persistente** en el usuario. Esto significa que las personas que se enfrentan a dichas distorsiones cognitivas tienden a internalizarlas, manifestando la continuidad de esos sesgos previamente encontrados en sus propios procesos de toma de decisiones, incluso después de haber finalizado su interacción con el sistema de IA.

Fuente: MIT AI Risk Repositorymit1078

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1078

Linea de dominio

5. Interacción Humano-Computadora

92 riesgos mapeados

5.2 > Pérdida de agencia y autonomía humana

Estrategia de mitigacion

1. Prioridad Alta: Fomentar la Autonomía y el Juicio HumanoImplementar mecanismos robustos de transparencia y explicabilidad (XAI), tales como la provisión de justificaciones detalladas para las decisiones o recomendaciones del modelo. Esto permite a los usuarios comprender, cuestionar y, si es necesario, anular los resultados sesgados, mitigando la internalización de dichos sesgos en su propio proceso cognitivo y de toma de decisiones, preservando así la agencia humana.2. Prioridad Media: Monitoreo y Auditoría Continua Post-DespliegueEstablecer sistemas de auditoría y monitoreo continuo del desempeño del modelo en entornos reales para detectar la deriva del sesgo y sus efectos persistentes. Esto debe complementarse con la recopilación sistemática de retroalimentación de los usuarios afectados, o el uso de métodos human-in-the-loop, para identificar y corregir activamente los sesgos que emergen o se amplifican con el uso prolongado.3. Prioridad Básica: Aplicación de Técnicas Algorítmicas de EquidadIntegrar algoritmos conscientes de la equidad (fairness-aware algorithms) y técnicas de debiasing adversaria durante el entrenamiento y post-procesamiento. El objetivo es minimizar la presencia de sesgos desde el origen, a través de la representación justa del aprendizaje o la imposición de restricciones de equidad, reduciendo fundamentalmente la exposición inicial del usuario a resultados distorsionados.