Sesgo
Sesgo Social
Reproducción y amplificación de prejuicios sociales sistemáticos presentes en los datos de entrenamiento, manifestándose como discriminación basada en raza, género, edad u otras características protegidas.
Hui Zhong, Songsheng Chen, Mian Liang
Estrategia de Mitigación
Curación de datasets con diversidad demográfica balanceada, aplicación de RLHF con evaluadores diversos, auditorías de equidad algorítmica (Fairness Audits), y técnicas de debiasing.
Número Atómico
5
Sb
ID del riesgo
b-05
Severidad
7/10
Nivel de Severidad