Sesgo de datos
El modelo incorpora y perpetúa los sesgos históricos y sociales que están intrínsecamente presentes en los datos utilizados para su entrenamiento y ajuste fino.
ENTIDAD
1 - Humano
INTENCIÓN
2 - Involuntario
TIEMPO
2 - Post-despliegue
ID del riesgo
mit1148
Linea de dominio
1. Discriminación y Toxicidad
1.1 > Discriminación injusta y tergiversación
Estrategia de mitigacion
1. Implementar protocolos de gobernanza y recolección de datos que garanticen la diversidad y la representación equitativa de todos los subgrupos demográficos relevantes en el conjunto de entrenamiento, mitigando así el sesgo de muestreo y selección desde la fuente. 2. Aplicar técnicas de pre-procesamiento de datos, tales como el reponderamiento (reweighting) o el sobremuestreo/submuestreo (oversampling/undersampling), para corregir los desequilibrios estadísticos y asegurar que la influencia de los grupos subrepresentados en el entrenamiento del modelo sea equitativa. 3. Integrar algoritmos conscientes de la equidad (fairness-aware algorithms) mediante la introducción de restricciones o funciones de regularización en el proceso de optimización del modelo, con el objetivo de minimizar la discriminación algorítmica y promover resultados no sesgados.