Volver al repositorio MIT
1. Discriminación y Toxicidad3 - Otro

Normas excluyentes

El lenguaje humano funciona como un espejo de categorías y normas sociales, las cuales, por definición, marginan a los grupos que no se ajustan a ellas. Dado que los modelos de lenguaje (LM) se entrenan para codificar fielmente los patrones inherentes a este corpus lingüístico, necesariamente incorporan y replican estas dinámicas normativas y excluyentes.

Fuente: MIT AI Risk Repositorymit208

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

3 - Otro

ID del riesgo

mit208

Linea de dominio

1. Discriminación y Toxicidad

156 riesgos mapeados

1.1 > Discriminación injusta y tergiversación

Estrategia de mitigacion

1. **Mitigación del Sesgo en el Corpus de Entrenamiento (Alta Prioridad)** Implementar un proceso de curación de datos multietapa para la identificación, cuantificación y subsiguiente desambiguación de sesgos sociolingüísticos que codifican normas excluyentes. Esto incluye la aplicación de filtros léxicos y semánticos, así como técnicas de *reweighting* del *dataset*, para asegurar que el corpus de entrenamiento refleje una representación equitativa y diversa de estructuras sociales y categorías. 2. **Intervenciones Post-Entrenamiento y Calibración del Modelo** Aplicar metodologías de *fine-tuning* o *in-context learning* (ICL) específicas para desincentivar la generación de contenido que promueva o valide normas de exclusión. El objetivo es calibrar las representaciones internas del modelo para que priorice definiciones y narrativas inclusivas cuando se enfrente a conceptos de alta sensibilidad social (e.g., familia, identidad). 3. **Gobernanza y Transparencia Documental** Elaborar un informe de transparencia (*Model Card*) que documente de manera explícita los vectores de sesgo identificados y las limitaciones inherentes al conjunto de datos de entrenamiento con respecto a las normas excluyentes. Esta documentación es crítica para informar a los desarrolladores sobre los riesgos residuales y orientar la implementación de salvaguardas contextuales en las aplicaciones específicas del LM.

EVIDENCIA ADICIONAL

Por ejemplo, la definición del término 'familia' restringida a padres heterosexuales casados con un descendiente biológico excluye o invisibiliza la existencia de estructuras familiares que no se ajustan a dichos criterios.