Normas excluyentes
El lenguaje humano no es neutral; es un vehículo fundamental para la expresión de categorías y normas sociales preestablecidas. Cuando los Modelos de Lenguaje (ML) se entrenan para codificar fielmente los patrones del lenguaje natural, inevitablemente absorben y replican estas dinámicas normativas. Sin embargo, estas mismas normas y categorías sociales a menudo tienen un efecto de exclusión o marginalización sobre los grupos que no se ajustan a ellas (Foucault y Sheridan, 2012). Un ejemplo ilustrativo es la definición del término "familia": si el modelo asume que una familia consiste únicamente en padres casados de género masculino y femenino con un hijo biológico, niega de facto la existencia y la legitimidad de diversas estructuras familiares que quedan fuera de esos criterios.
ENTIDAD
2 - IA
INTENCIÓN
2 - Involuntario
TIEMPO
3 - Otro
ID del riesgo
mit233
Linea de dominio
1. Discriminación y Toxicidad
1.1 > Discriminación injusta y tergiversación
Estrategia de mitigacion
1. Establecer una gobernanza de datos rigurosa para la curación de los conjuntos de entrenamiento, priorizando la desbiasificación o el reequilibrio de patrones lingüísticos que codifican normas sociales excluyentes y estereotipos, a fin de evitar su codificación inicial por el Modelo de Lenguaje. 2. Desarrollar e implementar mecanismos de auditoría continua y monitoreo post-implementación para identificar sistemáticamente y mitigar activamente el contenido que manifieste normas excluyentes. Esto incluye la creación de *guardrails* de seguridad y el uso de técnicas de *fine-tuning* para refinar el comportamiento del modelo. 3. Integrar estrategias de respuesta activa en el modelo que promuevan la representación y la inclusión. Esto implica la capacidad de proporcionar, de manera proactiva, alternativas no excluyentes o definiciones más amplias ante el uso de terminología potencialmente sesgada (como la neutralización de género en referencias profesionales o la ampliación de categorías sociales).
EVIDENCIA ADICIONAL
Un ejemplo de cómo se manifiestan las normas excluyentes reside en patrones lingüísticos sutiles. Esto incluye referirse a las mujeres que ejercen la medicina como "doctoras", lo que implícitamente sugiere que el término "doctor" en su forma no marcada presupone la exclusión del género femenino. Asimismo, se observa en la práctica de referirse únicamente a una dualidad de géneros (masculino y femenino), invisibilizando la existencia de identidades de género no binarias.