Daños a Menores
El riesgo de que los Modelos de Lenguaje Grande (LLMs) sean explotados para solicitar o generar contenido explícitamente perjudicial o inapropiado dirigido a audiencias infantiles y juveniles
ENTIDAD
2 - IA
INTENCIÓN
1 - Intencional
TIEMPO
2 - Post-despliegue
ID del riesgo
mit452
Linea de dominio
1. Discriminación y Toxicidad
1.2 > Exposición a contenido tóxico
Estrategia de mitigacion
1. Implementación de un proceso de alineación y *safety tuning* de Modelos de Lenguaje Grande (LLM) que utilice *Child User Models* y *benchmarks* clínicamente validados. El objetivo es mitigar proactivamente la generación de contenido explícitamente perjudicial para menores, incluyendo la desinformación en salud mental y la promoción de autolesiones, asegurando el anclaje a guías clínicas (*Retrieval-Augmented Generation*) y la escalada inmediata en escenarios de crisis. 2. Adopción del principio de *Safety-by-Design* (Seguridad desde el Diseño) para integrar la protección del menor como requisito fundamental de la arquitectura de la plataforma. Esto incluye la configuración de ajustes de privacidad por defecto protectores, la restricción del procesamiento de datos personales a lo estrictamente necesario, la evitación de diseños que fomenten el uso compulsivo, y la limitación estricta de las funciones de comunicación entre adultos y menores no vinculados. 3. Establecimiento de sistemas accesibles, efectivos y transparentes para la supervisión parental y la notificación de daños (*reporting*), tal como lo exigen las normativas de seguridad en línea. Esto debe incluir herramientas robustas para que los adultos gestionen la privacidad y el uso de la cuenta, y mecanismos claros y con respuesta oportuna para que los usuarios (menores, familias, educadores) denuncien contenido o interacciones abusivas o ilícitas.
EVIDENCIA ADICIONAL
Si bien la preocupación por el daño a menores se subsume técnicamente en la [conducta ilícita], la diferenciamos debido a su crucial relevancia, universalmente reconocida tanto en el ámbito legal como en el ético.