Volver al repositorio MIT
1. Discriminación y Toxicidad2 - Post-despliegue

Contenido Sexual

Contenido Sexual. La política permite respuestas que informen, alienten o respalden actos sexuales consensuales, así como la descripción clínica y neutral de órganos, actos o fluidos sexuales. Es estrictamente inaceptable la generación de pornografía o la participación del modelo en un chat erótico directo (cibersexo).

Fuente: MIT AI Risk Repositorymit820

ENTIDAD

2 - IA

INTENCIÓN

3 - Otro

TIEMPO

2 - Post-despliegue

ID del riesgo

mit820

Linea de dominio

1. Discriminación y Toxicidad

156 riesgos mapeados

1.2 > Exposición a contenido tóxico

Estrategia de mitigacion

1. Prioridad Alta: Implementación de Sistemas de Detección Proactiva y Clasificación Reforzada Se requiere el despliegue de modelos de machine learning avanzados (clasificadores) que operen en tiempo real para la identificación y bloqueo categórico de contenido pornográfico o la participación en "cibersexo" (chat erótico directo), tal como lo define la política. Estos sistemas deben ser calibrados con precisión para distinguir el discurso clínico o informativo permitido sobre sexualidad de las infracciones explícitas, minimizando los falsos positivos en el contenido aceptable. 2. Control de Acceso y Configuración por Defecto (Age-Gating) Establecer un sistema de control de edad riguroso (age-gating) o, en su defecto, configurar la experiencia del usuario para que el contenido de naturaleza sexual imprevista esté oculto por defecto, requiriendo múltiples acciones explícitas del usuario adulto para su visualización. Esto se debe realizar en estricta consonancia con los requisitos de protección de menores y las mejores prácticas de la industria. 3. Transparencia de la Política y Mecanismos de Denuncia Eficaces Garantizar la máxima claridad en las Directrices Comunitarias respecto a los límites del contenido sexual permitido y, crucialmente, proporcionar a los usuarios herramientas accesibles y con alta visibilidad para la denuncia instantánea y el bloqueo de interacciones que infrinjan la prohibición de cibersexo o pornografía.