Hate
Discurso de Odio
Generación automatizada o amplificación de contenido tóxico, acoso dirigido y discurso de odio mediante sistemas de IA, facilitando campañas de hostigamiento a escala.
Sayar Ghosh Roy, Ujwal Narayan, Tathagata Raha, Zubair Abid, Vasudeva Varma
Estrategia de Mitigación
Implementación de filtros de toxicidad con actualización continua, moderación híbrida humano-IA, sistemas de detección temprana de brigading, y consecuencias claras por abuso.
Número Atómico
49
Hz
ID del riesgo
in-49
Severidad
7/10
Nivel de Severidad