Volver a la tabla periodica
49in-49
Hz

Hate

Severidad7/10

Discurso de Odio

Generación automatizada o amplificación de contenido tóxico, acoso dirigido y discurso de odio mediante sistemas de IA, facilitando campañas de hostigamiento a escala.

Ficha periodicaSociedadarXiv2021

Sayar Ghosh Roy, Ujwal Narayan, Tathagata Raha, Zubair Abid, Vasudeva Varma

Estrategia de Mitigación

Implementación de filtros de toxicidad con actualización continua, moderación híbrida humano-IA, sistemas de detección temprana de brigading, y consecuencias claras por abuso.

Número Atómico

49

Hz

ID del riesgo

in-49

Severidad

7/10

Nivel de Severidad

49
Sociedad
in-49
Hz

Hate

Discurso de Odio

RiesgosIA.org
Sociedad • #49

Discurso de Odio

Hz
Nivel de Severidad7/10

Definición

Generación automatizada o amplificación de contenido tóxico, acoso dirigido y discurso de odio mediante sistemas de IA, facilitando campañas de hostigamiento a escala.

Estrategia de Mitigación

Implementación de filtros de toxicidad con actualización continua, moderación híbrida humano-IA, sistemas de detección temprana de brigading, y consecuencias claras por abuso.

Notas / Observaciones

1.
2.
3.
4.
5.
RiesgosIA.org • Tabla Periódica de Riesgos de IARiesgosIA.org