Volver a la tabla periodica
74w-74
Sc

Scraping

Severidad5/10

Scraping Ilegal

Extracción masiva de datos de sitios web para entrenamiento de modelos ignorando robots.txt, términos de servicio y derechos de propiedad de los datos.

Ficha periodicaLegalarXiv2025

Chung Peng Lee, Rachel Hong, Harry H. Jiang, Aster Plotnik, William Agnew, Jamie Morgenstern

Estrategia de Mitigación

Desarrollo y adopción de protocolos web de consentimiento específicos para IA (ej: robots.txt extendido), consecuencias legales por scraping no autorizado, y respeto a opt-out.

Número Atómico

74

Sc

ID del riesgo

w-74

Severidad

5/10

Nivel de Severidad

74
Legal
w-74
Sc

Scraping

Scraping Ilegal

RiesgosIA.org
Legal • #74

Scraping Ilegal

Sc
Nivel de Severidad5/10

Definición

Extracción masiva de datos de sitios web para entrenamiento de modelos ignorando robots.txt, términos de servicio y derechos de propiedad de los datos.

Estrategia de Mitigación

Desarrollo y adopción de protocolos web de consentimiento específicos para IA (ej: robots.txt extendido), consecuencias legales por scraping no autorizado, y respeto a opt-out.

Notas / Observaciones

1.
2.
3.
4.
5.
RiesgosIA.org • Tabla Periódica de Riesgos de IARiesgosIA.org