Environmental harms from operation LMs
El despliegue de modelos de aprendizaje automático a gran escala, incluidos los Modelos de Lenguaje (ML), acarrea la posibilidad de generar costes ambientales significativos. Estos se concretan en tres áreas críticas: la ingente demanda de energía, las consecuentes emisiones de carbono derivadas de su entrenamiento y operación, y el sustancial requerimiento de agua dulce para la refrigeración de los centros de datos donde se ejecutan los procesos computacionales (Mytton, 2021; Patterson et al., 2021)
ENTIDAD
2 - IA
INTENCIÓN
2 - Involuntario
TIEMPO
3 - Otro
ID del riesgo
mit253
Linea de dominio
6. Socioeconómico y Ambiental
6.6 > Daño ambiental
Estrategia de mitigacion
1. Evitación y Minimización Intrínseca (Diseño de Modelos Eficientes) Fomentar la adopción de un cambio de paradigma hacia el uso de modelos de lenguaje (ML) más compactos y arquitecturas optimizadas (*e.g.*, DistilBERT, redes ligeras) en lugar de modelos a gran escala, junto con la implementación de técnicas de *fine-tuning* eficiente (*e.g.*, LoRA). Esto se prioriza por su capacidad para **evitar** la generación de un alto consumo energético desde el inicio, reduciendo significativamente la demanda de cómputo y recursos. 2. Optimización Algorítmica y de Infraestructura (Reducción del Consumo Operacional) Aplicar técnicas de optimización *post-entrenamiento* como la cuantización (*quantization*) o el *model pruning* para **minimizar** la demanda energética durante la fase de inferencia. De forma complementaria, en la infraestructura, implementar sistemas de refrigeración de alta eficiencia (*e.g.*, enfriamiento líquido de circuito cerrado o por aire) y utilizar estrategias de gestión del agua, como el uso de agua reciclada o la evitación de enfriamiento evaporativo en áreas de estrés hídrico, para **reducir** el consumo hídrico de los centros de datos. 3. Mitigación de Impacto Residual (Compensación y Fuentes Sostenibles) **Compensar** el impacto residual inevitable asegurando que los centros de datos operen exclusivamente con fuentes de energía renovable y sostenible. Además, establecer y cumplir objetivos de reposición hídrica (*water positive*) para retornar a la cuenca hidrográfica local una cantidad de agua dulce superior a la consumida, abordando así los daños ambientales que no pudieron ser evitados o minimizados en las etapas previas.
EVIDENCIA ADICIONAL
Los riesgos medioambientales asociados a los Modelos de Lenguaje (ML) no solo emergen durante su entrenamiento, sino incluso antes: por ejemplo, al construir la infraestructura de *hardware* necesaria para ejecutar sus cálculos (Crawford, 2021). Esto incluye, por supuesto, la energía y los recursos consumidos durante la propia formación de los ML (Bender et al., 2021; Patterson et al., 2021; Schwartz et al., 2020; Strubell et al., 2019). Sin embargo, es crucial notar que el enfoque de esta sección y del informe más amplio se centra específicamente en los riesgos de daño que se producen en el momento de operar el modelo.