🟢 Foundation

Huella ambiental de la IA: lo que sabemos, lo que ignoramos, lo que cambia en 2026

Estado real de la huella ambiental de la IA generativa — energía, agua, hardware. Datos verificables vs estimaciones vagas. Qué significa al comprar o correr IA.

15 de mayo de 2026 · 8 min · ai-governance

La huella ambiental de la IA se volvió tema corporativo en 2025-2026, dos años después del hype de ChatGPT, cuando los ESG officers empezaron a pedir números reales al board. Este artículo organiza lo que sabemos con confianza, lo que estimamos con error grande, y lo que cambia en la decisión de comprar/correr IA.

Nada de “la IA va a consumir toda la energía del mundo” ni “la IA no contamina”. El medio honesto.

Lo que sabemos con confianza

El pre-training es energético. Entrenar un modelo frontier consume decenas de megawatts-hora. GPT-4, Claude Opus, Gemini Ultra demandan clusters dedicados de miles de GPUs por semanas. Estimaciones para GPT-4: orden de 50-100 MWh por run de entrenamiento. Equivale a algunos días de consumo de una ciudad pequeña.

Pero: es one-shot. Pasa una vez por modelo. El costo amortizado por usuario a lo largo de la vida útil del modelo es pequeño.

La inferencia (uso diario) es menor por llamada pero escala. Una llamada a Claude consume orden de 0,5-3 Wh dependiendo del modelo y tamaño de respuesta. Equivale a algunos segundos de uso de lámpara LED.

Multiplicado por billones de llamadas/día globales, vuelve números relevantes — estimaciones actuales sitúan el consumo global de inferencia de LLMs cerca de 0,5-2% del consumo de data centers globales.

Los data centers consumen agua. Para refrigeración. Microsoft, Google y Meta reportan consumo de miles de millones de litros/año. En regiones con escasez hídrica, es problema real.

Lo que estimamos con error grande

Huella por prompt. Los proveedores no publican por-prompt energy. Estimaciones externas varían de 0,3 Wh a 5 Wh por llamada — un orden de magnitud. No compares estimaciones casualmente; ve al paper.

Comparación con otras actividades. “Un prompt = X búsquedas en Google” — esos números varían de 5× a 30×. No hay consenso porque metodología varía. Usa con reserva.

Entrenamiento futuro. Los modelos crecen. Pero la ganancia de eficiencia también (distillation, quantización, mejor hardware). Dirección neta hasta 2030 incierta.

Lo que cambia en 2026

Presión regulatoria aumentando. EU AI Act exige disclosure de huella para modelos de uso general arriba de cierto threshold. Otras jurisdicciones tienden en la misma dirección.

Hardware más eficiente llegando. NVIDIA Blackwell, generaciones de TPU 7+, ASICs especializados (Groq, Cerebras) entregan 3-5× tokens por watt. La inferencia por llamada está cayendo.

Modelos menores ganan espacio. SLMs (Phi, Mistral 7B, Gemma) cubren cada vez más casos con 10-100× menos energía. La decisión “frontier vs adecuado” deja de ser solo costo — también es sostenibilidad.

Refrigeración por agua pierde share. Microsoft anuncia data centers con refrigeración líquida cerrada y water-loss cero. Estándar hasta 2027 entre majors.

Lo que significa para gestor

En 2026, tres decisiones cambian por el contexto ambiental:

1 · Modelo adecuado, no modelo mayor. Para clasificación de factura, un SLM resuelve. Para dictamen jurídico complejo, frontier model. Antes “usa el más grande” era default. Ahora la pregunta es “cuál es el mínimo que entrega calidad”.

2 · Cache obligatorio en volumen. Reusar contexto entre llamadas reduce consumo en 50-90% para tareas repetidas. En 2024 era optimización de costo; en 2026 también es ESG.

3 · Reporting empieza a importar. Si tu empresa publica informe ESG, la IA entra en el Scope 3 indirecto. Los proveedores empiezan a publicar huella por unidad de consumo. En 2027 será default en RFP empresarial.

Dónde la conversación exagera

“La IA va a consumir toda el agua del planeta” — sin base. El consumo es regional, mitigable y en caída relativa con tecnología nueva.
“La IA no contamina porque es digital” — también falso. Toda inferencia usa energía de algún lugar. Si el data center corre en mix energético sucio, la huella es real.

Dónde la conversación subestima

El hardware tiene huella de fabricación relevante. Cada GPU H100 tiene orden de 100-300 kg CO2eq embedded antes de encender. Refresh cycles rápidos amplifican.
E-waste de hardware obsoleto después de 3-5 años de service-life aún es tema mal tratado en el sector.

Dónde profundizar

Si estás montando policy interna de IA, considera el cluster AI Governance que tendrá más material sobre el lado ESG aplicado.