🟢 Foundation

Pegada ambiental da IA: o que sabemos, o que ignoramos, o que muda em 2026

Estado real da pegada ambiental de IA generativa — energia, água, hardware. Dados verificáveis vs estimativas vagas. O que isso significa na hora de comprar ou rodar IA.

15 de maio de 2026 · 8 min · ai-governance

A pegada ambiental de IA virou tema corporativo em 2025-2026, dois anos depois do hype de ChatGPT, quando ESG officers começaram a pedir números reais para o board. Este artigo organiza o que sabemos com confiança, o que estimamos com erro grande, e o que muda na decisão de comprar/rodar IA.

Nada de “IA vai consumir energia do mundo todo” nem “IA não polui nada”. O meio do caminho honesto.

O que sabemos com confiança

Pre-training é energético. Treinar um modelo frontier consome dezenas de megawatts-hora. GPT-4, Claude Opus, Gemini Ultra demandam clusters dedicados de milhares de GPUs por semanas. Estimativas para GPT-4: ordem de 50-100 MWh por run de treinamento. Equivalente a alguns dias do consumo de uma cidade pequena brasileira.

Mas: isso é one-shot. Acontece uma vez por modelo. O custo amortizado por usuário, ao longo da vida útil do modelo, é pequeno.

Inferência (uso diário) é menor por chamada mas escala. Uma chamada ao Claude consome ordem de 0.5-3 Wh dependendo do modelo e do tamanho da resposta. Equivalente a alguns segundos de uso de uma lâmpada LED.

Multiplicado por bilhões de chamadas/dia globalmente, vira números relevantes — estimativas atuais colocam o consumo global de inferência de LLMs próximo de 0.5-2% do consumo de data centers globais.

Data centers consomem água. Para refrigeração. Microsoft, Google e Meta reportam consumo de bilhões de litros/ano nos data centers que rodam IA. Em regiões com escassez hídrica, isso é problema real.

O que estimamos com erro grande

Pegada por prompt. Os fornecedores não publicam por-prompt energy. Estimativas externas (Mistral, MIT, comunidade) variam de 0.3 Wh a 5 Wh por chamada — uma ordem de grandeza. Não compare estimativas casualmente; vá ao paper.

Comparação com outras atividades. “Um prompt = X buscas no Google” — esses números variam de 5× para 30×. Não há consenso porque metodologia varia. Use com ressalva.

Treinamento futuro. Modelos crescem. Mas ganho de eficiência também (distillation, quantização, hardware melhor). Net direction até 2030 é incerta — alguns relatórios projetam estabilização, outros projetam aumento exponencial.

O que muda em 2026

Pressão regulatória aumentando. UE AI Act exige disclosure de pegada para modelos de uso geral acima de certo threshold. Brasil ainda sem regulação específica, mas tendência ESG corporativa empurra na mesma direção.

Hardware mais eficiente chega. NVIDIA Blackwell, gerações de TPU 7+, ASICs especializados (Groq, Cerebras) entregam 3-5× tokens por watt. A inferência por chamada está caindo.

Modelos menores ganham espaço. SLMs (Phi, Mistral 7B, Gemma) cobrem cada vez mais casos com 10-100× menos energia. A decisão “frontier vs adequado” deixa de ser só custo — vira sustentabilidade também.

Refrigeração por água perde share. Microsoft anuncia data centers com refrigeração líquida fechada e water-loss zero. Padrão até 2027 entre majors.

O que isso significa para gestor brasileiro

Em 2026, três decisões mudam por causa do contexto ambiental:

1 · Modelo certo, não modelo maior. Para classificação de NF-e, um SLM resolve. Para parecer jurídico complexo, frontier model. Antes, “usa o maior” era default. Agora a pergunta é “qual o mínimo que entrega qualidade”.

2 · Cache obrigatório em volume. Reusar contexto entre chamadas reduz consumo em 50-90% para tasks repetidas. Em 2024 era otimização de custo; em 2026 também é ESG.

3 · Reporting começa a importar. Se sua empresa publica relatório ESG, IA entra no Escopo 3 indireto. Fornecedores começam a publicar pegada por unidade de consumo. Em 2027, vai ser default em RFP empresarial.

Onde a conversa exagera

“IA vai consumir toda a água do planeta” — não há base. Consumo é regional, mitigável, e em queda relativa com tecnologia nova.
“IA não polui porque é digital” — também falso. Toda inferência usa energia de algum lugar. Se o data center roda em mix energético sujo, a pegada é real.

Onde a conversa subestima

O hardware tem pegada de fabricação relevante. Cada GPU H100 tem ordem de 100-300 kg CO2eq embedded antes de ligar. Refresh cycles rápidos amplificam.
E-waste de hardware obsoleto após 3-5 anos de service-life ainda é tema mal tratado no setor.

Onde aprofundar

Se você está montando policy interna de IA, considere o cluster AI Governance que vai ter mais material sobre o lado ESG aplicado.