AI Agency Ladder: os 5 níveis explicados com diagnósticos práticos
Versão estendida do framework AI Agency Ladder com perguntas diagnósticas, sinais de cada nível e como destravar o salto entre eles.
A maioria das empresas brasileiras está entre L2 e L3 em 2026. Conversamos com C-suites que pagam Copilot para 200 funcionários e descobrem, três meses depois, que 15 deles usam de verdade. A licença, sozinha, não cria agência. Este artigo traz cada nível do AI Agency Ladder com diagnóstico operacional — você pede para alguém te contar como usou IA na semana passada, ouve a resposta, e o nível aparece sozinho.
L1 · Curiosity — “vi o video do ChatGPT, comecei a testar”
Sinal de campo: a pessoa cita uma única aplicação, fora de contexto, em geral assistida por demo viral do LinkedIn ou de um colega. Não tem prompt salvo, não tem prompt revisitado, ganho de produtividade é episódico.
Como destravar para L2: 90 minutos guiados, 1-1, com a pessoa fazendo seu próprio trabalho do dia. Não é treinamento em sala. É construir 3-5 prompts salvos que cobrem 60% do que ela faz repetidamente.
L2 · Individual fluency — “tenho minhas rotinas”
Sinal de campo: lista de 3-5 aplicações estáveis com modelo nominado (“uso Claude pra escrever, Copilot pra Excel, Gemini quando preciso de imagem”). Conhece um limite: “esse não responde bem em X, então uso o outro”.
Ganho de 20-40%, mas o ganho desaparece quando ela tira férias. O time volta ao baseline. É o nível mais comum em 2026 — e o mais comum de estagnar, porque a empresa nunca cobra evolução depois que comprou licença.
Como destravar para L3: forçar compartilhamento institucional. Templates de prompt em ferramenta compartilhada (Notion, GPT custom, Cowork). O ganho deixa de ser pessoal.
L3 · Team workflows — “temos fluxos”
Sinal de campo: a pessoa menciona o time e nomeia 1-3 fluxos recorrentes (“nosso fluxo de atendimento usa Claude no Slack via n8n”). Há um humano dono do prompt e há histórico de iteração.
Ganho de 40-80% em fluxos específicos. Não vai além porque governance ainda é informal — quem aprova prompt novo? Quem revisa output crítico?
Como destravar para L4: institucionalizar governance. Definir donos de fluxo, criteria de aprovação, métrica de impacto por fluxo. O passo aqui é organizacional, não técnico.
L4 · Departmental skills — “todo mundo da área usa”
Sinal de campo: a pessoa fala em métrica de departamento (“nosso CSAT subiu 12% depois que mudamos o fluxo de FAQ”). Há 5-10 fluxos institucionalizados, policy de governance escrita, donos nominados.
Ganho de 2-3× em capacidade de output sem aumentar headcount proporcional. Empresas brasileiras com 50-500 funcionários conseguem chegar a L4 em 12-18 meses se a liderança investe.
Como destravar para L5: plataforma de orquestração + harness engineering. Investimento ordem de grandeza maior. Não vale para empresa de 50 pessoas — vale para 500+ ou para empresa onde IA é diferencial competitivo central.
L5 · Organizational infrastructure — “IA é como o ERP”
Sinal de campo: a pessoa cita governance (“temos durable pause em ações de finance”), harness (“nosso failure corpus pegou esse bug semana passada”), ou produto interno (“rodamos no Cowork interno”). Existe um time de plataforma.
Ganho de 5-10× em capacidade de operação. Investimento equivalente a um time de plataforma (5-15 pessoas). Raro em 2026, mas factível em 18-24 meses para empresas que assumiram o compromisso.
A pergunta que diagnostica
Pergunte para quatro pessoas em níveis hierárquicos distintos: “me conta como você usou IA na semana passada”. A resposta agregada aponta o nível médio da organização. Variância alta entre as pessoas indica que a empresa tem L4 em uma área e L1 em outra — o que é comum e exige plano por área, não plano global.
O que vem depois
Diagnosticar não é mudar. Depois do diagnóstico vem o plano — qual investimento destrava cada salto, em que ordem, com que sponsor. Se você quer aprofundar o framework operacional para L5, leia Harness Stack. Para times saindo do L3 para o L4, Agent Trust Stack ajuda a decidir o que delegar.