Agent Trust Stack: cinco dimensões para decidir qual tarefa delegar a qual agente diagram

As cinco dimensões

1 · Reversibility (“dá pra desfazer?”). Escala de 0 a 3: irreversível (deploy prod, transferência bancária, envio em massa), reversível com custo alto (criar issue público, postar em comunidade), reversível com custo baixo (criar branch local, gerar rascunho), totalmente reversível (rodar query SELECT, ler arquivo). Reversibility baixa exige durable pause sempre.

2 · Blast radius (“quem é afetado?”). Escala de 0 a 3: somente o agente (sandbox isolado), o agente + ambiente local (worktree), o agente + sistema compartilhado (repo, banco staging), o agente + usuários reais (produção, comunidade, finanças). Blast radius alto + reversibility baixa é zona de durable pause obrigatória.

3 · Auditability (“dá pra reconstruir o que aconteceu?”). Escala de 0 a 3: trace inexistente, trace parcial (apenas LLM call log), trace estruturado (input, output, tool calls, timing), trace + provenance verificável (assinatura, hash, link a corpus). Tarefas com auditability baixa devem ser bloqueadas em ambientes regulados (LGPD, SOC 2).

4 · Cost (“quanto custa rodar?”). Escala de 0 a 3: trivial (<$0.01), normal ($0.01-$1), caro ($1-$100), alto risco ($100+). Cost alto sem confidence gating é receita para runaway loop.

5 · Time (“quanto tempo o agente pode gastar?”). Escala de 0 a 3: instantâneo (<10s), normal (10s-2min), longo (2-30min), background (30min+). Time alto exige checkpoint periódico ou advisor consulta.

Como aplicar

Para cada tipo de tarefa que um agente vai receber, marque a escala em cada dimensão. Soma 0-5: autonomia total. Soma 6-10: autonomia com durable pause em ações específicas. Soma 11-15: bloqueio, exige humano no loop.

O erro comum é tratar tudo no mesmo agente com o mesmo policy. Trust Stack força a decompor: o mesmo agente Claude Code que tem autonomia para git status deve ter durable pause em git push --force e bloqueio em rm -rf. A policy se aplica à tarefa, não ao agente.

Use cases que aplicam Agent Trust Stack

OpenClaw — gateway que aplica Agent Trust Stack em nível de canal: WhatsApp tem reversibility menor do que ticket interno; threshold sobe.

Posts relacionados

Agent Trust Stack: quando confiar qual agente com qual tarefa
Harness Stack — Trust Stack assume harness presente; sem harness, todas as dimensões caem.
Prompt Infection Taxonomy — vetores que reduzem Auditability mesmo com harness bem feito.

Quando usar

Decidir o policy de autonomia de um agente Claude Code, Cowork ou n8n.
Audit de incidente em que o agente fez algo que não deveria — qual dimensão foi ignorada?
Briefing para AI engineer sobre delegação segura em multi-agent system.

Quando NÃO usar

Chatbot puramente conversacional sem efeitos no mundo — overhead desnecessário.
Decisão de qual modelo usar (Claude vs Copilot vs Gemini) — esse é outro tipo de decisão, use AI Agency Ladder.