Agent Trust Stack: cinco dimensiones para decidir qué tarea delegar a qué agente diagram

Las cinco dimensiones

1 · Reversibility (“¿se puede deshacer?”). Escala 0 a 3: irreversible (deploy prod, transferencia bancaria, envío masivo), reversible con costo alto (crear issue público, postear en comunidad), reversible con costo bajo (crear branch local, generar borrador), totalmente reversible (correr query SELECT, leer archivo). Reversibility baja exige durable pause siempre.

2 · Blast radius (“¿a quién afecta?”). Escala 0 a 3: solo el agente (sandbox aislado), el agente + ambiente local (worktree), el agente + sistema compartido (repo, base staging), el agente + usuarios reales (producción, comunidad, finanzas). Blast radius alto + reversibility baja es zona de durable pause obligatoria.

3 · Auditability (“¿se puede reconstruir lo que pasó?”). Escala 0 a 3: trace inexistente, trace parcial (solo LLM call log), trace estructurado (input, output, tool calls, timing), trace + provenance verificable (firma, hash, link a corpus). Tareas con auditability baja deben bloquearse en ambientes regulados (LGPD, SOC 2).

4 · Cost (“¿cuánto cuesta correr?”). Escala 0 a 3: trivial (<$0.01), normal ($0.01-$1), caro ($1-$100), alto riesgo ($100+). Cost alto sin confidence gating es receta para runaway loop.

5 · Time (“¿cuánto tiempo puede correr el agente?”). Escala 0 a 3: instantáneo (<10s), normal (10s-2min), largo (2-30min), background (30min+). Time alto exige checkpoint periódico o consulta al advisor.

Cómo aplicarlo

Para cada tipo de tarea que recibirá un agente, marca la escala en cada dimensión. Suma 0-5: autonomía total. Suma 6-10: autonomía con durable pause en acciones específicas. Suma 11-15: bloqueo, exige humano en el loop.

El error común es tratar todo en el mismo agente con el mismo policy. Trust Stack obliga a descomponer: el mismo agente Claude Code que tiene autonomía para git status debe tener durable pause en git push --force y bloqueo en rm -rf. El policy se aplica a la tarea, no al agente.

Use cases que aplican Agent Trust Stack

OpenClaw — gateway que aplica Agent Trust Stack a nivel de canal: WhatsApp tiene reversibility menor que un ticket interno; el threshold sube.

Posts relacionados

Agent Trust Stack: cuándo confiar qué agente con qué tarea
Harness Stack — Trust Stack asume harness presente; sin harness, todas las dimensiones caen.
Prompt Infection Taxonomy — vectores que reducen Auditability incluso con harness bien hecho.

Cuándo usar

Decidir el policy de autonomía de un agente Claude Code, Cowork o n8n.
Auditoría de incidente en que el agente hizo algo que no debería — ¿qué dimensión se ignoró?
Briefing para AI engineer sobre delegación segura en multi-agent system.

Cuándo NO usar

Chatbot puramente conversacional sin efectos en el mundo — overhead innecesario.
Decisión de qué modelo usar (Claude vs Copilot vs Gemini) — esa es otra decisión, usa AI Agency Ladder.