Agent Harness

A camada de engenharia que transforma a potência cega
do modelo em trabalho confiável.

Canal Sandeco

A palavra que nasceu na guerra

Século XIII: do francês antigo harneis, o equipamento e a armadura de combate.

"In full harness": o cavaleiro em armadura completa

harneis, em francês antigo, era o conjunto de apetrechos de guerra.

Equipamento, armadura, apetrechos de guerra

Elmo

Escudo

Espada

harneis (séc. XIII)

O arreio: a força bruta canalizada

Pegar uma força cega e canalizá-la com segurança para fazer trabalho útil.

O cavalo é o modelo; a carroça é a tarefa; o arreio é o harness

Sem arreio: cavalo forte e carroça parada, ou destroços arrastados.

Potência descontrolada vira trabalho confiável

Conecta

Controla

Mede

Monitora

To harness: aproveitar e controlar uma força

Hoje: pegar uma força bruta e canalizá-la com segurança para fazer trabalho útil.

Harness the wind, harness solar energy

A ideia é sempre a mesma: dominar uma potência e transformá-la em trabalho.

Força bruta canalizada vira trabalho útil

Vento

Sol

Energia

Trabalho útil

O harness é o Claude Code; o modelo é o Claude

Como o vento que o arreio canaliza: a força é do modelo, o trabalho útil é do harness.

Citação: documentação oficial do Claude Code

O harness é tudo o que envolve o modelo; o modelo é só o miolo.

A força é do modelo; o trabalho útil é do harness

Claude é a força bruta

Claude Code canaliza

Trabalho útil

Definição oficial

Não é só harness ali dentro

Claude Code, Codex e Antigravity empacotam várias camadas; o harness é uma delas.

Por dentro de um agente pronto

Scaffold monta antes do prompt; o harness orquestra em runtime; o modelo é o motor.

Harness é uma das camadas, não o produto inteiro

Scaffold

Harness

Modelo

Runtime e UI

Agent harness: só uma expressão?

Mesma raiz de 'harness'; o 'agent' diz a quem o arreio serve, e muda a ênfase.

Harness é a raiz; agent harness é o caso especializado

O 'cavalo' agora é um agente que age: chama ferramentas, navega, escreve.

agent harness: harness + um agente que age

Mesma raiz: arreio

'agent' = quem age

Controla durante

Não só avalia no fim

A anatomia de um agent harness

No centro, a LLM, o motor; em volta, tudo que falta para virar um veículo.

Um conjunto de componentes ao redor do modelo

Tool registry, contexto, memória, agent loop, verifier, retries, logging, guardrails, handlers.

Um motor dentro de um harness

Tool registry

Context

Memory

Agent loop

Verifier

Harness pronto você adota, o seu você constrói

Claude Code, Codex e Antigravity são harnesses prontos; o do seu problema, você constrói por cima.

Pronto você adota; o do seu problema, você constrói

Harnesses prontos também viram commodity; o sob medida é a vantagem.

Quem domina o harness domina o que ninguém tem

Sob medida

Específico do problema

Por cima do pronto

Vantagem real

Do test harness ao agent harness

Avaliar no fim não basta para um sistema que age no mundo.

Dois sentidos da mesma palavra

ML clássico mede depois; AI Engineering controla durante.

A passagem de era: do passivo ao que age

Test harness

Eval e benchmark

Controla durante

Corrige em execução

Não toquei no prompt nem uma vez

O agente bateu na tela de login, e mentiu que tinha votado.

O problema parecia de prompt; a solução foi de harness

Detecção, verificação, handler determinístico, devolução de controle.

Prompt resolve intenção; harness resolve confiança

Detectar

Verificar

Handler determinístico

Devolver controle

Prompt resolve intenção, harness resolve confiança

Eles não competem: operam em camadas diferentes.

A divisão de trabalho que organiza o capítulo

Quanto melhor o harness, menos você depende de um modelo gigante.

Um harness forte extrai trabalho confiável de um modelo mediano

Prompt = intenção

Harness = confiança

Operam em camadas

Harness forte vence

Harness não é guardrail

Um guardrail é uma peça do harness, não o harness inteiro.

GUARDRAIL

limita

VS

HARNESS

ajuda a executar

Limita e restringe

O que faz

Ajuda a executar

Limite de passos, teto de custo, schema

Exemplos

Contexto, memória, retries, verificação

É uma peça do harness

Relação

É o conjunto inteiro

Os limites de voo

Analogia

O cockpit inteiro

Os guardrails estão dentro do cockpit

Limita = guardrail

Ajuda = harness

Peça vs sistema

Quatro guardrails, e por que o prompt é o mais fraco

A diferença de robustez entre eles é enorme.

Nem todo guardrail nasce igual

Tire a decisão do modelo: coloque no código, na política ou no runtime.

Prompt é para intenção, não para garantia

Prompt (frágil)

Código

Política

Runtime

Por que o prompt é o guardrail mais fraco

Código, política e runtime impedem; o prompt só pede por favor.

Quatro barreiras sob o mesmo teste de estresse

Trancar a porta com um bilhete "por favor, não entre" não segura ninguém.

Tire a decisão do modelo: prompt é para intenção, não para garantia

Prompt: apela

Código: impede

Política: centraliza

Runtime: intercepta

Quando o LLM falha: o ponto único

Cai, estoura o tempo, devolve lixo ou inventa: confiar num só modelo é frágil.

Por que um único modelo não basta

Modelos falham de várias formas, e a aplicação quebra junto.

Um único modelo é um ponto único de falha

Cai / fora do ar

Timeout

Resposta-lixo

Alucina / mente

Catálogo de modelos: a rede de segurança

Os modelos entram numa lista ordenada: o primário e as reservas.

Se o primário cai, a próxima reserva assume

gpt-pequeno, claude-medio e llama-local, em ordem de preferência.

MODELOS = [ primário, ...reservas ]

gpt-pequeno (primário)

claude-medio (reserva)

llama-local (reserva)

failover automático

Tenta e verifica: sem confiar no modelo

Retries absorvem a falha passageira; o verifier confere o resultado real.

O verifier decide se a resposta presta

Vazia, com 'ERRO' ou curta demais é reprovada, e o laço tenta de novo.

resposta_valida(texto): não confia na palavra do modelo

Chamar

Retry

Critério objetivo

Veredito

Failover automático: a app nem percebe

Se um modelo cai, o harness troca sozinho; a aplicação recebe sempre resposta verificada.

O laço percorre o catálogo até uma resposta passar

A aplicação chama a mesma função e não sabe qual modelo respondeu.

a aplicação recebe sempre uma resposta verificada

Pedido entra 1x

Tenta + verifica

Troca de modelo

Resposta verificada

A definição de AI harness

A camada de engenharia que torna a execução confiável, auditável e controlável.

Com a peça inteira na mão, a definição que sustenta o capítulo

O agente é o motor; o harness é o chassi, o cinto, o freio e o painel.

Envolve o modelo e torna a execução confiável

Ferramentas

Contexto

Limites

Verificadores

Determinístico