Este é meu terminal agora.

13 agentes Claude Code, cada um em seu próprio painel tmux, trabalhando no mesmo codebase. Não como experimento. Não como demonstração de força. É assim que eu entrego software todos os dias.
O projeto é o Beadbox, um dashboard em tempo real para monitorar agentes de IA de programação. Ele é construído pela mesma frota de agentes que monitora. Os agentes escrevem o código, testam, revisam, empacotam e entregam. Eu coordeno.
Se você está rodando mais de dois ou três agentes e se perguntando como acompanhar o que todos estão fazendo, esse é o modelo no qual cheguei após meses de iteração. Um bug foi reportado às 9h e o fix foi enviado às 15h, enquanto quatro outros fluxos de trabalho rodavam em paralelo. Nem sempre funciona perfeitamente, mas a produtividade é real.
O elenco
Cada agente tem um arquivo CLAUDE.md que define sua identidade, o que ele tem responsabilidade, o que não tem, e como se comunica com outros agentes. Não são assistentes genéricos "faz-tudo". Cada um tem uma função estreita e limites explícitos.
| Grupo | Agentes | O que eles cuidam |
|---|---|---|
| Coordenação | super, pm, owner | Despacho de trabalho, specs de produto, prioridades de negócio |
| Engenharia | eng1, eng2, arch | Implementação, design de sistema, suites de teste |
| Qualidade | qa1, qa2 | Validação independente, portões de qualidade para release |
| Operações | ops, shipper | Testes de plataforma, builds, execução de release |
| Crescimento | growth, pmm, pmm2 | Analytics, posicionamento, conteúdo público |
A palavra-chave é limites. eng2 não pode fechar issues. qa1 não escreve código. pmm nunca toca no código fonte da app. Super despacha trabalho mas não implementa. Os limites existem porque sem eles, os agentes derivam. Eles "ajudam" refatorando código que não precisava de refatoração, ou fechando issues que não estavam verificados, ou tomando decisões arquiteturais para as quais não estão qualificados.
Cada CLAUDE.md começa com um parágrafo de identidade e uma seção de limites. Aqui vai uma versão abreviada do que eng2 tem:
## Identity
Engineer for Beadbox. You implement features, fix bugs, and write tests. You own implementation quality: the code you write is correct, tested, and matches the spec.
## Boundary with QA
QA validates your work independently. You provide QA with executable verification steps. If your DONE comment doesn't let QA verify without reading source code, it's incomplete.
Esse padrão escala. Quando comecei com 3 agentes, eles podiam compartilhar um único prompt genérico. Com 13, roles explícitos e protocolos são a diferença entre coordenação e caos.
A camada de coordenação
Três ferramentas sustentam a frota.
beads é um issue tracker open-source e Git-nativo construído exatamente para esse workflow. Cada tarefa é um "bead" com status, prioridade, dependências e um thread de comentários. Os agentes leem e escrevem no mesmo banco de dados local através de um CLI chamado bd.
bd update bb-viet --claim --actor eng2 # eng2 reivindica um bug
bd show bb-viet # ver o spec completo + comentários
bd comments add bb-viet --author eng2 "PLAN: ..." # eng2 posta seu plano
gn / gp / ga são ferramentas de mensagem para tmux. gn envia uma mensagem para o painel de outro agente. gp espia o output recente de outro agente (sem interrompê-lo). ga enfileira uma mensagem não urgente.
gn -c -w eng2 "[from super] You have work: bb-viet. P2." # despacho
gp eng2 -n 40 # checar progresso
ga -w super "[from eng2] bb-viet complete. Pushed abc123." # reportar
Protocolos CLAUDE.md definem caminhos de escalação, formato de comunicação e critérios de conclusão. Cada agente sabe: reivindicar o bead, comentar seu plano antes de programar, rodar testes antes de fazer push, comentar DONE com passos de verificação, marcar ready for QA, reportar ao super.
Veja como isso funciona na prática. Este é um bead real de hoje cedo: super atribui a tarefa, eng2 comenta um plano numerado, eng2 comenta DONE com passos de verificação de QA e critérios de aceitação marcados, super despacha para QA.

Super roda um loop de patrulha a cada 5-10 minutos: espiar o output de cada agente ativo, verificar o status do bead, confirmar que o pipeline não travou. É como uma rotação de plantão em produção, exceto que os serviços são agentes de IA e os incidentes são "eng2 está suspeitosamente quieto há 20 minutos."
Um dia real
Isso é o que aconteceu em uma quarta-feira no final de fevereiro de 2026.
9:14 - Um usuário do GitHub chamado ericinfins abre a Issue #2: ele não consegue conectar o Beadbox ao seu servidor remoto de Dolt. A app só suporta conexões locais. Owner vê e sinaliza para super.
9:30 - Super despacha o trabalho. Arch projeta um fluxo de auth de conexão (toggle de TLS, campos de usuário/senha, passagem de variáveis de ambiente). PM escreve o spec com critérios de aceitação. Eng assume e começa a implementar.
Enquanto isso, em paralelo:
PM registra dois bugs descobertos durante os testes de release. Um é cosmético: o badge do header mostra "v0.10.0-rc.7" em vez de "v0.10.0" em builds finais. O outro é específico de plataforma: a ferramenta de captura de tela retorna uma faixa em branco em Macs ARM64 porque o Apple Silicon renderiza o WebView do Tauri via composição Metal, e o backing store está vazio.
Ops encontra a causa do bug de captura. A correção é elegante: após a captura, verificar se a altura da imagem é suspeitosamente pequena (menos de 50px para uma janela que deveria ter 800px de altura), e recorrer a captura baseada em coordenadas de tela.
Growth puxa dados do PostHog e roda uma análise de correlação de IP. A descoberta: anúncios no Reddit geraram 96 cliques e zero usuários retidos atribuíveis. O tráfego do README do GitHub converte a 15.8%. Este artigo existe por causa dessa análise.
Eng1, desbloqueado pelo design do Activity Dashboard do arch, começa a construir gerenciamento de estado de filtros cruzados e funções utilitárias. 687 testes passando.
QA1 valida o fix do badge do header: levanta um servidor de teste, usa automação de navegador para verificar que o badge renderiza corretamente, confirma que 665 testes unitários passam, marca PASS.
14:45 - Shipper faz merge do PR do release candidate, faz push da tag v0.10.0 e dispara o workflow de promoção. CI constrói artefatos para as 5 plataformas (macOS ARM, macOS Intel, Linux AppImage, Linux .deb, Windows .exe). Shipper verifica cada artefato, atualiza as notas de release em ambos repos, faz redeploy do site e atualiza o cask do Homebrew.
15:12 - Owner responde no GitHub Issue #2:
Boas notícias: v0.10.0 acabou de ser lançada com suporte completo de auth para servidor Dolt. Atualize e você deve estar desbloqueado.
Bug reportado de manhã. Fix enviado de tarde. E enquanto isso acontecia, a próxima feature já estava sendo projetada, outro bug estava sendo investigado, analytics estavam sendo analisados, e QA estava verificando independentemente outro fix.
Isso não é porque 13 agentes são rápidos. É porque 13 agentes são paralelos.

