O que é agent-browser?
O agent-browser é uma ferramenta de automação de navegador feita especialmente para agentes de IA. Em vez de saídas pesadas em JSON, ele gera um texto compacto e fácil de entender — perfeito para economizar tokens no contexto das inteligências artificiais. Escrito 100% em Rust, é rápido, leve e funciona direto do terminal.
Se você está criando agentes que precisam navegar na web, preencher formulários, tirar screenshots ou interagir com páginas, o agent-browser oferece uma forma eficiente e determinística de fazer isso, usando referências únicas (refs) para identificar elementos da página sem precisar reanalisar o DOM toda vez.
Quais são as características de agent-browser?
- Saída compacta otimizada para IA: Usa texto simples com apenas 200–400 tokens, contra milhares em representações tradicionais do DOM.
- Seleção por referência (ref): Cada elemento tem um ID único como
@e1, permitindo cliques e ações precisas sem ambiguidade. - Arquitetura cliente-daemon em Rust: CLI nativo super rápido com daemon persistente que gerencia o Chrome via Protocolo DevTools (CDP).
- Mais de 50 comandos integrados: Navegação, formulários, rede, armazenamento, screenshots e muito mais.
- Sessões isoladas: Execute múltiplas instâncias do navegador com autenticação separada.
- Multiplataforma: Funciona em macOS (ARM64/x64), Linux (ARM64/x64) e Windows (x64).
- Compatível com principais agentes de IA: Funciona com Claude, Cursor, GitHub Copilot, Gemini, OpenAI e outros que executam comandos shell.
Quais são os casos de uso de agent-browser?
- Automatizar tarefas web em agentes de IA sem sobrecarregar o contexto com dados desnecessários.
- Criar bots que navegam em sites de forma confiável usando referências estáveis aos elementos.
- Testar aplicações web diretamente do terminal com saída legível por humanos e máquinas.
- Integrar automação de navegador em fluxos de trabalho de programação assistida por IA.
- Capturar screenshots ou extrair conteúdo acessível de páginas para análise posterior.
- Gerenciar sessões de login distintas para testes paralelos ou contas múltiplas.
Como usar agent-browser?
- Instale globalmente com
npm install -g agent-browserou via Homebrew no macOS (brew install agent-browser). - Na primeira execução, rode
agent-browser installpara baixar uma versão compatível do Chrome. - Abra um site com
agent-browser open example.com. - Obtenha uma visão clara da página com
agent-browser snapshot -ipara ver elementos com refs como@e1. - Interaja usando as refs:
agent-browser click @e1ouagent-browser type @input "texto". - Feche a sessão quando terminar com
agent-browser close.









