¿Qué es agent-browser?
agent-browser es una herramienta de automatización de navegadores diseñada específicamente para agentes de inteligencia artificial. En lugar de generar salidas largas y complejas, ofrece resultados en texto compacto que consumen menos tokens, lo que la hace ideal para integrar con modelos de lenguaje como los usados por Claude, Copilot o Gemini. Escrita completamente en Rust, es rápida, ligera y funciona sin problemas en macOS, Linux y Windows.
Su enfoque único se basa en usar referencias (como @e1, @e2) para identificar elementos de la página, lo que permite a los agentes de IA interactuar con sitios web de forma precisa y eficiente, sin necesidad de analizar árboles DOM gigantescos ni escribir selectores complicados.
¿Cuáles son las características de agent-browser?
- Salida compacta optimizada para IA: Reduce el uso de contexto al entregar solo la información esencial en formato de texto legible.
- Sistema basado en referencias (refs): Cada elemento tiene un ID único (@e1, @e2), lo que garantiza selección determinista y evita errores comunes en la automatización.
- Escrito 100% en Rust: Ofrece velocidad nativa, bajo consumo de recursos y arranque instantáneo.
- Soporte multiplataforma: Disponible para macOS (ARM64/x64), Linux (ARM64/x64) y Windows (x64).
- Arquitectura cliente-demonio: El demonio se ejecuta en segundo plano y reutiliza sesiones, mejorando el rendimiento entre comandos.
- Más de 50 comandos integrados: Navegación, formularios, capturas de pantalla, gestión de red, almacenamiento y más.
- Compatibilidad con múltiples proveedores: Funciona con Browserbase, Browserless, Chrome local y otros motores.
¿Cuáles son los casos de uso de agent-browser?
- Automatizar tareas repetitivas en la web desde un agente de IA sin sobrecargar su contexto.
- Extraer datos estructurados de páginas web usando referencias estables en lugar de XPath o CSS selectors frágiles.
- Realizar pruebas funcionales rápidas desde la terminal con salida legible para humanos y máquinas.
- Integrar navegación web en flujos de trabajo de desarrollo asistidos por IA (como en Cursor o GitHub Copilot).
- Gestionar sesiones aisladas para pruebas con diferentes cuentas o estados de autenticación.
- Depurar interacciones web en tiempo real con modo CDP (Chrome DevTools Protocol).
¿Cómo usar agent-browser?
- Instala con
npm install -g agent-browserobrew install agent-browseren macOS. - Ejecuta
agent-browser installla primera vez para descargar Chrome automáticamente. - Abre un sitio con
agent-browser open example.com. - Obtén una vista compacta con
agent-browser snapshot -ipara ver elementos con sus refs. - Haz clic en un enlace usando su referencia:
agent-browser click @e2. - Guarda una captura con
agent-browser screenshot page.pngy cierra conagent-browser close.









