最佳浏览器 Agent Top 20
精选 20 个最受欢迎的开源浏览器 Agent项目,按 GitHub Stars 排名。
browser-use
93.4k Starsbrowser-use 提供浏览器自动化 Agent 能力,让 LLM 可以理解页面并执行复杂网页操作。
Scrapling
48.9k Stars自适应 Web 爬虫框架,智能应对反爬机制,从单次请求到大规模爬取均可处理,专为 AI Agent 数据采集设计。
Chrome DevTools MCP
39.3k Stars为编程 Agent 提供浏览器开发者工具能力的 MCP 服务器,支持网页调试、性能分析和 DOM 操作自动化。
GitNexus
37.7k Stars零服务器代码智能引擎,完全在浏览器中运行的客户端知识图谱创建工具,内置 Graph RAG 智能体用于代码探索。
UI-TARS Desktop
33.0k Stars字节跳动开源的多模态 AI Agent 栈,连接前沿 AI 模型与 Agent 基础设施,支持 GUI 自动化和电脑操作。
Agent Browser
32.7k StarsVercel 开源的浏览器自动化 CLI 工具,专为 AI Agent 设计,基于 Rust 构建,高性能且可编程。
Lightpanda Browser
30.2k StarsLightpanda Browser 是面向自动化和爬取场景的轻量浏览器运行时,目标是在无头任务中提供比传统浏览器更低的资源开销。它适合大规模 Web Agent、网页抽取和自动化测试,把浏览器能力嵌入后端工作流。
AgenticSeek
26.3k Stars完全本地化的 Manus AI 替代方案,支持自主浏览网页、编写代码和语音交互,无需任何 API 费用
Open-AutoGLM
25.2k StarsOpen-AutoGLM 是一个开放的手机 Agent 模型与框架,支持 AI 自主操控手机界面完成任务,解锁 AI Phone 体验。
Stagehand
22.6k StarsStagehand 是 Browserbase 推出的浏览器 Agent SDK,为 AI 编码助手提供网页操作能力。支持 act、extract、observe 三种核心原语,让 AI Agent 能够自然地浏览和操作网页,是构建浏览器 Agent 的首选工具。
Skyvern
21.6k StarsSkyvern 是面向浏览器任务自动化的 Agent 平台,通过页面理解与操作规划完成复杂网页流程,适合表单处理、后台操作与可重复 Web 自动化场景。
Agent Reach
19.2k Stars为 AI Agent 赋予全网搜索能力,一键读取和搜索 Twitter、Reddit、YouTube、GitHub、B 站、小红书等平台,无需 API 费用。
Deep Research
18.9k StarsAI 驱动的深度研究助手,结合搜索引擎、网页抓取和大语言模型,通过迭代推理对任意主题进行深入调研
Page Agent
17.7k StarsPage Agent 是阿里巴巴开发的 JavaScript 页面内 GUI 智能体,通过自然语言控制网页界面,实现自动化表单填写、页面导航和元素操作等任务。
Browser Use Web UI
16.0k Stars在浏览器中运行 AI Agent 的 Web 界面,提供可视化的浏览器自动化操作体验。
CUA
16.0k StarsCUA 是开源的计算机使用 Agent 基础设施,提供沙箱、SDK 和基准测试,支持 AI Agent 控制完整桌面环境。
PPT Master
14.8k StarsAI 驱动的 PPT 生成工具,从任意文档自动生成原生可编辑的 PPTX 文件,输出真正的 PowerPoint 图形元素而非图片。
Browserless
13.1k Stars在Docker中部署无头浏览器,支持云端运行或本地部署,为AI Agent提供强大的网页自动化和渲染能力,免费用于非商业用途。
Midscene.js
13.0k StarsAI 驱动的视觉化 UI 自动化工具,支持自然语言描述操作,告别传统选择器,兼容浏览器和移动端
NanoBrowser
13.0k StarsNanoBrowser 是开源 Chrome 扩展,提供 AI 驱动的多 Agent 浏览器自动化,支持使用自有 LLM API Key 运行网页任务工作流。
相关文章
AI 编程 Agent 深度对比:从 CLI 到 IDE 内嵌的架构取舍
从 CLI-first、IDE-集成到完全自主三种架构出发,对比七款主流编程 Agent 的上下文管理、工具访问和自主度,帮你为每个开发场景选对工具。
Browser Agent 实战:让 AI 操控浏览器的架构与陷阱
从裸 Playwright 到结构化提取,拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。
Web 自动化 Agent 实战:browser-use 的能力边界与最佳实践
详解 browser-use 在网页任务自动化中的优势与限制,并给出稳定执行和失败恢复策略。