最佳浏览器 Agent Top 20
精选 20 个最受欢迎的开源浏览器 Agent项目,按 GitHub Stars 排名。
Firecrawl
142.2k StarsFirecrawl 是一个专为 AI Agent 设计的网页抓取和搜索引擎,支持将任意网页转换为结构化的 Markdown 数据,提供搜索、抓取和清洗功能,适合构建基于网页数据的 AI 应用。
browser-use
101.8k Starsbrowser-use 提供浏览器自动化 Agent 能力,让 LLM 可以理解页面并执行复杂网页操作。
browser-use
101.8k Stars让 LLM 直接操控浏览器的 Python 库,支持自然语言驱动网页。
Scrapling
67.4k Stars自适应 Web 爬虫框架,智能应对反爬机制,从单次请求到大规模爬取均可处理,专为 AI Agent 数据采集设计。
Agent Reach
47.1k Stars为 AI Agent 赋予全网搜索能力,一键读取和搜索 Twitter、Reddit、YouTube、GitHub、B 站、小红书等平台,无需 API 费用。
Chrome DevTools MCP
44.8k Stars为编程 Agent 提供浏览器开发者工具能力的 MCP 服务器,支持网页调试、性能分析和 DOM 操作自动化。
GitNexus
43.3k Stars零服务器代码智能引擎,完全在浏览器中运行的客户端知识图谱创建工具,内置 Graph RAG 智能体用于代码探索。
Agent Browser
37.6k StarsVercel 开源的浏览器自动化 CLI 工具,专为 AI Agent 设计,基于 Rust 构建,高性能且可编程。
UI-TARS Desktop
37.4k Stars字节跳动开源的多模态 AI Agent 栈,连接前沿 AI 模型与 Agent 基础设施,支持 GUI 自动化和电脑操作。
PPT Master
35.3k StarsAI 驱动的 PPT 生成工具,从任意文档自动生成原生可编辑的 PPTX 文件,输出真正的 PowerPoint 图形元素而非图片。
Playwright MCP
34.5k Stars微软官方的 Playwright MCP 服务器,让 LLM 操控真实浏览器。
Lightpanda Browser
31.5k StarsLightpanda Browser 是面向自动化和爬取场景的轻量浏览器运行时,目标是在无头任务中提供比传统浏览器更低的资源开销。它适合大规模 Web Agent、网页抽取和自动化测试,把浏览器能力嵌入后端工作流。
CloakBrowser
27.5k StarsCloakBrowser 是基于源码级补丁构建的反检测 Chromium 浏览器,专为 AI 代理和爬虫场景,绕过 Cloudflare、reCAPTCHA 等主流反机器人检测。
AgenticSeek
26.6k Stars完全本地化的 Manus AI 替代方案,支持自主浏览网页、编写代码和语音交互,无需任何 API 费用
Open-AutoGLM
25.7k StarsOpen-AutoGLM 是一个开放的手机 Agent 模型与框架,支持 AI 自主操控手机界面完成任务,解锁 AI Phone 体验。
Stagehand
23.3k StarsStagehand 是 Browserbase 推出的浏览器 Agent SDK,为 AI 编码助手提供网页操作能力。支持 act、extract、observe 三种核心原语,让 AI Agent 能够自然地浏览和操作网页,是构建浏览器 Agent 的首选工具。
Stagehand
23.3k StarsBrowserbase 推出的 AI 浏览器自动化 SDK,结合代码与自然语言。
Skyvern
22.1k StarsSkyvern 是面向浏览器任务自动化的 Agent 平台,通过页面理解与操作规划完成复杂网页流程,适合表单处理、后台操作与可重复 Web 自动化场景。
Skyvern
22.1k Stars用 LLM + 计算机视觉自动化浏览器流程的开源项目。 项目生态活跃,社区支持完善。
Automa
21.4k StarsAutoma 是一款开源浏览器自动化扩展,通过可视化积木块拼接完成表单填写、网页抓取、定时任务等重复操作,让非编程用户也能快速搭建浏览器工作流。
相关文章
Browser Agent 实战:让 AI 操控浏览器的架构与陷阱
从裸 Playwright 到结构化提取,拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。
Web 自动化 Agent 实战:browser-use 的能力边界与最佳实践
详解 browser-use 在网页任务自动化中的优势与限制,并给出稳定执行和失败恢复策略。
Deep Research Agent 架构实战:从单轮搜索到迭代推理
拆解五个开源 Deep Research 项目的迭代检索、事实验证、报告生成三大子阶段,附可复制的 query 改造代码。