browser-use

活跃
GitHub Python MIT

简介

让 LLM 直接操控浏览器的 Python 库,支持自然语言驱动网页。

核心特性

  • 自然语言驱动 — 描述任务即可执行
  • 多模型 — OpenAI、Anthropic、本地模型
  • 可视化回放 — 每步操作可截图回放
  • DOM 解析 — 智能识别页面可交互元素
  • Python API — 与 Playwright 类似风格

适用场景

💡 让 Agent 自动完成网页表单填写。
💡 搭建端到端的 Web 端测试 Agent。
💡 从网页抽取结构化数据。

快速开始

pip install browser-use
from browser_use import Agent
agent = Agent(task='搜索 agentlist.top')
result = await agent.run()

相关项目