browser-use
活跃简介
browser-use 提供浏览器自动化 Agent 能力,让 LLM 可以理解页面并执行复杂网页操作。
browser-use 提供浏览器自动化 Agent 能力,让 LLM 可以理解页面并执行复杂网页操作。
开源的跨平台计算机使用智能体,支持在 Windows、macOS、Ubuntu 和 Android 环境中操作 GUI 界面,ICLR 2026 Oral 论文项目。
开源 Computer-Use-Agent,支持通过自然语言指令自动操作计算机图形界面,实现桌面环境的智能体自动化交互。
首个开源的通用 GUI 自动化智能体框架,通过自然语言完全操控图形界面,利用思维可视化与链式推理实现空间感知与 HID 交互模拟。
AI 驱动的 PPT 生成工具,从任意文档自动生成原生可编辑的 PPTX 文件,输出真正的 PowerPoint 图形元素而非图片。