相关项目
PyWinAssistant
1.3k · Python
首个开源的通用 GUI 自动化智能体框架,通过自然语言完全操控图形界面,利用思维可视化与链式推理实现空间感知与 HID 交互模拟。
browseragentpython +2
BrowserOS
11.2k · TypeScript
开源的智能体浏览器,可作为 ChatGPT Atlas 和 Perplexity Comet 的替代方案,将浏览器转变为 AI 驱动的智能操作系统。
browseragenttypescript +3
Scrapling
59.2k · Python
自适应 Web 爬虫框架,智能应对反爬机制,从单次请求到大规模爬取均可处理,专为 AI Agent 数据采集设计。
browserpythontools +2
Vision Agents
7.9k · Python
Stream 开源的视觉与语音智能体框架,支持任意模型和视频提供商,利用边缘网络实现超低延迟的实时多模态 AI 交互。
voiceagentpython +3