AgentList
首页项目文章关于
探索项目
首页项目文章关于
探索项目
项目 SeeAct

SeeAct

不活跃
GitHub Python NOASSERTION

简介

基于大型多模态模型的通用 Web Agent 系统,能自主在任意网站上执行任务,发表于 ICML 2024,利用 GPT-4V 等视觉模型理解并操控网页。

标签

web-agent multimodal llm gpt-4v autonomous-agent

分类

🌐 浏览器 Agent
访问 GitHub

项目指标

Stars 845
Forks 108
Watchers 845
Issues 14
创建时间 2023年12月21日
最近提交 2025年2月3日

部署方式

本地部署

相关项目

Mind2Web

988 · Jupyter Notebook
不活跃

首个基于 LLM 的通用 Web Agent 和基准测试(NeurIPS 2023 Spotlight),为构建能在真实网站上执行任务的智能体提供数据集、评估框架和基线方法。

web-agentbenchmarkllm +2

AppAgent

6.7k · Python
不活跃

AppAgent 是基于 LLM 的多模态智能体框架,让 AI 能够像人类一样操作智能手机应用,支持触控交互和自主探索。

multimodalsmartphonegui-agent +3

AgenticSeek

26.3k · Python
活跃

完全本地化的 Manus AI 替代方案,支持自主浏览网页、编写代码和语音交互,无需任何 API 费用

browser-agentcoding-agentlocal-ai +3

Vision Agents

7.8k · Python
活跃

Stream 开源的视觉与语音智能体框架,支持任意模型和视频提供商,利用边缘网络实现超低延迟的实时多模态 AI 交互。

voiceagentpython +3
AgentList

AgentList 是最全面的 AI Agent 开源项目导航站,发现、对比 LangChain、CrewAI 等顶级 Agent 框架,助力开发者选择最佳工具。

快速链接

  • 项目列表
  • 精选文章
  • 分类浏览

联系我们

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 AgentList. 保留所有权利。

Made with for the open source community