最佳Agent 框架 Top 20
精选 20 个最受欢迎的开源Agent 框架项目,按 GitHub Stars 排名。
Hermes Agent
206.5k StarsNousResearch 推出的自主 AI Agent 框架,支持多种 LLM 后端,能够随用户需求不断成长和适应。
AutoGPT
185.2k StarsAutoGPT 是一个自主 AI Agent,能够自动完成用户指定的任务。它会自主思考、规划并执行步骤,是 AI Agent 自主性的里程碑项目。
opencode
180.9k StarsOpenCode 是开源的终端编程 Agent,跨平台支持并兼容 Claude、OpenAI 等多种 LLM,提供交互式 TUI 与可扩展的 AI 编码体验。
Langflow
150.3k StarsLangflow 是一个可视化的 AI Agent 和工作流构建平台,支持拖拽式设计 Agent 流程、集成多种 LLM 和工具,降低 Agent 开发门槛。
Langflow
150.3k StarsPython 生态的可视化 LLM 工作流构建器,强调多 Agent。
Dify
147.2k StarsDify 是一个开源的 LLM 应用开发平台,提供可视化的 Agent 编排界面,支持工作流、知识库和多种模型。
LangChain
140.6k StarsLangChain 是面向 Agent 工程化的开源框架与编排平台,提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。
LangChain
140.6k StarsLangChain 是一个用于开发由语言模型驱动的应用程序的框架。它提供了链式调用、记忆管理、Agent 编排等核心功能,是构建 AI Agent 的首选框架之一。
AutoResearch
89.3k Stars由 Andrej Karpathy 开发的 AI 研究自动化 Agent,能在单 GPU 上自动运行纳米聊天训练研究实验。
OpenHands
78.9k StarsOpenHands(前 OpenDevin)是面向软件开发的自主 AI Agent 平台,可独立完成代码修改、Bug 修复、特性开发等全流程工程任务。
OpenHands
78.9k StarsOpenHands 是一个开源 AI 开发代理平台,支持通过智能体自动执行开发任务、修改代码与协作迭代。
LlamaFactory
72.8k Stars统一高效的百种大语言模型与视觉语言模型微调框架,支持 LoRA、QLoRA、RLHF 等多种训练策略,为 Agent 提供定制化模型能力。
MetaGPT
69.1k Stars多智能体框架,致力于构建首个 AI 软件公司,通过自然语言编程实现多角色协作,自动完成需求分析、设计、编码和测试全流程。
MetaGPT
69.1k StarsMetaGPT 是一个把多智能体协作与软件工程 SOP 结合的多 Agent 框架,可让多个 Agent 像真实软件公司一样协作产出代码与文档。
AI Agents for Beginners
68.3k Stars微软出品的 AI 智能体入门课程,包含 12 节循序渐进的动手课程,覆盖智能体核心概念、工具使用和多智能体协作等主题。
Pi Mono
66.8k StarsPi Mono 是一个全面的 AI 智能体工具包,包含编码智能体 CLI、统一 LLM API、TUI 与 Web UI 组件库、Slack 机器人及 vLLM Pod 管理,一站式覆盖智能体开发全链路。
Oh My OpenAgent
64.4k Stars一个开源的智能体工具平台(原名 oh-my-opencode),提供最佳智能体工具链,支持多种 AI 编程代理。
openinterpreter
64.2k StarsOpen Interpreter 是面向开源模型的轻量级编程 Agent,支持 DeepSeek、Kimi、Qwen 等本地模型在终端执行代码与自动化任务。
Ruflo
62.3k Stars领先的Claude Agent编排平台,支持部署智能多Agent群组、协调自主工作流程、构建对话式AI系统。具备企业级架构、分布式群集智能、RAG集成,原生支持Claude Code和Codex集成。
Llama 2
59.5k StarsMeta 开源的 Llama 2 基础大语言模型,提供 7B 至 70B 参数预训练和微调版本,支持对话和文本补全,是开源 LLM 生态的重要基础。
相关文章
Agent 灰度发布与生产监控:从 Prompt A/B 到自动回滚
改了 Prompt 怎么知道是变好了还是变差了?系统介绍 Agent 的 canary 发布、质量门禁、自动回滚架构,以及如何在生产环境中持续监控 Agent 行为漂移。
Agent 评估与测试体系:从单轮评分到端到端流水线
大多数团队靠"看起来对了"来判断 Agent 质量。真正的评估需要三层指标、不腐烂的数据集、以及不会什么都同意的评判器。本文给出可运行的代码和可落地的决策框架。
Agent Memory 架构:短期、长期与共享记忆的设计取舍
系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆,从存储介质、生命周期、检索方式、典型框架到设计模式,完整覆盖 Agent 个性化和多 Agent 协作的工程实现。