OpenClaw
OpenClaw 是一个开源个人 AI 助手平台,支持 25+ 消息通道(WhatsApp、Telegram、Slack 等),可连接多种 LLM 并管理个人知识库。
OpenClaw 是一个开源个人 AI 助手平台,支持 25+ 消息通道(WhatsApp、Telegram、Slack 等),可连接多种 LLM 并管理个人知识库。
n8n 是一个功能强大的工作流自动化平台,原生支持 AI Agent 节点,可编排多步骤 Agent 工作流并集成数百种外部服务。
AutoGPT 是一个自主 AI Agent,能够自动完成用户指定的任务。它会自主思考、规划并执行步骤,是 AI Agent 自主性的里程碑项目。
Claude Code 的 Agent Harness 性能优化系统,涵盖技能、本能、记忆、安全和研究优先的开发工作流。
一个智能体技能框架和软件开发方法论,为 AI 编程智能体提供可复用的技能模块和工程化工作流。
Langflow 是一个可视化的 AI Agent 和工作流构建平台,支持拖拽式设计 Agent 流程、集成多种 LLM 和工具,降低 Agent 开发门槛。
OpenCode 是一个开源终端编码 Agent,支持多种 LLM 提供商,在终端中提供 AI 驱动的代码生成和编辑能力。
开源编程Agent,在终端中运行的AI编程助手。支持代码生成、重构、调试、测试等全流程开发任务,提供智能代码补全和建议。
Dify 是一个开源的 LLM 应用开发平台,提供可视化的 Agent 编排界面,支持工作流、知识库和多种模型。
收录 Cursor、Devin、Windsurf、Manus、Lovable 等 40+ 主流 AI 工具的完整系统提示词、内部工具和 AI 模型信息。
LangChain 是一个用于开发由语言模型驱动的应用程序的框架。它提供了链式调用、记忆管理、Agent 编排等核心功能,是构建 AI Agent 的首选框架之一。
Open WebUI 是一个功能丰富、用户友好的自托管 AI 平台,支持 Ollama 和 OpenAI 兼容 API,提供 RAG、Agent 和 MCP 等功能。
Anthropic 官方发布的智能体技能仓库,提供多种可直接使用的 Claude 代理技能示例和模板。
Claude Code 是 Anthropic 推出的终端 AI 编程助手,能理解代码库、执行任务、解释复杂代码并处理 Git 工作流。
Firecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。
100 多个可直接运行的 AI 智能体与 RAG 应用合集,涵盖克隆、定制和部署,是快速上手构建 LLM 应用的绝佳参考。
NousResearch 推出的自主 AI Agent 框架,支持多种 LLM 后端,能够随用户需求不断成长和适应。
Gemini CLI 是 Google 推出的终端 AI Agent 工具,支持代码生成、文件操作和多轮对话,提供免费使用层级。
browser-use 提供浏览器自动化 Agent 能力,让 LLM 可以理解页面并执行复杂网页操作。
NextChat 是一款轻量、跨平台的 AI 助手客户端,支持 GPT-4、Claude、Gemini 等多种模型,提供 Web、桌面和移动端体验。
最全面的 MCP 服务器精选列表,收录数百个经过社区验证的 Model Context Protocol 服务器实现,涵盖数据库、搜索引擎、开发工具、浏览器自动化等多个领域,帮助开发者快速发现和集成适合自己场景的 MCP 服务。
MCP Servers 收录了大量可复用的 Model Context Protocol 服务器实现,用于为 Agent 提供标准化工具能力。
领先的开源 RAG 引擎,融合前沿 RAG 技术与 Agent 能力,为 LLM 提供高质量的上下文层,支持深度文档理解、知识库管理和智能检索。
vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。
在任意设备上运行本地大语言模型的开源工具,支持商业使用,为 AI Agent 提供完全离线的本地推理和对话能力。
Codex CLI 是 OpenAI 开源的代码 Agent 命令行工具,面向代码理解、重构、生成与终端协作场景,适合作为开发者工作流中的编程 Agent 接口。
Lobe Chat 是一个开源的 ChatGPT 风格聊天应用,支持插件系统和多模型,适合作为 Agent 对话界面。
面向工作和生活的 AI Agent 协作空间,支持多 Agent 团队设计、协作和成长,将 Agent 作为工作交互的基本单元。
由 Andrej Karpathy 开发的 AI 研究自动化 Agent,能在单 GPU 上自动运行纳米聊天训练研究实验。
全面的提示工程指南,涵盖论文、教程、笔记本和资源,涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。
Daytona 提供面向开发 Agent 与自动化任务的安全开发环境基础设施,适合作为代码 Agent、远程执行与开发者工作流自动化的运行底座。
OpenHands 是一个开源 AI 开发代理平台,支持通过智能体自动执行开发任务、修改代码与协作迭代。
为 GPT/GLM 等大语言模型提供多功能交互界面,特别优化论文阅读、润色与写作体验,支持多模型并行、插件扩展和本地部署。
统一高效的百种大语言模型与视觉语言模型微调框架,支持 LoRA、QLoRA、RLHF 等多种训练策略,为 Agent 提供定制化模型能力。
多智能体框架,致力于构建首个 AI 软件公司,通过自然语言编程实现多角色协作,自动完成需求分析、设计、编码和测试全流程。
MetaGPT 是一个多智能体框架,为 GPT 分配不同的角色,形成一个协作实体来完成复杂任务。给定一行需求,它可以返回产品文档、架构设计、任务列表和代码。
面向分析师、量化交易和 AI Agent 的金融数据平台,提供股票、加密货币、经济数据等全方位金融数据接口。
Claude Code 插件,自动捕获编程会话内容并用 AI 压缩,将相关上下文注入未来的会话中,实现跨会话持久记忆。
Pathway 是一个 Python ETL 框架,支持流处理、实时分析、LLM 管道和 RAG 应用构建。
Open Interpreter 是一个自然语言计算机接口,让 LLM 能在本地运行代码执行文件操作、数据分析和系统管理任务。
字节跳动开源的长周期 SuperAgent 框架,支持研究、编码和创作任务,具备沙箱环境、记忆系统、工具调用和子 Agent 协同能力,可处理从分钟到小时级别的复杂任务。
MinerU 是一个高质量文档解析工具,能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式,为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。
Cline 是一款运行在 IDE 中的自主编码 Agent,能够创建/编辑文件、执行命令、使用浏览器,并在每一步请求用户确认。
即开即用的 RAG 和 AI 管道云模板,支持 Docker 部署,实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。
AnythingLLM 是一体化 AI 生产力工具,支持本地部署的聊天界面、RAG 知识库、AI Agent 与多模型管理,隐私优先且零配置。
Docling 是 IBM 开源的文档解析工具,支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据,专为 GenAI 和 RAG 管道设计。
Microsoft AutoGen 是一个多 Agent 对话框架,允许创建多个 Agent 进行协作对话,解决复杂任务。
微软出品的 AI 智能体入门课程,包含 12 节循序渐进的动手课程,覆盖智能体核心概念、工具使用和多智能体协作等主题。
利用 AI 大模型一键生成高清短视频的工具,集成多步自动化工作流,从文案生成到视频合成全流程自动化。
轻量级元提示和上下文工程开发系统,通过规范驱动开发方法论帮助 Claude Code 等 AI 编码 Agent 更高效地完成软件开发任务。
GPT Engineer 是一个根据自然语言描述生成整个代码库的 AI 工具。你只需描述想要构建的内容,AI 会提出澄清问题,然后生成完整的代码。
用自然语言描述软件需求,让 AI 自动生成并执行代码的实验平台,支持 Vision 模型输入和开源模型接入
精选 Claude Skills 资源和工具集合,帮助用户自定义和扩展 Claude AI 工作流。
从零到一构建的纳米级 Claude Code 风格 Agent Harness 教学项目,用 Bash 实现完整的 AI 编程助手。
Mem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。
Embedchain 是一个面向 AI Agent 的通用记忆层,支持将多种数据源快速接入 LLM,构建具有上下文记忆的 AI 应用。
Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。
一个开源的智能体工具平台(原名 oh-my-opencode),提供最佳智能体工具链,支持多种 AI 编程代理。
AI 驱动的舆情监控与热点追踪工具,支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送,集成微信、飞书、钉钉、Telegram 等多种通知渠道,并支持 MCP 架构接入。
Flowise 是一个低代码的 LLM 应用构建工具,使用拖拽方式创建 Agent 工作流和 RAG 应用。
TradingAgents 是基于 LangGraph 的多 Agent 金融交易框架,模拟真实交易公司角色协作,包含基本面分析师、情绪分析师、风控经理等多角色 Agent。
CrewAI 是一个用于编排角色扮演 AI Agent 的框架。它允许你创建一组具有不同角色和目标的 Agent,让它们协作完成复杂任务。
一个基于 Ruby 的自动化代理平台,可创建监控代理替你执行任务,支持 Twitter、天气、网页抓取等多种场景。
LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。
MemPalace 是开源 AI 记忆系统,为 AI Agent 提供持久化长期记忆层,支持 ChromaDB 向量存储与 MCP 协议集成。
跨平台桌面多合一助手工具,统一管理 Claude Code、Codex、OpenCode、OpenClaw 和 Gemini CLI 等多种 AI 编程代理。
从 Vibe Coding 到智能体工程的实践指南,帮助开发者掌握 Claude Code 的最佳实践和高级技巧。
text-generation-webui 是最经典的本地大语言模型交互界面,支持文本生成、视觉理解、工具调用和模型训练,提供 Web UI 和 API 接口,100% 离线运行且保护隐私。
AI 驱动的低代码开发平台,提供零代码和代码生成双模式,内置 AI 聊天助手、知识库、流程编排和 MCP 插件体系。
LocalAI 是一个开源的本地 AI 推理引擎,支持在任意硬件上运行 LLM、视觉、语音、图像和视频模型,无需 GPU。提供与 OpenAI 兼容的 API,可完全本地化部署,保障数据隐私。
LiteLLM 提供统一的大模型调用接口与代理网关,简化多模型切换、路由与成本控制。
Cherry Studio 是一款支持多模型、多平台的 AI 助手客户端,集成智能聊天、自主 Agent 和 300+ 预设助手。
Milvus 是一个高性能的开源向量数据库,专为 AI 应用程序构建。支持大规模向量数据的存储、索引和相似度搜索,适用于 RAG、推荐系统等场景。
终端中的 AI 结对编程工具,支持与主流 LLM 协作进行代码编辑、Git 管理和多文件重构,深度集成开发者工作流。
Aider 是一个 AI 编程助手,可以在终端中与 LLM 协作编程。支持 Git 集成,可以自动提交代码更改,适合开发者进行结对编程。
CowAgent(原名 chatgpt-on-wechat)是基于大模型的超级 AI 助理框架,支持主动思考、任务规划、工具调用、长期记忆和多 Agent 协作,可接入微信、飞书、钉钉等多渠道。
云原生 API 和 AI 网关,支持 LLM 请求路由、速率限制、负载均衡和可观测性,是 AI Agent 应用的关键基础设施。
开源可扩展的 AI 编程 Agent,超越代码补全,支持安装、执行、编辑和测试全流程,兼容多种 LLM 后端。
Goose 是 Block 开发的开源自主编程 Agent,能够在开发环境中自动执行代码编写、文件操作和终端命令等任务。
Jan 是一个开源的 ChatGPT 替代方案,可在电脑上 100% 离线运行,支持多种本地大语言模型,提供完整的桌面聊天应用界面和 API 服务。
OpenSpec 是一个规范驱动开发(SDD)平台,通过定义规格说明来指导 AI 编程助手生成代码,提升开发效率与代码质量。
Fabric 是一个开源 AI 增强框架,通过模块化的 AI 提示词系统解决具体问题,利用众包方式持续积累人类与 AI 协作的模式。
微舆:人人可用的多智能体舆情分析助手,打破信息茧房,还原舆情原貌,预测未来走向,从零实现不依赖任何框架。
微软开源的前沿语音 AI 平台,提供高质量的语音合成和语音识别能力,支持构建实时对话式语音 Agent 应用。
nanobot 是一个超轻量级个人 AI Agent,支持多种 LLM 后端,可快速部署私人智能助手。
Agno 是一个高性能的 Agent 框架,用于构建具有记忆、知识和工具调用能力的多模态 AI Agent,支持多种 LLM 提供商。
Phidata 是一个构建 AI Agent 的框架,支持记忆、知识和工具集成,让 Agent 更智能、更有用。
Chatbox 是一款跨平台 AI 客户端,支持 OpenAI、Claude、Gemini 等多种大模型,提供桌面端和移动端应用。
面向日常对话的生成式语音模型,为 AI Agent 提供自然流畅的语音合成能力,支持细粒度韵律控制。
Quivr 是一个开箱即用的 RAG 框架,支持将任意文件转化为知识库并与 GenAI 应用集成。兼容多种 LLM 和向量数据库,开发者只需专注于产品本身,无需从头构建 RAG 管道。
MindsDB 是一个 AI 分析查询引擎,可在实时数据上构建自主推理 Agent,连接多种数据源和 AI 模型。
从零开始的智能体原理与实践教程,系统讲解 AI Agent 核心概念、框架使用和项目实战。
自适应 Web 爬虫框架,智能应对反爬机制,从单次请求到大规模爬取均可处理,专为 AI Agent 数据采集设计。
Pi Mono 是一个全面的 AI 智能体工具包,包含编码智能体 CLI、统一 LLM API、TUI 与 Web UI 组件库、Slack 机器人及 vLLM Pod 管理,一站式覆盖智能体开发全链路。
Langchain-Chatchat 是一个基于 Langchain 和多种大语言模型的本地知识库 RAG 与 Agent 应用平台,支持 ChatGLM、Qwen、Llama 等模型,提供对话、知识库管理、Agent 调用等功能。
开源低代码平台,支持构建内部工具、仪表盘、业务应用、工作流和 AI Agent,提供可视化拖拽式开发。
基于 Claude Code 的 AI 驱动求职系统,支持 14 种技能模式、Go 仪表盘、PDF 简历生成和批量处理。
为编程 Agent 提供浏览器开发者工具能力的 MCP 服务器,支持网页调试、性能分析和 DOM 操作自动化。
AgentGPT 是一个在浏览器中组装、配置和部署自主 AI 智能体的平台,用户可通过可视化界面创建具有特定目标的 AI Agent 并观察其自主执行任务。
LibreChat 是增强版开源 ChatGPT 克隆,支持多模型切换、Agent、MCP 工具、代码解释器、AI 搜索等功能。
Google 开源的 Python 库,用于利用 LLM 从非结构化文本中精确提取结构化信息,支持源文本标注和交互式可视化,适用于数据标注和知识抽取场景。
现代化开源 VPS 管理面板,原生支持 AI Agent,可运行 Ollama 模型、部署 AI Agent 并管理整个服务器栈。
包含 1400+ 个可安装的 AI Agent 技能库,支持 Claude Code、Cursor、Codex CLI、Gemini CLI 等平台,配备安装器和工作流。
Khoj 是一个可自托管的 AI 第二大脑,支持从网页和文档中获取答案、构建自定义 Agent、安排自动化任务和深度研究。
智能自动化和多Agent编排框架,专为Claude Code设计。支持自动化工作流程、任务协调和智能代理系统构建。
LightRAG 是一个简洁高效的 RAG 框架,使用图结构增强检索效果,发表于 EMNLP 2025。
AI 驱动的智能问答引擎,支持多模型集成、联网搜索和本地知识库,提供类似 Perplexity 的搜索体验。
DSPy 是声明式 LLM 编程框架,强调可优化的提示与程序结构,适合构建复杂 Agent 流程。
深入讲解 LLM、RAG 和真实 AI 智能体应用的教程合集,包含丰富的 Notebook 示例,是学习 AI 工程化实践的优质资源。
Tabby 是一个可自托管的 AI 编程助手,支持代码补全、代码生成和企业级部署,兼容主流 IDE。
AI 驱动的 PDF 学术论文翻译工具,完整保留原始排版格式,支持 Google/DeepL/Ollama/OpenAI 等多种翻译引擎。
Chatbot UI 是一个开源的 AI 聊天界面,支持 OpenAI、Claude、Gemini 等多种模型,提供现代化对话界面和灵活的部署选项。
ChatDev 2.0 通过 LLM 驱动的多 Agent 协作完成软件开发全流程,模拟虚拟软件公司的角色分工与合作机制。
Continue 是一个开源的 AI 代码助手扩展,支持 VS Code 和 JetBrains IDE。可以自动补全代码、重构、解释代码,帮助开发者提高编程效率。
领先的Claude Agent编排平台,支持部署智能多Agent群组、协调自主工作流程、构建对话式AI系统。具备企业级架构、分布式群集智能、RAG集成,原生支持Claude Code和Codex集成。
微软开源的基于知识图谱的模块化检索增强生成(RAG)系统,利用大语言模型从文本中提取结构化知识图谱,支持全局和局部社区摘要查询。
One API 是一个 LLM API 管理与分发系统,支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek 等主流模型的统一 API 适配,可用于 key 管理与二次分发,提供 Docker 镜像一键部署。
CLI-Anything 致力于将所有软件转化为智能体原生的命令行接口,提供统一的 CLI Hub 让 AI 智能体能够自然地与任意软件交互和操作。
事件驱动的 Agent 编排平台,为应用程序和 AI Agent 提供持久化和高弹性的执行引擎。
AI 编码助手技能工具,将代码、文档、论文、图片或视频转化为可查询的知识图谱,支持 Claude Code、Cursor、Gemini CLI 等多种 AI 编码工具。
Playwright MCP 是微软提供的 MCP 服务器,将 Playwright 浏览器自动化能力暴露给 AI Agent,支持网页交互、截图和结构化数据提取。
LLM 驱动的 A/H/美股智能分析器,集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送,零成本定时运行。
GitHub 官方维护的 Copilot 社区资源合集,收录社区贡献的指令、Agent、技能和配置方案,帮助开发者充分利用 GitHub Copilot 提升编码效率。
Qdrant 是高性能向量数据库,广泛用于 RAG 检索层与 Agent 记忆检索场景。
一个用 Rust 构建的快速、轻量且完全自主的 AI 个人助手基础设施,支持任意操作系统和平台部署。
CopilotKit 是构建 AI Agent 前端交互界面的开源框架,支持 Generative UI 和 AG-UI 协议,帮助开发者快速集成 Agent 能力到应用中。
集成多种即时通讯平台、LLM 和插件的 AI Agent 助手,支持 QQ、Telegram、Discord 等平台。
团队优先的Claude Code多Agent编排框架,专为团队协作设计。支持多Agent协同工作、任务分配、结果整合,提升团队AI开发效率。
Vercel 开源的浏览器自动化 CLI 工具,专为 AI Agent 设计,基于 Rust 构建,高性能且可编程。
LangGraph 是 LangChain 团队推出的 Agent 工作流编排框架,使用图结构定义 Agent 的状态和流转。
AI 驱动的求职申请自动化 Agent,自动分析职位需求并定制简历,实现大规模精准投递。
字节跳动开源的多模态 AI Agent 栈,连接前沿 AI 模型与 Agent 基础设施,支持 GUI 自动化和电脑操作。
GitHub 官方 MCP Server,为 AI Agent 提供 GitHub API 的标准化访问,支持仓库管理、Issue 处理、PR 操作等能力。
涵盖医疗、金融、教育、零售等多个行业的 500 个 AI 智能体项目合集,展示实际应用案例并提供开源项目链接。
Void 是一款开源的 AI 代码编辑器,基于 VS Code 架构,支持 Claude、GPT 等多种模型,提供 Cursor 风格的智能编程体验。
Monorepo 开发平台,原生支持 AI Agent 参与构建优化、CI 扩展和自动修复失败 PR,将开发效率提升一倍。
零服务器代码智能引擎,完全在浏览器中运行的客户端知识图谱创建工具,内置 Graph RAG 智能体用于代码探索。
Hugging Face 官方推出的 AI Agent 课程,涵盖 Agent 基础概念、框架使用(LangChain、LlamaIndex 等)和实战项目,适合入门到进阶学习。
New API 是一个统一的 AI 模型聚合与分发平台,支持将各种 LLM 交叉转换为 OpenAI、Claude、Gemini 兼容格式,提供企业和个人的集中化模型管理网关。
Composio 是一个面向 Agent 的工具与 SaaS 集成层,帮助应用快速接入 Gmail、Slack、GitHub 等外部服务,适合多工具工作流与企业自动化场景。
Sim 是 AI Agent 的构建、部署与编排平台,提供可视化低代码工作流编辑器,支持 OpenAI、Anthropic、DeepSeek 等多模型,适用于企业级 Agent 编排。
开源低代码平台,支持构建 AI Agent、自动化流程和业务应用,模型无关,提供拖拽式可视化开发。
开源 AI 平台,提供企业级 AI 聊天、高级 RAG 和 AI 搜索功能,兼容所有主流 LLM。
FastGPT 是一个基于大语言模型的知识库平台,提供数据处理、RAG 检索和可视化 AI 工作流编排等开箱即用的能力,可轻松开发和部署复杂问答系统。
Microsoft Semantic Kernel 是一个轻量级 SDK,让你能够将 AI 大语言模型与传统编程语言结合,构建 AI Agent 应用。
轻量级 AI 助手平台,运行在容器中确保安全,可连接 WhatsApp、Telegram、Slack、Discord 等消息应用,支持记忆和定时任务。
Chroma 是一个开源的 AI 原生嵌入式数据库,专为构建 LLM 应用而设计。提供简单的 API 来存储嵌入向量、执行相似度搜索,是构建 RAG 应用的理想选择。
将 Gemini CLI、Claude Code、Codex 等 AI 代理封装为 OpenAI/Gemini/Claude 兼容的 API 服务,实现多种编程代理的统一接口调用。
精选 AI 自主智能体列表,汇集各类开源智能体项目,是发现和了解智能体生态的优质参考资源。
全面展示各种高级检索增强生成(RAG)技术的教程合集,每项技术配有详细的 Notebook 教程和代码示例,涵盖从基础到前沿的 RAG 实现方案。
smolagents 是 Hugging Face 推出的轻量级 Agent 框架,快速构建可调用工具的 LLM Agent。
一款 AI 提示词优化工具,帮助用户编写更高质量的提示词,从而获得更好的 AI 输出效果。
自主研究Agent,使用任意LLM提供商对任何数据进行深度研究。自动收集信息、分析数据、生成研究报告,支持多源数据整合。
GPT Researcher 是一个自主研究 Agent,能够自动搜集、整理和分析信息,生成详尽的研究报告。
面向多 AI Agent 编程的下一代终端开发环境,支持在终端中同时使用多个 AI Agent 协作编程。
完全本地化的 Manus AI 替代方案,支持自主浏览网页、编写代码和语音交互,无需任何 API 费用
面向高级用户的 LLM 前端界面,支持多种 AI 模型和丰富的角色扮演功能,提供可扩展的插件系统和本地部署能力。
基于 MCP 的开源 ESP32 聊天机器人,可在 ESP32 等嵌入式设备上运行 AI 对话功能,支持语音交互、多模型接入和物联网控制,适合构建智能硬件 Agent。
Obsidian 官方智能体技能,让 AI 代理学会使用 Markdown、Bases、JSON Canvas 和 CLI 工具。
MLflow 是开源 AI 工程平台,为 Agent 和 LLM 应用提供调试、评估、监控和优化能力,支持模型与数据访问管理。
Vercel 官方发布的智能体技能集合,为 AI 编程代理提供多种实用技能模块和工具。
让Claude Code、Codex或任何编程Agent效率提升10倍的工具。通过看板管理Agent任务,追踪进度,优化工作流程。
Kotaemon 是开源 RAG 文档对话工具,支持与 PDF 等文档进行智能问答,提供简洁的聊天界面与多种 LLM 和嵌入模型后端。
Langfuse 是开源 LLM 可观测性平台,支持 trace、评估、提示词版本管理与成本分析。
Graphiti 是面向 Agent 记忆的时序知识图谱引擎,帮助系统持续沉淀长期上下文。
Google Workspace 命令行工具,统一管理 Drive、Gmail、Calendar、Sheets、Docs 等服务,内置 AI Agent 技能。
Open-AutoGLM 是一个开放的手机 Agent 模型与框架,支持 AI 自主操控手机界面完成任务,解锁 AI Phone 体验。
Haystack 是企业级 RAG 与搜索应用框架,支持文档处理、检索、生成与评估全链路。
FastMCP 是一个快速、Pythonic 的 MCP 服务器和客户端构建库,日均下载量超过 100 万次,让开发者轻松创建 Model Context Protocol 工具。
基于多智能体 LLM 的中文金融交易框架,TradingAgents 中文增强版,支持多数据源行情、实时新闻和 LLM 决策。
阿里巴巴开源的多 Agent 框架,支持可观测、可理解的 Agent 构建与运行,提供丰富的分布式 Agent 能力。
本地大语言模型运行工具,一条命令即可找到适合你硬件的模型,支持数百种模型和提供商,为 AI Agent 提供本地推理能力。
OpenAI 官方推出的轻量级多 Agent 工作流框架,支持构建复杂的多步骤 AI Agent 应用,提供工具调用、Agent 交接、安全护栏等核心功能。
Repomix 可将整个代码仓库打包为单一 AI 友好文件,方便将代码库提供给 Claude、ChatGPT、DeepSeek 等 LLM 进行分析、审查或生成代码。
Vercel AI SDK 是面向 Web 与全栈应用的 AI 开发工具集,支持流式输出、工具调用与 Agent 模式,适合在前后端统一技术栈中快速集成 Agent 能力。
通义千问推出的开源终端 AI 编程助手,支持代码生成、编辑、调试和多文件操作,可连接多种 LLM 后端。
基于 AI 的 Python 爬虫框架,利用大语言模型和知识图谱自动构建网页数据提取管道。
A2A(Agent-to-Agent)协议是 Google 提出的开放协议,允许不同框架和供应商构建的 AI Agent 之间进行互操作和协作通信。
基于 LLM 和智能体检索的文本转 SQL 生成工具,支持通过自然语言与 SQL 数据库对话,精准生成查询语句。
由 Charm 团队打造的开源智能编码 CLI,支持多种 LLM 后端,提供终端内的自主编程体验
Roo Code 是一款运行在 VS Code 和 JetBrains 中的自主编码 Agent 扩展,能在编辑器中直接创建/编辑文件和执行终端命令。
强大的 MCP 编码工具包,提供语义化代码检索和编辑能力,堪称 AI Agent 的 IDE
Mastra 是面向 TypeScript 生态的 Agent 构建平台,集成工作流、记忆、RAG、评测与部署能力,适合构建可扩展的全栈 AI Agent 应用。
AI Agent 调研技能,自动聚合 Reddit、X、YouTube、HN、Polymarket 等平台信息,生成有据可依的摘要报告。
Crawl4AI 是面向 LLM 与 Agent 的网页抓取工具,提供结构化提取、站点遍历、内容清洗与爬取控制能力,适合作为 Agent 获取外部网页知识的入口层。
开源编程 Agent CLI,支持 OpenAI、Gemini、DeepSeek、Ollama、Codex 及 200+ 模型的 OpenAI 兼容 API,是 Claude Code 的开源替代方案。
Crawlee 是一个面向 Node.js 的 Web 爬取和浏览器自动化库,支持 Puppeteer、Playwright、Cheerio 等多种引擎,专为构建可靠的爬虫而设计,可提取 HTML、PDF 等数据用于 AI、LLM 和 RAG 应用。
MCP Python SDK 是官方 Python 实现,用于构建 MCP server 与 Agent 端集成,适合在 Python Agent 项目中快速接入标准化工具协议。
OpenViking 是火山引擎开源的 AI Agent 上下文数据库,通过文件系统范式统一管理 Agent 的记忆、资源和技能,支持分层上下文交付与自演化。
专为 Claude Code 和 AI Agent 设计的营销技能包,涵盖 CRO、文案写作、SEO、分析和增长工程。
免费的本地开源 24/7 协作应用,支持 Gemini CLI、Claude Code、Codex 等多种编码 Agent 的统一管理和协作,提供聊天界面和多 Agent 工作空间。
Stagehand 是 Browserbase 推出的浏览器控制 Agent 框架,强调结构化网页操作、可重复自动化与开发者友好的浏览器任务编排,适合构建网页执行型 Agent。
Python 工作流编排框架,用于构建弹性数据管道和 AI 工作流,支持任务调度、状态管理和失败重试,适合从本地开发到分布式部署的全场景。
Letta(原名 MemGPT)是一个开源框架,用于构建具有高级推理能力和透明长期记忆的有状态 AI Agent。它允许你在服务器中可视化测试、调试和观察 Agent。
Jina AI Serve 是一个云原生多模态 AI 应用构建框架,支持构建 RAG 管道、Agent 系统和多模态搜索应用。
Activepieces 是一个开源 AI 工作流自动化平台,集成 400+ MCP Server 和 AI Agent,支持自动化业务流程编排。
Claude Code 的强大 GUI 工具包,可创建自定义智能体、管理交互式 Claude Code 会话、运行安全的后台智能体。
GenAI Agents 是一个包含 50 多个教程和实现的生成式 AI 智能体技术合集,覆盖从基础对话机器人到复杂多智能体系统的完整技术栈。
用于深度金融研究的自主Agent。自动分析财务报告、市场数据、公司财报,生成投资建议和风险评估报告。
基于 LangChain 和 LangGraph 构建的智能体工具框架,配备规划工具、文件系统后端和子智能体派生能力,可处理复杂智能体任务。
OpenAI Swarm 是一个轻量级多 Agent 协作框架,专注于简洁和可控性,适合学习和原型开发。
Skyvern 是面向浏览器任务自动化的 Agent 平台,通过页面理解与操作规划完成复杂网页流程,适合表单处理、后台操作与可重复 Web 自动化场景。
编程 Agent 的记忆增强工具,为 Claude Code、Codex 等编码 Agent 提供持久化上下文记忆,大幅提升长任务的一致性。
PostgreSQL 的开源向量相似性搜索扩展,为关系型数据库原生支持向量存储与 ANN 检索,是构建 AI Agent 记忆和 RAG 系统的基础设施组件。
MaxKB 是基于 LLM 大模型的开源知识库问答与 Agent 构建平台,支持向量检索、工作流编排与多种模型接入,开箱即用。
扣子(Coze)开源的 AI Agent 开发平台,提供可视化工具集,简化 Agent 的创建、调试和部署流程,支持一键发布到多渠道。
简单、开放的格式,用于指导编程Agent。通过结构化的AGENTS.md文件定义Agent行为、规则和技能,让AI编程助手更好地理解项目需求。
Promptfoo 是面向 LLM 应用与 Agent 的评测与回归测试工具,可批量比较提示词、工具调用结果与模型输出,适合为 Agent 工作流建立持续评测基线。
Dyad 是一款本地运行的 AI 应用构建工具,让用户通过自然语言对话快速创建和迭代 Web 应用,支持多种 LLM 提供商。
Blender 的 MCP 服务器,让 AI Agent 能够直接控制 Blender 3D 建模软件,实现自然语言驱动的 3D 场景创建、模型操作和渲染自动化。
Claude Code 插件,实时显示上下文使用情况、活动工具、运行中的智能体和待办进度,提升代理工作流可视化能力。
OWL 是优化的多 Agent 协作学习框架,面向真实世界的任务自动化场景,通过多 Agent 交互实现复杂任务的分解与执行。
Suna 是一个自主化企业操作系统,提供 AI Agent 驱动的自动化工作流,帮助企业实现从研究、数据分析到客户沟通等多种业务流程的智能化管理。
首个开源 Agentic 软件工程师,对标 Devin,支持 Claude 3、GPT-4、Gemini 等多模型,具备规划推理和网络浏览能力
探讨构建生产级 LLM 驱动软件的核心原则,总结出使智能体应用达到生产可用标准的十二个关键要素。
bolt.diy 是一个开源的 AI 全栈应用构建平台,支持使用任意 LLM 提示、运行、编辑和部署完整的 Web 应用程序,提供可视化开发环境。
实现 Manus 风格的持久化 Markdown 规划工作流的 Claude Code 技能,将智能体任务管理结构化。
Google Agent Development Kit (ADK) 是 Google 提供的 Agent 开发框架,支持构建复杂的 AI Agent 系统,提供工具集成、多模态处理等能力。
SWE-agent 能自动分析 GitHub Issue 并用 LLM 生成修复代码,支持网络安全审计和编程竞赛场景,NeurIPS 2024 论文项目。
面向科学研究、工程分析、金融和写作等领域的即用型 AI 智能体技能集合,支持多种编程代理。
Opik 是一个开源的 LLM 应用可观测性平台,提供 Agent 追踪、评估测试、提示词实验管理等功能,帮助开发者监控和优化 AI Agent 系统。
端到端的代码优先教程,教授如何构建生产级 GenAI 智能体,涵盖从原型到企业级部署的完整流程。
AI 驱动的深度研究助手,结合搜索引擎、网页抓取和大语言模型,通过迭代推理对任意主题进行深入调研
阿里巴巴通义实验室开源的深度研究 Agent,采用多阶段迭代式信息检索和推理架构,能够对复杂问题进行深度分析、综合和总结,支持网页搜索和文档分析。
DB-GPT 是开源的 Agentic AI 数据助手框架,集成多 Agent 协作、RAG、AWEL 工作流引擎,专为构建 AI+Data 应用设计。
为 Claude Desktop、Claude Code、Windsurf 和 Cursor 提供 n8n 工作流自动化的 MCP 服务,支持通过自然语言创建和管理工作流。
KiloCode 是一体化开源编程 Agent 平台,支持 VS Code 和 JetBrains,集成 200+ 模型,提供自主编码、调试和迭代能力,是 OpenRouter 上使用量最大的编程 Agent。
Agent Skills 是由 Addy Osmani 维护的生产级工程技能集合,为 AI 编码智能体提供经过实战验证的工程最佳实践与操作规范。
OpenAI 推出的 LLM 评估框架,提供标准化的基准测试注册表和工具集,用于系统评估大语言模型和 LLM 系统的性能表现。
面向所有人的自主 Agent 框架,TypeScript 构建,支持多平台部署和丰富的插件生态,可用于构建对话式 AI Agent、社交机器人等应用。
将任意 API 快速转化为付费 MCP 服务的工具,帮助开发者将现有 API 能力包装为 MCP 协议兼容的 Agent 工具,实现 AI Agent 的能力扩展。
面向客户交互的 AI Agent 控制框架,专为构建可控、一致、可预测的 LLM 客户对话而优化。
Parlant 是一个面向客户支持与对话流程的 Agent 平台,强调对话状态、工具调用与可控交互设计,适合构建服务型对话 Agent。
为 AI Agent 赋予全网搜索能力,一键读取和搜索 Twitter、Reddit、YouTube、GitHub、B 站、小红书等平台,无需 API 费用。
面向文档的 AI 助手平台,支持私有化部署,内置 Agent 构建器、深度研究、文档分析和多模型支持,适用于企业知识检索和智能问答场景。
高性能浏览器端LLM推理引擎,利用WebGPU在浏览器中直接运行大语言模型,无需服务器端计算,实现完全本地的AI推理。
Neovim AI 编程插件,将 Cursor AI IDE 的体验带入 Neovim,支持 AI 驱动的代码生成、编辑和聊天,深度集成 Neovim 生态。
Multica 是开源的托管式 Agent 平台,将编程 Agent 转化为真正的团队成员,支持任务分配、进度追踪和技能积累,实现 Agent 能力的持续复合增长。
自主 AI 编程循环工具,根据 PRD 需求文档反复执行代码修改任务,直到所有需求项全部完成为止。
SuperAGI 是一个面向开发者的开源自主 AI Agent 框架,支持快速构建、管理和运行自治智能体。
Page Agent 是阿里巴巴开发的 JavaScript 页面内 GUI 智能体,通过自然语言控制网页界面,实现自动化表单填写、页面导航和元素操作等任务。
Agent Zero 是一个通用 AI Agent 框架,支持自主任务规划、工具使用和代码执行,可用于构建各类自主 AI 助手。
灵活的异构LLM推理与微调优化框架,支持在消费级硬件上高效运行大语言模型,提供内核级优化和多种量化方案。
Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。
CAMEL 是面向多智能体协作场景的开源框架,支持角色扮演、任务分解与协同执行。
通用 CLI Hub 和 AI 原生运行时,将任意网站、Electron 应用或本地二进制文件转化为标准化命令行接口,专为 AI Agent 设计。
AI Agent 记忆知识引擎,仅需 6 行代码即可为 Agent 构建知识图谱和记忆层,支持图数据库、向量存储等多种后端,提供知识提取、推理和检索能力。
PydanticAI 基于类型系统构建 Agent,强调可验证的数据结构、工具调用与生产级可靠性。
PUA 是一个高能动性的 AI 智能体技能包,以'被寄予厚望的 P8 级工程师'为角色设定,驱动智能体在 30 天内持续改进和交付高质量成果。
全模态 RAG 框架,支持文本、图像、表格、公式等多种文档格式的检索增强生成,实现统一的知识问答能力。
ChatALL 可同时与 ChatGPT、Bing、Bard、Claude、ChatGLM、文心一言等十余种大模型并发对话,方便横向比较不同模型的回答质量。
RagaAI Catalyst 是面向 Agent AI 的可观测性、监控与评估框架,支持 Agent/LLM/工具链追踪、多 Agent 系统调试及自托管仪表盘分析。
基于 Qwen 大模型的 Agent 框架,支持函数调用、MCP 工具集成、代码解释器、RAG 检索增强生成和浏览器扩展等能力。
开放多Agent交互课堂,一键获得沉浸式多Agent学习体验。支持多角色AI教师、智能问答、个性化学习路径,重新定义在线教育。
Weaviate 是一个开源的向量数据库,支持存储对象和向量,允许将向量搜索与结构化过滤相结合。内置多种向量化模块,支持多模态数据搜索。
在浏览器中运行 AI Agent 的 Web 界面,提供可视化的浏览器自动化操作体验。
生产级多平台智能机器人开发平台,支持 Discord、Slack、Telegram、企业微信、飞书、钉钉、QQ 等多种 IM 平台,集成 Agent 编排、知识库和插件系统。
新一代数据资产编排平台,支持 AI 工作流和数据管道的开发、生产部署与可观测性管理,内置资产定义、调度和监控能力。
ChuanhuChatGPT 是轻量级多模型聊天 GUI,支持 Agent、文件问答、网络搜索与 GPT 微调,兼容 Ollama、Claude、Gemini 等主流模型。
基于三省六部制的多 Agent 编排系统,包含 9 个专业化 AI Agent,配备实时看板、模型配置和完整的审计追踪功能,适用于复杂的多 Agent 协作场景。
OpenAI 开源的编码 Agent 编排工具,将项目工作转化为隔离的自主实现运行,让团队能够管理任务而非监督编码 Agent 的每一步操作。
开源 AI 编码 Agent,专为大型项目和真实开发任务设计,支持终端操作、文件管理和多步骤代码生成,适合复杂软件工程场景。
全自主 AI Agent 渗透测试系统,基于多 Agent 架构执行复杂的网络安全渗透测试任务,支持 OpenAI、Anthropic 等多种模型后端。
DeepCode 是一个开放式智能编码平台,支持从论文生成代码(Paper2Code)、从文本生成网页(Text2Web)以及从文本生成后端服务(Text2Backend),利用智能体技术实现自动化软件开发流程。
全面的智能体技能集合,涵盖上下文工程、多智能体架构和生产级智能体系统,可用于构建、优化和调试需要高效上下文管理的智能体。
MemVid 是面向 AI Agent 的长期记忆层,利用视频编码实现轻量级单文件存储,替代复杂的 RAG 管线,提供即时检索能力。
OpenAI Agents SDK 是 OpenAI 官方提供的 Agent 开发工具包,支持构建多步骤工作流的 AI Agent,提供工具调用、状态管理等核心功能。
WrenAI 是一个开源的 Text-to-SQL 和 Text-to-Chart GenBI Agent,内置语义层,支持用自然语言查询数据库,自动生成 SQL 语句和可视化图表,兼容 PostgreSQL、BigQuery、Snowflake 等十余种数据源。
基于 Ghostty 的 macOS 终端工具,专为 AI 编程代理设计,提供垂直标签页、通知和多代理会话管理功能。
DeepEval 是一个用于 LLM 应用的开源评估框架。提供丰富的评估指标和工具,支持单元测试、集成测试,帮助开发者构建可靠的 LLM 应用。
llmware 是一个面向企业的统一 RAG 框架,支持小型专用模型的快速部署,提供知识图谱、文档解析、向量索引和 Agent 工具链,适合构建私有化合规的 AI 应用。
MCP Toolbox 是 Google 开源的数据库 MCP Server,支持 PostgreSQL、MySQL、BigQuery、Spanner 等多种数据库的 Agent 访问。
Botpress 是开源对话式 AI 平台,提供可视化流程编辑器、知识库集成、多渠道部署和 GPT/LLM Agent 构建能力,适合企业级聊天机器人开发。
Trigger.dev 是面向后台任务与工作流自动化的开源平台,适合承载长时运行、异步任务和 Agent 后台执行流程,为生产级 Agent 编排提供基础设施。
Unstructured 提供文档解析与清洗能力,是 RAG 数据摄取和预处理环节常用的开源组件。
为 AI 编程 Agent(如 Cursor)提供 Figma 设计稿布局信息的 MCP 服务器,实现设计到代码的精准转换。
将 Claude Code 变身为完整游戏开发工作室的开源工具包,包含 49 个专业 AI Agent 和 72 个工作流技能,模拟真实工作室团队协作体系。
多Agent工作空间管理器,支持Agent团队协作、任务调度、资源分配。提供统一的工作空间视图,让多个Agent高效协同工作。
QAnything 是网易有道开源的本地知识库问答系统,支持任意格式文件,提供离线 RAG 能力,可快速搭建私有知识问答。
腾讯开源的 LLM 驱动的文档理解与语义检索框架,基于 RAG 范式实现深度文档分析和上下文感知问答。
Ragas 是一个用于评估 RAG(检索增强生成)系统的框架。提供多种评估指标,包括忠实度、答案相关性、上下文精确度等,帮助开发者优化 RAG 应用性能。
CUA 是开源的计算机使用 Agent 基础设施,提供沙箱、SDK 和基准测试,支持 AI Agent 控制完整桌面环境。
基于 AST 的代码结构化搜索、检查和重写 CLI 工具,使用 Rust 编写,支持 20+ 编程语言,为 AI 编程 Agent 提供精准的代码模式匹配能力。
面向 24/7 主动式 Agent 的记忆系统,支持 MCP 协议集成,为持续性运行的 AI Agent 提供长期记忆管理、技能存储和主动推理能力。
Agent 原生记忆基础设施,将 Agent 执行过程和对话转化为结构化持久状态,提供 LLM 无关的记忆管理层,支持 MCP 集成和 Python/TypeScript 双语言 SDK。
上下文工程入门指南,系统讲解如何为 AI 编程助手构建高质量上下文,以 Claude Code 为核心示例,适用于任何 AI 编程工具。
AG-UI 是 Agent-User Interaction Protocol 的开源实现,定义了 AI Agent 与前端应用之间的标准化交互协议,由 CopilotKit 团队发起。
在Docker中部署无头浏览器,支持云端运行或本地部署,为AI Agent提供强大的网页自动化和渲染能力,免费用于非商业用途。
Rowboat 是一个开源的 AI 协作平台,内置长期记忆能力,支持多轮对话和上下文保持,可作为一个具备记忆功能的 AI 助手进行知识管理和任务协作。
Instructor 是一个 Python 库,为 LLM 提供结构化输出能力,基于 Pydantic 模型定义让 AI Agent 获得可靠的类型化响应,是构建 Agent 工具调用的关键基础设施。
AI 驱动的视觉化 UI 自动化工具,支持自然语言描述操作,告别传统选择器,兼容浏览器和移动端
NanoBrowser 是开源 Chrome 扩展,提供 AI 驱动的多 Agent 浏览器自动化,支持使用自有 LLM API Key 运行网页任务工作流。
基于大语言模型的自动化渗透测试 Agent 框架,利用 LLM 驱动安全测试和漏洞发现。
集成语义搜索、LLM 编排和语言模型工作流的全能 AI 框架,支持 Agent、RAG 和向量数据库
OpenLLM 是一个开源 LLM 部署平台,可将 DeepSeek、Llama 等任意开源模型以 OpenAI 兼容的 API 端点形式部署到云端。支持模型微调、量化和分布式推理,简化生产环境中的大模型运维。
EleutherAI 推出的大语言模型评估框架,提供标准化的少样本评测流水线,支持数百项基准任务,是 LLM 社区广泛采用的核心评测工具。
MCP TypeScript SDK 是官方 TypeScript 实现,用于构建 MCP server 与客户端集成,适合在 JS/TS Agent 生态中标准化工具协议接入。
基于视觉模型的 OCR 与文档提取工具,支持将 PDF、图片等文档高效转换为结构化文本。
强大的AI编程Agent,专为终端设计。支持代码生成、重构、调试,提供智能建议和自动化工作流。
使用 AI 编程代理一键克隆任何网站的模板工具,基于 Next.js 和 React 构建,集成网页抓取和自动代码生成功能。
Chainlit 是构建 LLM/Agent 对话应用的开源 UI 与开发框架,便于快速发布交互式助手。
基于 eBPF 的 Kubernetes 网络可观测性工具,支持 L4/L7 流量索引和完整 K8s 上下文分析,可通过 MCP 协议为 AI Agent 提供网络诊断能力。
将 FastAPI 端点暴露为 MCP 工具的库,支持认证功能,让 AI 代理直接调用现有 API
E2B 提供面向 AI Agent 的安全云沙箱运行环境,支持代码执行、文件操作与隔离计算,适合作为代码 Agent、数据 Agent 与自动化任务的执行层。
LangChain4j 是面向 Java 生态的 LLM 集成框架,提供统一 API 接入主流大模型和向量数据库,支持 RAG、工具调用、MCP 协议及 Agent 构建,无缝集成 Spring Boot 等企业框架。
LLM 是 Simon Willison 开发的开源命令行与插件框架,用统一接口连接多种模型,并支持嵌入、模板、工具扩展与实验型 Agent 工作流,适合开发者快速验证想法。
极简主义 AI 搜索引擎,帮助用户在互联网上查找信息并引用来源,基于 Vercel AI SDK 构建,支持多种 AI 模型。
智源研究院开源的 BGE 系列嵌入模型与检索工具,提供业界领先的中英文文本嵌入与重排序模型,广泛应用于 RAG 系统和 AI Agent 检索链路。
工业级全流程 AI 影视生产平台,从短视频到真人影视制作,覆盖剧本、拍摄、后期全流程。
Pipecat 是一个开源的语音和多模态对话 AI 框架,支持构建实时语音助手、视频代理和多模态智能体,集成多种 TTS、STT 和 LLM 服务。
PAL MCP Server 将 Claude Code、GeminiCLI 和 CodexCLI 与多种大模型(Gemini、OpenAI、OpenRouter、Azure、Grok、Ollama 等)统一为一个协同工作的 MCP 服务。
Portkey AI Gateway 是一个高性能 AI 网关,支持路由到 200+ LLM 提供商,内置 50+ AI 安全护栏,提供统一 API 接口。
开源 LLM DevOps 平台,提供 GenAI 工作流、RAG、Agent、模型管理、评估、数据集管理和企业级系统管理等一站式 AI 应用开发能力。
Google NotebookLM 的非官方 Python API 和智能体技能,提供对 NotebookLM 功能的完整编程访问,包括 Web UI 未暴露的能力,支持 Python、CLI 和 AI 智能体调用。
Chrome 扩展形式的 MCP 服务器,将浏览器功能暴露给 AI 助手,支持复杂浏览器自动化、内容分析和语义搜索。
TensorZero 是面向 LLM 应用与 Agent 系统的开源推理网关和优化平台,强调高性能推理、实验评测、路由控制与生产级观测能力。
Promptflow 是面向 LLM 应用与 Agent 工作流的开发与评测工具链,支持可视化编排和调试。
LlamaGPT 是一个自托管的离线 ChatGPT 替代方案,基于 Llama 2 构建,100% 私有化运行,数据不离开设备,支持 Code Llama,可通过 Umbrel 一键部署。
开源 AI PR 审查 Agent,自动分析 Pull Request 并生成代码审查意见、改进建议和 PR 描述,支持 GitHub、GitLab、Bitbucket 等主流代码托管平台。
开源的计算机使用 Agent 框架,像人类一样操作图形界面完成复杂任务,支持自主学习和经验积累。
LEANN 是一个高效的个人设备端 RAG 引擎,在保持 97% 存储压缩的同时实现快速、准确的检索增强生成。完全本地化运行,保障数据隐私,适合在消费级硬件上部署 RAG 应用。
Eino 是字节跳动开源的 Go 语言 LLM 应用开发框架,提供类型安全的编排、流式处理、工具调用与 RAG 管道,适合构建高性能的 AI Agent 应用。
HuggingChat UI 是 HuggingFace 开源的聊天界面,驱动 HuggingChat 服务,支持多种开源大模型的对话交互。
OpenHarness 是一个开放式智能体工具平台,内置个人智能体 Ohmo,提供智能体开发、测试和部署的一体化解决方案。
开源的智能体浏览器,可作为 ChatGPT Atlas 和 Perplexity Comet 的替代方案,将浏览器转变为 AI 驱动的智能操作系统。
HumanLayer 为 AI 编程 Agent 提供人机协作层,让 Agent 在复杂代码库中遇到难题时能寻求人类审批和指导,提升代码生成准确性与安全性。
TEN Framework 是一个开源的对话式语音 AI Agent 框架,支持实时多模态交互。
PocketFlow 是一个极简的 100 行 LLM 框架,支持用 Agent 构建 Agent,通过简洁的抽象层实现复杂的 AI Agent 工作流。
ValueCell 是一个面向金融应用的多 Agent 平台,通过社区驱动的多智能体协作实现金融分析、交易策略和市场研究等任务。
Orama 是一个轻量级(不到 2KB)的全文搜索和 RAG 管道引擎,可运行在浏览器、服务器或边缘网络。支持全文搜索、向量搜索和混合搜索,适合构建 AI 驱动的搜索体验。
GitHub官方Copilot命令行工具,将Copilot编程Agent的能力直接带到终端。支持代码生成、命令建议、错误修复等。
展示 RAG、智能体、工作流和其他 AI 用例的项目合集,提供丰富的实践示例和教程资源。
OpenSandbox 是阿里巴巴开源的安全、快速、可扩展的 AI Agent 沙箱运行时环境。
LiveKit Agents 是 LiveKit 推出的实时语音与多模态 Agent 框架,面向电话、语音助手与实时互动场景,适合构建低延迟的语音 Agent 体验。
Hive 是一个面向生产环境的多 Agent 执行框架,提供状态管理、故障恢复、可观测性和人机协作能力,支持自动生成多 Agent 拓扑来处理复杂业务工作流。
开源的 Claude Code / Cursor CLI / Codex Web 界面,支持在移动端和 Web 端远程管理 AI 编码会话和项目。
开源的多模态嵌入式向量检索库,支持零服务器部署,提供 Lance 列式格式实现高效向量搜索和过滤,适用于 AI Agent 长期记忆与 RAG 场景。
Hindsight 是一个能自主学习的 Agent 记忆系统,支持记忆保留、回忆与反思,为 AI Agent 提供持续积累经验的长期记忆能力。
AI编程Agent的通用技能加载器,支持一键安装各种技能包。扩展Agent能力,提供代码审查、测试生成、文档编写等技能。
面向 AI Agent 时代的代码编辑器,支持并行运行多个 Claude Code、Codex 等编码 Agent 实例
MCP Use 是一个围绕 Model Context Protocol 的工具编排项目,帮助 Agent 快速接入 MCP server、统一工具调用接口,并提升多工具协作的一致性与可移植性。
微软研究院推出的人机协作 Web Agent 原型系统,强调人在回路中的交互设计,支持用户与 AI Agent 协同完成网页浏览和数据采集任务。
由 YC 总裁 Garry Tan 打造的 OpenClaw/Hermes Agent 大脑配置,提供优化过的代理系统提示和工作流。
微软官方多语言 Agent 框架,支持 Python 和 .NET,提供图式工作流编排、OpenTelemetry 可观测性和 DevUI 调试工具。
LangChain 开源的异步编码 Agent,基于 LangGraph 构建,支持自主完成软件工程任务,包括代码生成、调试和文件编辑等异步工作流。
基于 TypeScript/React 的 AI 聊天界面组件库,提供可定制的高质量聊天 UI 组件,支持多种 AI 模型提供商。
MCP Inspector 是面向 Model Context Protocol 生态的调试与检查工具,帮助开发者验证 MCP server 行为、观察工具协议交互并排查接入问题。
高性能 Python PDF 处理库,支持数据提取、分析、转换和操作,是 RAG 系统中文档解析的核心工具。
阿里巴巴开源的轻量级高性能进程内向量数据库,采用 C++ 核心实现,支持 Node.js 和 Python 绑定,适用于 RAG、Agent 记忆和向量检索场景。
AI 驱动的自主网页浏览框架,让 AI Agent 像人一样点击、输入、导航和提取数据,支持 OpenAI、Anthropic 和 Google 模型。
OpenRLHF 是一个高性能的 Agent 强化学习框架,基于 Ray 和 vLLM 提供 PPO、DAPO、REINFORCE++ 等算法,支持 Agent 和 VLM 的大规模训练。
Phoenix 是面向 LLM 与 Agent 应用的开源观测与评估工具,支持在线追踪与离线诊断。
科大讯飞开源的企业级 Agent 工作流平台,提供商业化友好的 SuperAgent 构建能力,支持复杂工作流编排与多 Agent 协同。
Spring AI Alibaba 是面向 Java 开发者的 Agentic AI 框架,基于 Spring 生态提供多智能体协作、工作流编排和 RAG 能力。
Databend 是一个面向 AI Agent 的现代数据仓库,统一了分析、搜索和 AI 能力。支持 Python 沙箱、向量搜索和全文搜索,可直接在 S3 上运行,为 AI 智能体提供即时的数据查询与分析能力。
ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。
用Rust编写的终端编程Agent,提供高性能和内存安全。支持代码生成、文件编辑、命令执行等完整的开发工作流。
全自动化零代码 LLM Agent 框架,用户无需编写代码即可构建和部署自定义 AI Agent,支持自然语言驱动的 Agent 创建。
LangChainGo 是 Go 语言版本的 LangChain 框架,提供构建 LLM 驱动程序的最简方式,支持链式调用、Agent 和工具集成。
下一代多租户 AI 一站式解决方案,内置管理和计费系统,企业级统一 LLM 网关支持 200+ 模型和 35+ 供应商。
DeepLake 是面向 AI Agent 的数据运行时,提供无服务器 Postgres 和多模态数据湖,支持可扩展的数据检索与训练。专为 AI 智能体场景设计,统一向量存储、数据集管理和流式加载。
Crucix 是一个个人情报智能体,持续监控多个数据源,当检测到重要变化时主动通知用户,帮助用户实时掌握信息动态。
AWS 官方 MCP 服务器集合,为 AI Agent 提供 AWS 服务集成能力,覆盖 Lambda、S3、DynamoDB、Bedrock 等核心服务。
Intel 开源的大语言模型推理加速与微调工具,支持 LLaMA、Qwen、DeepSeek 等主流模型在 Intel GPU 上高效运行,无缝集成主流 Agent 框架。
上下文工程入门手册,受Karpathy和3Blue1Brown启发,系统讲解如何超越提示工程,掌握上下文设计、编排和优化的完整方法论。
连接 AI 助手与 Unity 编辑器的 MCP 桥接工具,让 Claude、Cursor 等 LLM 能够直接管理 Unity 资产、控制场景、编辑脚本和自动化游戏开发任务,实现自然语言驱动的游戏开发工作流。
KAG 是基于 OpenSPG 引擎和 LLM 的逻辑形式引导推理与检索框架,用于构建专业领域知识库的逻辑推理和事实问答解决方案,有效克服传统 RAG 向量相似度计算模型的不足。
Go 语言实现的 Model Context Protocol SDK,支持在 LLM 应用与外部数据源和工具之间无缝集成
Reor 是一个本地优先的 AI 个人知识管理应用,所有数据和处理均在本地完成。支持 RAG 检索增强生成、语义搜索和知识图谱,帮助用户高效管理和利用个人知识库,同时确保数据隐私。
Spring 官方推出的 AI 工程应用框架,为 Java 和 Spring 生态提供统一的 LLM 集成、向量存储、函数调用、RAG 和 Agent 开发能力,支持 OpenAI、Anthropic、Ollama 等主流模型提供商。
为 Ghidra 逆向工程平台提供 MCP 协议支持,让 AI Agent 能够自主进行二进制分析和漏洞发现。
自主 LLM Agent 框架,支持复杂任务的自动分解、工具调用与多步推理,由 OpenBMB 团队开发
UFO 是微软开发的 Windows GUI 自动化 Agent,能理解屏幕界面并通过自然语言指令执行复杂操作系统任务。
GitHub官方多平台SDK,用于将GitHub Copilot Agent集成到应用和服务中。支持多种编程语言和平台,提供统一的Agent API接口。
MemOS 是面向 LLM 和 Agent 系统的记忆操作系统,统一存储、检索与管理长期记忆,支持知识库、多模态记忆与工具记忆。
Context Mode 是面向 AI 编程 Agent 的上下文窗口优化工具,通过沙盒化工具输出实现 98% 的上下文缩减,支持 12 个主流编程平台。
功能丰富的 ChatGPT 用户界面,支持网页端和多平台桌面应用,提供增强的对话管理、提示词模板和模型参数调节功能。
VoltAgent 是一个面向现代 TypeScript 生态的 Agent 平台,聚焦工作流、工具编排与应用集成,适合构建生产级 Web Agent 与自动化产品。
Lark CLI 是飞书官方命令行工具,覆盖即时通讯、文档、多维表格、日历、邮件、任务、会议等核心业务领域,内置 200+ 命令和 20+ AI 智能体技能,为人类和 AI 智能体提供统一的飞书操作接口。
mcp-agent 是 LastMile AI 推出的 MCP Agent 构建工具,帮助开发者将 Model Context Protocol 工具接入多步骤 Agent 工作流,适合构建标准化的工具调用体系。
Xcode 首个 AI 编程助手扩展,支持 GitHub Copilot、Codeium 和 ChatGPT,将主流 AI 代码补全和对话能力直接集成到 Apple 开发工作流。
HexStrike AI 是高级 MCP 服务器,让 AI Agent 自主运行 150+ 网络安全工具,实现自动化渗透测试和漏洞发现。
7x24 小时在线的 AI Agent 团队,自动完成信息收集、数据分析和内容生成等持续运营任务。
专为复杂研究和预测任务优化的深度研究 Agent 框架,其 MiroThinker-1.7 和 MiroThinker-H1 模型在 BrowseComp 基准上分别达到 74.0 和 88.2 分,支持多步骤推理和信息检索。
HeyGen 开源的 HTML 到视频渲染工具,专为 AI Agent 设计,支持通过编写 HTML 模板自动生成视频内容。
BAML 是一个 AI 提示工程框架,通过类型安全的提示定义、自动测试、版本管理和多模型支持,将工程化实践引入 LLM 提示开发流程。
GitMCP 是免费的远程 MCP 服务器,让 AI Agent 能够理解和访问任意 GitHub 项目代码库,消除代码幻觉问题。
可扩展的工作流开发框架,内置画布、表单、变量和物料组件,帮助开发者更快更简单地构建AI工作流平台。
面向金融科技和企业场景的 Agent 框架,提供任务编排、工具集成和生产级可靠性,支持多种 LLM 后端。
生产级 Agentic RAG 系统,提供 RESTful API 和完整的多模态文档解析、混合搜索、知识图谱构建能力,支持 Agent 化的检索增强生成流程。
新一代 Android RPA 自动化 Agent 框架,支持通过 Agent 驱动的方式操控 Android 设备,实现界面元素的智能识别与自动化操作,适用于移动端测试、自动化运维和智能助手场景。
Sweep 是一款面向 JetBrains IDE 的 AI 编程助手,能够自动处理 GitHub Issue 并提交代码变更,将软件开发工作流自动化。
Stream 开源的视觉与语音智能体框架,支持任意模型和视频提供商,利用边缘网络实现超低延迟的实时多模态 AI 交互。
基于 Weaviate 向量数据库的开源 RAG 聊天机器人,支持多种数据导入方式、多 LLM 后端和多种嵌入模型,开箱即用的检索增强生成解决方案。
Google 开源的钱包优先 Go 语言 AI Agent 开发工具包,提供代码优先的方式构建、评估和部署复杂的 AI Agent,支持灵活的工具集成、多轮对话管理和流式响应,与 Gemini 及其他主流 LLM 无缝衔接。
多语言文档智能提取框架,基于 Rust 核心引擎支持 PDF、Office、图片等 91+ 格式,提供 MCP 服务器、CLI 和 REST API 接入。
Mintlify 是面向开发者文档与 AI 搜索体验的内容平台,适合为 Agent 工具链、SDK 与 API 产品提供结构化文档入口,也有助于提升 AI 助手可检索性。
灵活强大的多智能体管理框架,支持在多个 AI 智能体之间编排复杂对话,兼容 OpenAI、Anthropic、AWS Bedrock 等主流 LLM 提供商。
Agent Squad 是 AWS 开源的 Multi-Agent 编排框架,支持多 Agent 协作处理复杂对话。
NVIDIA 开源的 LLM 漏洞扫描器,可自动检测大语言模型中的安全漏洞、幻觉倾向、越狱风险和提示注入等安全问题,是 LLM 安全评估的核心工具。
Claude Code本地可运行版本,新增跨平台桌面端软件和Computer Use功能,附带核心模块解析,为开发者提供本地化的AI编程助手。
单二进制运行时,用于构建和运行自主Agent。无需Python或Node.js,只需定义角色即可。提供轻量级、高性能的Agent开发框架。
Evidently 是一个开源 ML 和 LLM 可观测性框架,提供 100+ 评估指标,用于测试、监控和评估 AI 驱动的系统。
Refly 是首个开源的智能体技能构建器,通过可视化工作流定义技能,可在 Claude Code、Cursor、Codex 等多个平台上运行,将技能作为基础设施而非简单提示词。
轻量级纯Markdown技能,实现自主ML研究:跨模型评审循环、想法发现和实验自动化。无需框架,无锁定,支持Claude Code、Codex等任何LLM Agent。
多 AI 终端代理管理器,可在终端中同时运行和管理 Claude Code、Codex、OpenCode 等多个编码代理
OpenLLMetry 是基于 OpenTelemetry 的开源 LLM 应用可观测性工具,提供追踪、指标和监控能力。
基于Rust构建的快速灵活LLM推理引擎,支持多种模型架构和量化方案,提供高性能的本地LLM部署能力。
基于 Rust 构建的模块化、可扩展 LLM 应用开发库,提供智能体编排、工具调用、RAG 管道等核心功能,适合构建高性能 AI 智能体系统。
PraisonAI 是低代码多 Agent 框架,支持 Agent handoff、guardrails、记忆、RAG、100+ LLM 提供商,可部署到 Telegram、Discord 和 WhatsApp。
动态、弹性的AI编排平台,协调数据、模型和计算资源来构建AI工作流,支持可扩展的机器学习流水线和生产级AI工作负载管理。
big-AGI 是一个功能丰富的 AI 套件,提供多模型并行聊天、AI 人设、文本转图片、语音合成、代码高亮执行、PDF 导入等功能,支持本地部署或云端运行。
OpenCompass 是一个全面的 LLM 评估平台,支持 Llama、Mistral、GPT-4、Qwen、GLM、Claude 等多种模型在 100+ 数据集上的基准评测。
Steel Browser 是一个专为 AI Agent 和应用设计的开源浏览器沙盒,提供完整的浏览器 API,支持会话管理、代理集成和自动反检测,让开发者无需关注基础设施即可实现 Web 自动化。
基于 LLM 的多 Agent 搜索引擎框架,类似 Perplexity.ai Pro 和 SearchGPT,实现智能 Web 搜索。
AI 驱动的 PPT 生成工具,从任意文档自动生成原生可编辑的 PPTX 文件,输出真正的 PowerPoint 图形元素而非图片。
基于大语言模型的开源 AI Agent 金融分析平台,提供智能投研、市场预测和金融报告生成能力。
Model Context Protocol 官方社区驱动的 MCP 服务器注册中心,提供 MCP 服务器的发现、发布和版本管理功能,是 MCP 生态的核心基础设施。
Guardrails AI 为大语言模型添加可编程的安全护栏,通过输入输出验证、结构化数据提取和自定义校验器确保 LLM 应用的可靠性和安全性。
AppAgent 是基于 LLM 的多模态智能体框架,让 AI 能够像人类一样操作智能手机应用,支持触控交互和自主探索。
TalkToFigma 是一个 MCP 集成工具,让 AI 代理(Cursor、Claude Code)能够与 Figma 通信,实现设计稿的读取和程序化修改。
为OpenClaw AI Agent提供图形化界面的桌面应用,将CLI式的AI编排转变为桌面体验,无需使用终端即可管理AI Agent。
Julep 是面向 AI Agent 的无服务器工作流部署平台,可大规模部署 AI 工作流,被称为 AI Agent 的 Firebase。
stagewise 是专为 Web 开发者构建的浏览器内编程 Agent,将 AI 编码能力直接集成到浏览器中,支持从网页界面直接与代码交互。
Superagent 是一个 AI 应用安全防护平台,提供提示注入防护、数据泄露检测和有害输出过滤,可嵌入任何 AI 应用中。
Unstract 是一个由 LLM 驱动的非结构化数据提取平台,专为 API 部署和 ETL 管道工作流而设计。支持从文档、PDF、图片等非结构化数据源中智能提取结构化信息,构建自动化数据处理管道。
使用 AI Agent 自动玩街头霸王 II 冠军版的开源项目。通过视觉识别和强化学习技术实现游戏角色的自主操控,展示了 AI Agent 在实时游戏场景中的应用潜力。
IntentKit 是一个开源的自托管云智能体集群平台,管理协作式 AI 智能体团队,支持多智能体协作完成复杂任务。
面向并行编码 Agent 的编排工具,自动规划任务、生成 Agent 实例并自主处理 CI 修复、合并冲突和代码审查,支持多 Agent 协同完成复杂开发任务。
BrowserMCP 是一个基于浏览器扩展的 MCP 服务器,让 Claude、Cursor 等 AI 应用能够直接控制和自动化浏览器操作。
AI 原生代理和数据平面,内置编排、安全防护、可观测性和智能 LLM 路由功能,帮助开发者专注于 Agent 核心逻辑,简化 LLM 应用的生产部署。
可在笔记本电脑上本地运行的 LLM Playground,支持多种模型快速切换对比,适合开发者在本地进行 prompt 测试和模型评估。
Swarms 是企业级多 Agent 编排框架,提供生产就绪的多 Agent 协作能力,支持大规模 Agent 集群部署。
LaVague 是大型动作模型(LAM)框架,用于开发 AI 网页 Agent,结合 RAG 技术实现自然语言驱动的浏览器自动化操作。
由 Google Cloud 团队开发的 AI Agent 快速部署模板,内置 CI/CD、评估和可观测性功能,帮助开发者几分钟内将 AI Agent 部署到 Google Cloud 生产环境。
GSD-2 是一个强大的元提示、上下文工程和规范驱动开发系统,使 AI 智能体能够长时间自主工作而不偏离全局目标,保持上下文连贯性。
开源的 AI Agent 上下文检索层,支持从多种数据源自动提取、索引和检索结构化上下文信息,帮助 AI Agent 更准确地理解和利用企业知识库。
开源深度研究代理,利用 Firecrawl 提取大规模网页数据,结合 AI Agent 进行迭代推理和综合分析,生成高质量的深度研究报告。
将 PDF、文档和图片转换为结构化数据的文档处理管道,支持表格识别、阅读顺序还原和 Markdown 输出。
TaskWeaver 是微软开源的代码解释器式 Agent 框架,适用于数据分析与复杂任务自动化。
Firecrawl 官方 MCP 服务器,为 Claude、Cursor 等 LLM 客户端提供强大的网页抓取和搜索能力。
Claude Context 是一个代码搜索 MCP 工具,可将整个代码库作为上下文提供给 Claude Code 等编码智能体。基于向量检索技术实现高效的代码语义搜索,帮助 AI 编程助手更精准地理解和处理大型项目。
基于基因组进化协议(GEP)的AI Agent自我进化引擎,让AI Agent能够自主优化和演化,实现持续改进的能力升级。
NVIDIA NeMo Guardrails 是一个开源工具包,用于为基于 LLM 的对话系统添加可编程的安全护栏,支持话题控制、安全防护和对话引导。
本地化的聊天记录分析工具,通过 AI Agent 回顾和分析社交记忆,支持多平台聊天数据导入和可视化分析,帮助用户重新发现社交记忆。
DevOpsGPT 是一个面向 AI 驱动软件开发的多智能体系统,结合 LLM 与 DevOps 工具,将自然语言需求转化为可运行的软件,支持任意开发语言并可在现有代码基础上扩展。
完全本地运行的搜索聚合器,使用 LLM Agent 链式协作来回答用户问题。无需 OpenAI 或 Google API 密钥,所有搜索和推理过程都在本地完成,注重隐私保护。
一个 Claude 技能模块,为 AI 编程智能体提供网页浏览器使用能力,实现浏览器自动化操作。
零配置代码流工具,为 Claude Code 和 Codex 提供一键式项目初始化和上下文管理。
DesktopCommanderMCP 是一个 MCP 服务器,为 Claude 等 AI 助手提供终端控制、文件搜索和差异编辑功能。
Atomic Agents 是一个模块化的 AI 智能体构建框架,采用原子化设计理念,提供可组合的组件来构建智能体系统,包含工具、流水线和内存管理等核心模块。
Open Multi-Agent 是一个轻量级 TypeScript 多智能体框架,通过一次 runTeam() 调用实现自动任务分解与并行执行,仅 3 个依赖,可部署在任何 Node.js 运行环境中。
精选的AI工具系统提示词集合,适合AI Agent构建者和提示工程师。包含ChatGPT、Claude、Perplexity、Manus、Claude-Code等顶级AI工具的系统提示词。
MCP 集成平台,让 AI Agent 能够可靠地使用各类工具,提供 MCP 服务器、客户端和集成解决方案,支持大规模 Agent 工具调用场景。
PySpur 是一个可视化 Agent 工作流编辑平台,支持拖拽式构建 AI Agent 管道,内置评估测试和人机协作循环。
Strands Agents SDK 是 AWS 开源的 Agent 框架,采用模型驱动的方法构建 AI Agent,内置工具使用、对话记忆和多 Agent 协作能力。
为 AI Agent 提供安全、本地化、跨平台和可编程的沙箱环境。基于微虚拟机技术实现严格的资源隔离,确保 Agent 执行代码时的安全性和可控性。
AI Agent源码深度研究报告,系统性地分析主流AI Agent框架的架构设计、核心原理和实现细节。
跨平台聊天机器人框架,支持 Discord、Telegram、QQ 等多个平台,通过插件化架构实现高度可扩展的对话式 AI 能力。
OpenSpace 是一个让 AI 智能体更智能、更低成本、具备自进化能力的平台,通过优化智能体架构和推理流程实现高效的自主进化。
AI Agent 操作系统,为大规模部署和管理 LLM Agent 提供基础运行时环境。支持 Agent 调度、内存管理、工具注册和并发执行等核心操作系统功能。
WhatsApp MCP Server 为 AI 助手提供 WhatsApp 消息收发能力,让 Claude 等大模型能够通过 MCP 协议直接与 WhatsApp 交互。
Ottomator Agents 收集了多种可运行的 Agent 示例与自动化模式,覆盖研究、浏览器操作、工具调用与多步骤流程,适合作为学习现代 Agent 实践的案例库。
Helicone 是面向大模型应用的开源代理与监控平台,提供请求追踪、缓存与成本分析能力。
UltraRAG 是一个低代码的 MCP 框架,用于构建复杂和创新的 RAG 管道。通过可视化界面和 MCP 协议集成,开发者可以快速搭建从数据摄取、分块、检索到生成的完整 RAG 系统。
AgentOps 是一个 AI Agent 可观测性平台,提供 Agent 监控、调试和评估功能,帮助开发者优化 Agent 性能。
基于 Playwright 的 MCP 服务器,支持在 Claude Desktop、Cline、Cursor 等 AI 编码工具中自动化浏览器和 API 操作
新一代 AI Agent 优化平台,提供从开发、调试、评估到监控的全生命周期管理能力,支持 Prompt 管理、Agent 评估和 LLM 可观测性。
多模型 AI 智能体桌面客户端,支持连接任意 AI 提供商,通过 MCP 和技能扩展功能,可从手机远程控制,基于 Electron 和 Next.js 构建。
一个专为人类与 AI Agent 协作设计的项目管理工具,基于 Git 生态系统运行。支持任务分配、进度追踪和文档管理,让 AI 代理和人类开发者高效协作。
高性能LLM推理API和聊天界面,集成DeepSeek R1的思维链推理与Anthropic Claude模型,实现深度推理能力。
面向个人 AI Agent 的智能模型路由系统,通过动态选择最优 LLM 模型来降低高达 70% 的调用成本,支持多种主流模型提供商的无缝切换。
开源 LLM Agent 评估与测试库,提供自动化模型扫描、偏见检测、性能基准测试和合规检查,帮助团队在部署前全面验证 AI Agent 质量。
Sentry 出品的 MCP Server 和 CLI 工具,为 AI Agent 提供 iOS 和 macOS 项目的构建、测试与开发辅助能力,是 Apple 平台 Agent 开发的重要工具。
Claude Coder 是一款 VSCode 扩展形式的自主编码 Agent,能将设计稿转化为代码、自动修复 lint 错误、编写测试并执行复杂的多文件代码变更,支持 Agent 模式进行自主任务执行。
754个结构化AI Agent网络安全技能,映射MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS等5大安全框架,覆盖26个安全领域,支持Claude Code、Codex CLI等20+平台。
字节跳动火山引擎推出的主动式上下文感知 AI 工具,通过上下文工程技术为 AI Agent 提供精准的项目理解和代码上下文管理能力。
AI 聊天浏览器,提供对 ChatGPT、Claude、Bard、Bing、Llama 等多种 AI 模型的全功能 Web 访问,支持快速切换和并行使用。
Windows MCP 是一个面向 Windows 桌面的 MCP 服务器,为 AI 代理提供计算机使用能力,支持桌面自动化和系统操作。
领先的工作流编排平台,在无服务器、服务器或边缘环境上运行有状态的步骤函数和AI工作流,支持持久化执行和事件驱动架构。
跨平台桌面 AI 助手和 MCP 客户端,兼容主流大模型服务商,支持本地知识库和通过 MCP 协议连接外部工具,提供一站式的智能对话和工具调用体验。
Sparrow 是一个结构化数据提取工具,支持通过机器学习、LLM 和视觉语言模型从文档中提取结构化数据并进行指令调用,适用于 RAG 管道中的文档解析环节。
由 NVIDIA 开发的自主 AI Agent 安全运行时环境。专注于隐私保护和安全执行,为 AI Agent 提供受控的执行环境和资源管理能力。
面向 LLM Agent 应用的强化学习桥梁,提供简单灵活的 RL 训练框架来优化 Agent 性能。
自进化 Agent 框架,从 3300 行种子代码生长出完整技能树,实现全系统控制,token 消耗降低 6 倍。
由网易有道开发的全场景 AI Agent 平台,7x24 小时自动化执行各类任务。支持多模型调度、工具集成和智能工作流编排,帮助企业实现智能化办公。
ROMA (Recursive-Open-Meta-Agent) 是一个元智能体框架,用于构建高性能多智能体系统,支持递归式任务分解与协调。
AgentVerse 是清华 OpenBMB 团队的多 Agent 部署框架,提供任务求解和仿真两种范式,支持多 LLM Agent 协作完成复杂任务。
面向 Atlassian 工具(Confluence、Jira)的 MCP Server,让 AI Agent 能直接读取和操作 Jira 任务、Confluence 文档等企业协作数据。
ComfyUI 的 AI 驱动自定义节点,通过自然语言对话增强工作流自动化,提供智能节点推荐和参数配置。
集成 LightRAG 知识库与知识图谱的多租户 Agent 管理平台,基于 LangChain、Vue 和 FastAPI 构建,支持 DeepAgents、MinerU PDF 解析、Neo4j 图数据库和 MCP 协议。
Kodezi Chronos 是一个以调试为核心的语言模型,在 SWE-bench 等基准测试中达到业界领先水平,能够自主完成软件调试和代码修复任务。
Argilla 是面向 AI 工程师和领域专家的协作平台,支持构建高质量数据集、人工反馈收集与模型评估。
用自然语言构建生产级 Agentic Workflow 的开发框架,支持浏览器自动化、计算机操作和 RAG 工作流
创新的 AI-to-AI 通信协议,当两个 AI Agent 互相识别后自动从英语切换到基于音频的通信协议,大幅提升 Agent 间通信效率,减少带宽消耗和延迟。
Cloudflare Agents 是 Cloudflare 面向边缘运行时推出的 Agent 平台,结合 Workers、持久状态与工具调用能力,适合构建低延迟、可扩展的线上 Agent 服务。
RouteLLM 是一个用于 LLM 路由服务的评估框架,通过智能请求路由在降低推理成本的同时保持输出质量,支持多种路由策略的对比评测。
开源一站式 AI 生产力平台,集通用 AI Agent、工作流引擎、即时通讯和在线文档于一体
21st Magic MCP 是一个面向前端开发的 MCP 服务器,在 Cursor、WindSurf、Cline 等 IDE 中提供类似 v0 的 AI 前端组件生成能力。
开源 AI 演示文稿生成器和 API,支持从文本自动生成专业级 PPT,是 Gamma 和 Beautiful AI 的开源替代。
ACI.dev 是开源的工具调用平台,将 600+ 工具通过函数调用或统一的 MCP Server 接入任意 Agent IDE 或自定义 AI Agent。
SWE-bench 是一个评估大语言模型解决真实 GitHub Issue 能力的基准测试框架,包含来自多个流行 Python 仓库的真实问题,已成为衡量 AI 编程智能体能力的核心标准。
Embedding Atlas 是 Apple 开源的嵌入向量可视化工具,支持大规模嵌入数据的交互式探索、交叉过滤和语义搜索。可帮助开发者理解和调试嵌入模型、向量检索和 RAG 系统的行为。
HuggingFace 开源的文本嵌入模型推理服务,使用 Rust 构建以实现高性能推理,支持多种嵌入模型,是构建 RAG 系统和向量检索管道的核心基础设施组件。
AutoRAG 是开源 RAG 评估与优化框架,采用 AutoML 风格自动化流程,帮助开发者自动搜索最佳 RAG 管线配置并进行基准评测。
将浏览器变成 API 的 MCP 服务工具,AI 代理可通过 CLI 或 MCP 协议控制 Chrome 浏览器,复用用户已登录的会话状态进行网页操作、数据抓取和自动化任务,无需重复登录认证。
自主小说创作 AI Agent,多个 Agent 协作完成写作、审核和修订,在人类审核关卡处暂停等待反馈。
HuggingFace 开源的本地语音智能体构建工具,基于开源模型实现端到端的语音对话能力,支持完全本地化部署。
基于 LLM 的智能数字生命体 Agent,追求温暖、真实的人际交互风格,具备长期记忆和个性化对话能力。
专为并行 AI 智能体工作流设计的 Git Worktree 管理 CLI 工具,支持多个 AI 编码智能体同时在不同分支上工作。
移动端自动化 MCP 服务器,支持 iOS 和 Android 真机及模拟器上的自动化操作与数据抓取
ByteRover CLI 是一个为自主编码 Agent 提供持久化结构化记忆的便携工具,支持上下文树管理、类 Git 版本控制、云端同步,兼容 Cursor、Claude Code、Windsurf 等 22+ 编码 Agent,集成 MCP 协议。
在浏览器中运行Node.js运行时环境的开源引擎,支持在Web应用中实现完全沙箱化的开发环境,无需服务器端执行。
首个通过逆向工程平台内部 API 自动构建无权限集成的 AI Agent,实现跨平台自动化数据对接。
Deep Research 支持使用任意大模型进行深度研究,提供 SSE API 和 MCP 服务,支持 OpenAI、Gemini、DeepSeek、Ollama 等多种模型。
魔兽争霸风格语音通知工具,为Claude Code、Codex等AI编程助手提供Peon语音提示,让你无需一直盯着终端,AI任务完成时自动通知。
Youtu Agent 是腾讯推出的轻量级智能体框架,专注于开箱即用的开源大模型支持,简化 Agent 开发与部署流程。
Claude Code Router 是一个面向代码 Agent 场景的模型路由工具,可在不同模型与提供商之间统一调度请求,适合控制成本、延迟与不同编程任务的路由策略。
开源企业级 AI 知识库和 MCP 管理平台,集成知识检索、模型管理和 Agent 对话功能,支持多租户部署和多种 LLM 后端,适合企业级 AI 应用搭建。
Infinity 是 AI 原生数据库,提供极快的稠密向量、稀疏向量、张量与全文混合搜索,专为 LLM 应用和 RAG 系统设计。
Zep 是一个 AI Agent 记忆管理平台,通过知识图谱技术为 Agent 提供长期记忆、上下文管理和对话历史理解能力。
AI原生多Agent开发平台,基于Kotlin Multiplatform构建,覆盖软件开发全生命周期的7个阶段。支持自动代码生成、测试、部署、文档编写等全流程开发任务。
RAGapp 是一个面向企业的 Agentic RAG 解决方案,提供开箱即用的检索增强生成能力,支持在 Docker 中快速部署,简化企业级 RAG 应用的构建和管理。
AG2(前身为 AutoGen)是一个开源的 AgentOS,提供多 Agent 对话框架,支持灵活的 Agent 编排、工具集成和分布式协作,适用于构建复杂的多智能体系统。
Cognita 是面向生产环境的模块化 RAG 框架,由 TrueFoundry 开发,支持灵活的文档解析、向量存储与检索管线编排,可构建可扩展的知识问答系统。
MCP Go SDK 是模型上下文协议的官方 Go 语言开发工具包,由 Google 协作维护,支持在 Go 生态中构建 MCP 服务器和客户端。
将任意 AI Agent 转化为可互操作、可观测、可组合的活微服务,实现 Agent 间的标准化通信和编排。
零代码 AI Agent 自动生成平台,采用 Harness Engineering 原则,统一集成工具、技能、记忆和编排能力,内置约束控制、反馈循环和管控面板,支持生产级 Agent 快速构建。
阿里巴巴开源的对话式 UI 设计语言和 React 组件库,提供完整的聊天界面组件,适用于构建智能客服和对话式应用。
一体化 AI 智能体沙箱运行环境,将浏览器、Shell、文件系统、MCP 和 VSCode Server 集成在单个 Docker 容器中,为智能体提供安全隔离的执行环境。
GitHub 官方推出的智能体工作流 CLI 工具,支持在 GitHub 生态中定义和运行 AI 智能体工作流,实现代码审查、Issue 处理等任务的自动化。
一个能真正写出有用代码的 AI 编程代理,由 BuilderIO 团队开发。通过先编写测试、再生成代码的方式,确保输出高质量且可用的代码片段。
Exa 官方提供的 MCP 服务器,为 AI 编码助手和对话工具接入强大的网页搜索与内容抓取能力,支持语义搜索、精确内容提取和深度爬取,让 AI 直接获取实时网络信息。
gptme 是一个终端 AI Agent 工具,支持代码编写、终端操作和网页浏览,可在本地构建持久化的自主 Agent。
终端中的AI Agent,配备本地工具:编写代码、使用终端、浏览网页。可创建持久化的自主Agent,支持长期记忆和任务追踪。
Notion 官方推出的 MCP 服务器,让 AI 助手能够直接读取和操作 Notion 工作空间中的页面、数据库和内容,支持搜索、创建、编辑等完整 API 功能,打通 Notion 与 AI 的工作流。
自托管 AI Agent 编排平台,支持任务分发、多 Agent 工作流执行、开销监控和操作治理
Agency Swarm 是一个可靠的多 Agent 编排框架,基于 OpenAI API 提供结构化的多 Agent 协作和通信机制。
MCP C# SDK 是模型上下文协议的官方 C# 语言开发工具包,由 Microsoft 协作维护,支持在 .NET 生态中构建 MCP 服务器和客户端。
基于 LangGraph、FastAPI 和 Streamlit 构建的 AI Agent 服务全栈工具包,提供完整的 Agent 服务架构参考实现,包含 API 后端和交互式前端。
开源协作多Agent操作系统,通过Matrix房间实现透明的人机协同任务协调。支持实时任务追踪、Agent状态监控、协作决策。
JupyterLab 官方 AI 扩展,将 AI Agent 能力引入计算笔记本环境。支持代码生成、错误解释、文档问答和多种 LLM 提供商集成,提升数据科学工作流效率。
面向生产环境LLM和Agent系统的AI可观测性平台,由Pydantic团队打造,提供实时监控、追踪和调试能力。
Android 上功能强大的 AI 智能体与聊天软件,支持本地大模型运行,集成终端操作、文件管理等能力,是移动端 AI 智能体的优秀实现。
EverOS 是一个面向自进化智能体的长期记忆平台,提供记忆构建、评估和集成能力,让 AI 智能体能够持续积累经验并自我优化。
简洁安全的 MCP-to-OpenAPI 代理服务器,将 MCP 工具转换为 OpenAI 兼容的 API 端点,便于在任意 AI 应用中集成 MCP 工具。
面向 AI 辅助开发的规范化工作流 MCP 服务器,提供需求规格驱动的开发流程工具,配备实时 Web 仪表盘和 VSCode 扩展,帮助开发者在 AI 辅助编程中保持结构化的项目管理。
Meta 推出的 LLM 安全评估工具集,提供安全基准测试、提示注入检测和输出审核等功能,帮助评估和提升大型语言模型的安全性。
基于反思机制的智能 PPT 生成框架,采用 Agent 架构实现自动化的幻灯片创建、内容编排和视觉设计,显著提升演示文稿的制作效率。
JetBrains 推出的 JVM 平台 AI Agent 框架,使用 Kotlin 和 Java 构建可预测、容错的企业级 AI Agent,支持后端服务、Android、iOS 及浏览器环境,内置 MCP 和多模型提供商支持。
使用 Rust 从零构建的开源图向量数据库,融合图数据库与向量检索能力,为 AI Agent 提供同时支持知识图谱和语义搜索的统一存储方案。
USearch 是一个高性能的开源向量搜索和聚类引擎,支持 C++、Python、JavaScript、Rust、Java、Swift、C#、Go 等多种语言绑定,适用于大规模向量检索场景。
Agenta 是一个开源 LLMOps 平台,提供 Prompt Playground、Prompt 管理、LLM 评估和可观测性的一站式解决方案。
面向 AI 智能体的通用记忆层,提供可扩展、可互操作的记忆存储和检索能力,支持智能体状态管理和长期上下文保持。
开源的视觉优先浏览器 Agent,通过视觉理解驱动 Web 自动化操作,支持复杂的网页交互任务,适用于 QA 测试和 Web 工作流自动化场景。
开源智能开发环境(YC W26),支持并行运行多个编码 Agent,兼容任意 LLM 提供商
集成Git工作流的AI Agent会话记录工具,自动捕获AI编程过程并关联到代码提交,为仓库创建可搜索的代码编写历史记录。
基于 GraphBLAS 的高性能图数据库,专为 LLM 和 GraphRAG 场景优化,支持实时知识图谱构建与查询,为 AI Agent 提供图结构化的知识检索能力。
由蚂蚁可视化团队打造的可视化 MCP 服务器,内置 25 种以上图表类型,AI 助手可通过 MCP 协议直接生成折线图、柱状图、饼图、地图等丰富可视化图表,赋能数据分析与报告场景。
面向 LLM 应用的本地持久化记忆存储,支持 Claude Desktop、GitHub Copilot、Codex 等 AI 工具,为智能体提供可持久化的上下文记忆能力。
Langroid 是一个 Python 多智能体编程框架,通过直观的 Agent-Task-Tool 抽象,支持开发者构建基于 LLM 的多智能体协作应用。
CozoDB 是一个事务型关系图向量数据库,使用 Datalog 查询语言,专为 AI 应用设计,支持图遍历、向量搜索和关系查询的统一处理。
Claude Code技能,用于生成生产级SVG和PNG技术图表。支持8种图表类型、5种视觉风格,具备深度AI/Agent领域知识。
轻量级文档分块库,专为快速、高效和稳健的 RAG 管道设计,支持多种分块策略和嵌入模型,显著提升检索增强生成效果。
面向企业的严格 AI 编码助手,以质量优先为核心理念,集成了 AI Agent、AI CodeReview 和 AI Completion 三大功能模块,帮助企业提升代码质量和开发效率。
Mini SWE-Agent 是一个仅 100 行代码的极简 AI 智能体,能够解决 GitHub Issue 或在命令行中辅助开发者,以最小实现展示了编程智能体的核心能力。
轻松使用和训练最先进的后期交互检索方法(ColBERT),模块化设计,可将 ColBERT 模型集成到任何 RAG 管道中,显著提升检索精度。
AI 驱动的本地自动化助手,类似 Manus 的电脑使用 Agent,通过自然语言让电脑自动工作。
一站式检索增强生成(RAG)平台,集成 Langflow、Docling 和 OpenSearch,提供从文档解析到向量检索再到生成的完整流水线,支持多种模型和向量数据库。
嵌入式属性图数据库,内置向量搜索和全文检索能力,原生支持 Cypher 查询语言,适用于知识图谱构建和 AI Agent 的结构化知识检索。
微软研究院推出的任务感知型智能体驱动提示词优化框架,通过迭代优化自动生成高质量提示词。
开源的现代设计 AI 训练追踪与可视化工具,支持 PyTorch、Transformers 等主流框架,帮助开发者监控和评估 AI Agent 的训练过程。
LazyLLM 是一个轻量级多 Agent LLM 应用开发框架,提供最简捷的方式构建多智能体 LLM 应用,集成了 RAG、知识图谱、微调等功能,支持 LangChain 和 LlamaIndex 生态。
Motia 是一个将 API、后台任务、Agent 与工作流统一建模的 TypeScript 平台,适合希望用单一工程结构构建业务逻辑和 Agent 自动化的团队。
增强版 MCP 反馈交互服务器,为 AI 辅助开发提供用户交互反馈和命令执行能力,支持 Web UI 和桌面应用双界面,自动检测运行环境并适配跨平台使用,弥合 AI 与开发者之间的沟通鸿沟。
Java AI Agent 实时传输层框架,支持 WebSocket、SSE、gRPC 和 WebTransport/HTTP3 多种协议,原生兼容 MCP、A2A 和 AG-UI 协议,适用于构建事件驱动的 AI Agent 通信架构。
编程Agent的开发环境,支持多个Agent安全独立地使用你偏好的技术栈工作。提供隔离的开发环境,避免冲突,提升协作效率。
微软开源的生成式AI风险评估框架,帮助安全专业人员主动识别生成式AI系统中的安全风险,支持红队测试和自动化攻击探测。
Excel 文件操作 MCP 服务器,让 AI 代理能够读取、创建和修改 Excel 电子表格
Continuous Claude 是一个面向 Claude Code 的上下文管理工具,通过 Hooks 机制维护状态账本和任务交接。支持无上下文污染的 MCP 执行和隔离上下文窗口的 Agent 编排,实现长时间对话的连续性。
DocETL 是一个由 LLM 驱动的智能数据处理和 ETL 系统,采用 Agent 架构实现复杂数据转换。支持自然语言定义数据处理管道,将非结构化数据转化为可分析的结构化输出。
基于向量数据库与 GPT 的通用本地知识库方案,提供文档上传、向量化存储、语义检索和智能问答的一站式解决方案,适合快速搭建私有化知识库。
领先的 AI 智能体上下文管理平台,为 AI Agent 提供统一的上下文交付能力,支持知识管理、资源调度和技能集成,帮助 Agent 更好地理解和执行任务。
用于快速构建 AI 原生 IDE 产品的框架,内置 MCP 客户端支持,让编程助手深度集成到开发环境。
OpenAgentsControl 是一个面向计划优先开发工作流的 AI 智能体框架,支持审批式执行和多语言(TypeScript、Python、Go、Rust),内置自动测试、代码审查与验证。
OpenOperator 是面向计算机与浏览器控制的开源 Agent 项目,强调 GUI 自动化、任务执行与人机协作,适合桌面与网页操作型 Agent 场景。
IBM 开源的 AI 网关与注册代理,统一管理 MCP、A2A 及 REST/gRPC API 接口,提供集中化服务发现、安全护栏和流量管理,优化 Agent 与工具调用效率。
企业级AI平台,集成AI防护栏、MCP注册中心、网关和编排器,提供全面的AI Agent治理和管理能力。
Refact 是一个用 Rust 编写的 AI 编程智能体,能够端到端处理工程任务,集成到开发者工作流中,支持代码补全、聊天、智能体操作以及自托管部署。
多 Agent 个人助手,通过捕获实时屏幕活动并将其转化为结构化记忆,构建自适应数字体验的知识库,支持跨会话上下文记忆和个性化知识管理。
腾讯开源的全栈 AI 红队平台,集成 OpenClaw 安全扫描、Agent 扫描、Skills 扫描、MCP 扫描、AI 基础设施扫描及 LLM 越狱评估能力。
元学习 Agent 框架,通过对话持续学习和进化,Agent 能自主获取新技能和优化策略。
Arrow 是面向 Agentic 时代的前端 UI 框架,体积小巧、性能优异,内置 WASM 沙箱实现安全代码执行,专为构建 AI Agent 交互界面而设计。
Laravel官方MCP服务器,增强AI驱动的本地开发体验,让AI编程助手深度集成Laravel生态系统,提供智能化的PHP开发支持。
开源 AI Agent 可观测性与安全扫描工具,提供 LLM 漏洞扫描和 AI 红队测试套件,帮助开发者评估 Agent 系统安全性。
Agentuity 是一个面向生产部署的 Agent 平台,聚焦运行环境、工具执行与任务编排,适合团队构建可上线的 Agent 服务与自动化流程。
Expect 是一个在真实浏览器中测试 AI 智能体代码的工具,提供可视化的浏览器测试环境来验证智能体生成的代码是否按预期工作。
受人类长期记忆启发的 RAG 框架(NeurIPS 2024),结合知识图谱与个性化 PageRank 实现 LLM 的持续知识整合。
Model Context Protocol 官方 Java SDK,与 Spring AI 团队联合维护,提供 Java 生态的 MCP 服务器和客户端开发工具包,支持在 Java 应用中集成 MCP 工具调用和上下文管理。
DeepResearchAgent 是一个分层多智能体系统,专为深度研究任务和通用任务求解设计。通过顶层规划 Agent 协调多个专业子 Agent,实现自动化任务分解和跨领域高效执行。
ICLR 2024 论文,全面的 LLM Agent 评估基准,涵盖操作系统、数据库、知识图谱、数字卡片游戏等多维度任务。
基于 JVM 的 AI Agent 框架,使用 Kotlin 构建,面向 Java/Kotlin 生态系统,提供 Agent 开发、编排和部署的完整工具链。
Dagu 是一个本地优先的声明式工作流引擎,基于文件、自包含、可离线运行。单个二进制文件即可从笔记本扩展到分布式集群,内置持久化工作流操作器。
OpenCode AI Agent 的桌面和 Web 界面客户端,提供直观的图形化操作界面来管理 AI Agent 会话、MCP 服务器配置和任务执行,降低 AI Agent 使用门槛。
中国联通推出的企业级多租户 AI Agent 开发平台,支持 RAG、工作流编排、MCP 工具集成
TruLens 是一个用于评估和跟踪 LLM 应用的开源工具。提供针对 RAG 应用的专门评估功能,包括上下文相关性、接地性和答案相关性等评估维度。
高效LLM Agent终身记忆系统,支持文本和多模态记忆,让AI Agent能够长期保留和检索信息,实现持续的上下文感知。
Solace Agent Mesh 是一个事件驱动的多智能体 AI 框架,用于构建和编排多智能体系统,支持 MCP 集成和复杂多步骤工作流。
MTEB(Massive Text Embedding Benchmark)是一个大规模文本嵌入基准测试框架,覆盖分类、检索、聚类、重排序等多项任务,用于评估和选择 RAG 系统中的最佳嵌入模型。
开源的 LLMOps 平台,提供 Prompt 设计与管理、版本控制、实时监控与可观测性、团队协作等一站式 LLM 应用运维能力。
Bee Agent Framework 是一个支持 Python 和 TypeScript 的生产级 AI Agent 开发框架,提供多模态 Agent 构建、工具集成和可观测性能力,帮助开发者快速构建可投入生产的智能体应用。
LLM 评估和 AI Agent 测试平台,提供全面的追踪、评估和质量监控能力,帮助团队构建可靠的 AI 应用。
动态 AI Agent 自动化平台,支持多 AI 提供商编排、自适应记忆、智能特性与灵活插件系统
Godot 游戏引擎的 MCP 服务器,提供编辑器启动、项目运行和调试输出捕获等工具,让 AI Agent 参与游戏开发。
Deepgram Agent API 是面向语音 Agent 的实时接口层,聚合语音识别、TTS 与对话控制能力,适合构建电话客服、实时语音助手与语音工作流应用。
Zed Agentic 是 Zed 围绕编辑器内 Agent 协作打造的开源项目,强调代码理解、编辑建议与开发者工作流增强,适合关注 IDE 内编程 Agent 的场景。
Apple 原生工具的 MCP 集合,让 AI 代理能够访问 macOS 系统功能如备忘录、日历、提醒事项等
AutoCodeRover 是一个具有项目结构感知能力的自主软件工程师智能体,通过理解代码库的整体架构来实现自动化的程序修复和问题解决。
DIMOS 是一个面向物理空间的智能体操作系统,支持用自然语言控制人形机器人、四足机器人、无人机等硬件平台,并构建能与摄像头、激光雷达和执行器无缝协作的多 Agent 系统。
TypeScript 实现的快速 MCP 服务器框架,提供简洁的 API 用于构建 Model Context Protocol 服务器和工具。
.NET 平台的 AI 多 Agent 框架,支持多种 LLM 后端集成,提供 Agent 管理、工具调用、对话状态管理等企业级功能,适合 .NET 生态的 Agent 开发。
PromptTools 是开源的提示词测试与实验工具集,支持多种 LLM(OpenAI、LLaMA)和向量数据库(Chroma、Weaviate、LanceDB),帮助开发者系统化评估和优化 RAG 系统。
将本地代码索引到图数据库的 MCP 服务器和 CLI 工具,为 AI 编程助手提供精准的代码上下文感知能力。
一键免费部署私人 AutoGPT 网页应用。在浏览器中组装、配置和部署自主 AI Agent,提供直观的可视化界面和丰富的插件生态系统。
微软官方 MCP 服务器集合,为 AI 驱动的数据访问和工具集成提供标准化接口。
Open Lovable 是一个开源的对话式应用生成实验项目,展示了如何把 Agent 式交互、生成式 UI 和快速原型结合起来,适合研究产品化 Agent 体验。
OpenRouter Agents 是 OpenRouter 面向多模型 Agent 场景提供的平台能力,强调模型路由、工具调用与统一接入层,适合需要跨模型编排的 Agent 应用。
基于 RAG 技术的智能对话系统,提供完整的 Web UI 界面,支持文档上传、知识库管理和智能问答,可快速搭建企业级知识检索服务。
由 Grok 驱动的开源自主智能体,支持在终端中执行任务、浏览网页和代码生成,可作为 AI 编程助手使用。
AgentStation 是一个强调 Agent 运行编排、工具执行和开发者工作流的开源平台,适合把多个自动化能力整合为统一的 Agent 运行环境。
Block Open 是面向开放 Agent 生态的基础设施项目,强调 Agent 运行时、工具连接与任务编排,适合关注标准化 Agent 平台与开放集成接口的团队。
OpenPipe Artifacts 是面向 Agent 与 LLM 应用的数据与产物管理工具,帮助团队追踪提示、输出、实验结果与评测记录,适合构建可复盘的 Agent 开发流程。
开源 AI 原生终端,专为云和基础设施管理设计,支持用自然语言部署、排查和自动化运维服务,集成智能 Agent 能力。
构建自我进化的 AI Agent 生态系统,支持 Agent 自动优化、角色演化和多 Agent 协同,提供从单 Agent 到多 Agent 系统的完整进化框架。
一条命令启动完整的 LLM 技术栈,预集成数百种 AI 服务,快速搭建本地 AI 开发环境。
Camofox Browser 是一个基于 Camoufox(Firefox 反检测分支)的无头浏览器自动化服务器,在 C++ 层面实现指纹伪装,可绕过 Google、Cloudflare 等反爬检测,为 AI Agent 提供令牌高效的无障碍快照交互接口。
LLM 交互安全工具包,提供提示词注入检测、敏感信息脱敏、内容安全审计等防护能力,保障生产环境 LLM 调用的安全性。
Docker 官方推出的 AI Agent 构建器和运行时,提供容器化原生的 Agent 开发与部署能力,将 Docker 的隔离性、可移植性和标准化优势带入 AI Agent 生命周期管理,支持 Agent 的构建、调试、打包和生产运行。
首个开源 AI 视频制作系统,提供 12 条流水线、52 个工具和 500 个 Agent 技能,将 AI 编码助手转化为完整的视频制作工作室。
DO Browser 是一个浏览器任务执行型 Agent 工具,聚焦网页理解、动作规划与自动执行,适合作为 browser-use、Stagehand 之外的轻量替代方案。
Gradio Agents 是 Gradio 面向 Agent 构建的交互层工具,帮助开发者快速搭建可演示、可测试的 Agent 界面,适合原型验证与人机协作场景。
MCP Gateway 是面向 Model Context Protocol 的网关层工具,用于在多种 Agent 与工具服务之间提供统一接入、权限边界与路由控制,适合构建企业级 MCP 接入层。
LMNR 是面向 LLM 与 Agent 应用的开源可观测性平台,关注 tracing、质量分析与运行诊断,适合在生产环境中持续监控 Agent 行为。
面向 AI Agent 和人类的浏览器自动化工具,提供高性能 Go 语言实现的网页交互能力
OpenAI Agents JS 是 OpenAI Agents SDK 的 JavaScript 版本,为前后端 JS/TS 场景提供工具调用、状态编排与 Agent 运行接口,适合 Web 生态集成。
Oxylabs AI Studio Python SDK 提供一体化 AI 驱动的网页抓取工具集,集成了 AI 网页抓取器、爬虫、浏览器 Agent、搜索引擎和站点地图功能,支持自然语言指令驱动的结构化数据提取。
HELM(Holistic Evaluation of Language Models)是斯坦福大学 CRFM 推出的语言模型综合评估框架,支持对大语言模型和多模态模型进行全面、可复现、透明的评估。
LangGraph 官方聊天前端,支持 Python 和 TypeScript 构建的智能代理,提供可视化交互界面
基于 Rust 构建的自主 AI 智能体编排工具,实现了改进版的 Ralph Wiggum 编排技术,支持多智能体任务的协调和调度。
GitAgent 是一个框架无关的、基于 Git 原生的 AI Agent 定义标准,将 Agent 的身份、规则、记忆、工具和技能以版本化文件的形式存储在 Git 仓库中,实现 Agent 的可复现与可协作。
HyperAgent 是一个强调任务分解、工具链协作与复杂执行流控制的 Agent 平台,适合研究和搭建多步骤自动化系统。
Coval 是一个面向语音与对话 Agent 的评测工具,帮助团队对真实对话表现、响应质量与交互稳定性进行测试,适合语音 Agent 质量治理。
LangDB 是面向 LLM 与 Agent 应用的数据与运维工具,帮助团队管理提示、运行轨迹和实验版本,适合作为 Agent 系统的轻量运营与调试辅助层。
Engram 是一个面向 AI 编码智能体的持久化记忆系统,基于 SQLite + FTS5 构建,支持 MCP Server、HTTP API、CLI 和 TUI,与具体智能体实现无关。
Aide 是一款 VSCode AI 编程辅助扩展,提供一键注释、代码转换、UI 生成代码和 AI 批量文件处理等功能。
开源 AI 摄像头技能平台和智能 NVR 监控系统,集成 VLM 视频分析、LLM 代理推理和可插拔 AI 技能,支持通过 Telegram、Discord 等渠道进行智能安防。
面向智能体的 Java 编程框架,用于构建 LLM 应用程序,提供智能体抽象、工具调用、多智能体协作等核心能力,适合企业级 Java 生态集成。
统一的 AI 编程 Agent 规则管理工具,可将相同的编码规则和配置一键应用到 Claude Code、Cursor、Copilot 等所有主流编程 Agent。
Trieve 是一个集搜索、推荐、RAG 和分析于一体的全功能平台,通过 API 提供服务。基于 Rust 构建,支持向量搜索、全文搜索和语义重排序,适合构建企业级 AI 搜索和检索应用。
YC S25 孵化的多 Agent 通信平台,让用户可以从任何地方与多个 AI Agent 进行对话和协作。支持跨平台接入,统一管理多个 Agent 的交互与任务执行。
多Agent编排工作流平台,支持Claude Code、Codex、Gemini、OpenCode等多种Agent。提供统一的编排接口,实现跨平台Agent协作。
FastRTC 是一个面向实时多模态与语音应用的开发工具,适合构建低延迟 Agent 对话、音视频交互和实时协作场景中的通信层能力。
Mem0 TS 是 Mem0 的 TypeScript 版本,为 Agent 应用提供长期记忆管理、用户偏好提取与上下文压缩能力,适合在 JS/TS 技术栈中构建有记忆的 Agent。
LLMTracer 是面向 Agent 与 LLM 应用的链路追踪工具,帮助开发者记录调用路径、工具执行与状态变化,适合补充工作流调试和线上问题定位能力。
文档格式转换 MCP 服务器,支持将网页、PDF、Office 文档等多种格式转换为 Markdown,方便 AI 代理处理
基于 Tauri (Rust + React) 构建的轻量级跨平台代码编辑器,内置 AI Agent、Git 支持和 Vim 键位绑定。
自主Agent的开源记忆层,提供长期记忆、知识存储、上下文管理。支持记忆检索、关联推理、知识图谱构建。
Rust 编写的安全持久化个人 Agent 服务器,单二进制文件,支持沙盒执行、多 LLM 提供商、语音、记忆和 MCP 工具。
arXiv 论文搜索与分析 MCP 服务器,支持 AI 代理检索和深度分析学术论文
Griptape 是用于构建和部署 AI Agent 的模块化框架,支持工具链、记忆和多模型集成。
Ouroboros 是一个规范驱动的多智能体开发框架,从传统的提示词工程转向规范驱动开发模式,支持多 Agent 协作、MCP 工具集成和自动化工作流编排,适用于高质量 Agent 系统构建。
Blaxel AI SDK 是面向生产 Agent 系统的开发工具包,强调工具定义、执行控制、运行追踪与服务集成,适合企业内部 Agent 应用开发。
Contextal 是一个上下文管理与检索增强工具,适合在多轮 Agent、长对话和复杂知识注入场景中提升上下文组织和调用质量。
Gweaver 是一个强调多 Agent 协作和任务编织的实验平台,适合研究复杂任务拆解、协同执行和角色分工场景。
开源本地实时语音 AI 系统,支持完全离线运行的实时语音对话,适用于构建私有化的语音助手和语音交互应用。
让 AI 智能体像人类一样使用真实 Android 和 iOS 应用的框架,支持移动端界面的自主操作和交互。
下一代 AI Agent 代理网关,为 AI Agent 和 MCP 服务器提供统一的流量管理、路由转发和安全控制层。支持多协议适配和可扩展的中间件架构。
Home Assistant的MCP服务器,让AI助手能够与智能家居系统交互,通过Model Context Protocol实现智能化的家居设备控制与自动化。
Hugging Face 官方模型与数据集评估库,提供丰富的评估指标和方法,轻松评估机器学习模型性能和数据集质量。
HuggingFace 推出的一站式 LLM 评估工具包,支持多种后端的模型评测,与 HuggingFace 生态深度集成,提供灵活的评估指标和基准配置。
OpenLIT 是开源 AI 工程平台,基于 OpenTelemetry 提供 LLM 可观测性、GPU 监控、防护栏、评估、提示词管理与沙盒,集成 50+ LLM 提供商和 Agent 框架。
通用、UI 无关的 OpenAI 兼容插件框架,支持为任意 AI 聊天界面添加自定义功能管道,如内容过滤、RAG 增强和工具调用。
最先进的开源浏览器Agent,能够自主执行复杂的网页任务,支持自然语言驱动的网页操作自动化。
Instill Core 是一个全栈 AI 基础设施平台,提供数据管理、模型编排和管道自动化。通过可视化管道编辑器,开发者可以快速构建从数据摄取、模型推理到结果输出的端到端 AI 工作流。
Python 和 JS/TS SDK,用于在安全的云端沙箱中运行 AI 生成的代码,支持 Jupyter Notebook 风格的代码解释
无代码多 Agent 框架,可通过自定义数据构建 LLM Agent、工作流和应用,支持多种数据源接入
开源 Computer-Use-Agent,支持通过自然语言指令自动操作计算机图形界面,实现桌面环境的智能体自动化交互。
CNCF 沙箱项目,面向 SRE 场景的 AI Agent,自动分析基础设施日志和指标,辅助故障诊断和系统运维。
Obsidian 的 AI 聊天助手插件,具备上下文感知、智能写作辅助和一键编辑功能,支持库感知对话、语义搜索和本地模型运行。
NVIDIA 开源的 AI Agent 工具包,用于高效连接和优化 AI Agent 团队协作,支持多 Agent 系统的编排、工具调用和工作流管理。
VectorAdmin 是通用向量数据库管理工具,支持 Pinecone、Chroma、Qdrant、Weaviate 等主流向量数据库的统一管理,提供直观的 Web 界面进行数据导入、查询和维护。
Snyk推出的AI Agent安全扫描器,可扫描AI Agent、MCP服务器和Agent Skills中的安全漏洞,帮助开发者在部署前发现和修复安全隐患。
基于 LLM 的多 Agent 协作框架,允许开发者轻松构建多 Agent 应用,提供 Agent 角色、工具、知识管理和协作模式等核心抽象,支持灵活的多 Agent 编排。
ComfyUI 中的 LLM Agent 框架,集成 MCP 服务器、语音合成、OCR、GraphRAG 等多种 AI 工具节点
基于 MCP 协议的 AI 聊天客户端,支持多模型切换和工具调用,提供桌面端跨平台体验
AI Agent可视化工作流构建器,由Firecrawl驱动。支持拖拽式Web抓取管道,实时执行,无需编写代码即可构建Agent工作流。
AI 驱动的深度研究助手 Web 界面,支持 DeepSeek R1,结合搜索引擎迭代深入分析任何主题。
全面的 Google Workspace MCP 服务器,支持通过 AI 控制 Gmail、日历、文档、表格、幻灯片、Chat 等 Google 服务。
AI 编码 Agent 终端会话管理器,提供统一的 TUI 界面管理 Claude、Gemini、OpenCode、Codex 等多个 AI 编码 Agent,支持会话切换和并行工作。
面向团队、社区和多用户环境的 AI Agent。支持多用户协作场景下的智能对话、任务分配和信息共享,适合企业内部部署使用。
MCP Apps 协议的官方规范和 SDK,定义了嵌入式 AI 聊天机器人 UI 的标准接口,使 MCP 服务器能够直接提供交互式用户界面。
基于能力的多路复用沙箱工具,专为开发者设计。无需额外基础设施即可安全运行AI Agent,零配置、零延迟,支持能力级别的安全隔离。
图原生的上下文开发平台,提供知识图谱构建、语义检索和可移植的上下文核心,支持 RDF、SPARQL 等标准协议,为 AI Agent 提供结构化知识的存储、丰富和检索能力。
离线多代理仿真与预测引擎,使用 Neo4j 图数据库和 Ollama 本地推理,支持群体智能仿真和多智能体协作预测。
Apache 基金会开源的状态机框架,用于构建具有决策能力的应用(聊天机器人、代理、仿真等),提供监控、追踪和持久化执行能力。
桌面 AI 助手和通用 MCP 客户端,支持通过 Model Context Protocol 连接多种 AI 模型和工具服务。提供简洁直观的桌面界面,方便用户与多个 AI 服务交互。
Notte 是构建网页 Agent 和部署无服务器浏览器自动化函数的框架,提供可靠的浏览器基础设施和感知网页的 Agent 能力。
基于 Stagehand 和 Browserbase 构建 Web Agent 的开源模板,提供无服务器浏览器自动化方案,支持 AI Agent 在云端安全执行网页操作任务。
英国 AI 安全研究所(AISI)开源的大语言模型评估框架,提供全面的模型能力评估工具,支持安全性和对齐性测试。
YoMo 是一个无服务器 AI Agent 框架,基于地理分布式边缘 AI 基础设施构建,采用低延迟流处理架构,支持实时 Agent 编排和 MCP 工具集成,适用于边缘计算场景下的 Agent 部署。
AI 编码代理的异步协调层,基于 FastMCP + Git + SQLite 实现代理身份标识、收件箱、可搜索线程和文件锁 advisory 机制。
专为 Ollama 设计的开源聊天界面,提供简洁直观的本地 LLM 对话体验,支持模型选择和对话管理。
AutoChain 是一个轻量级、可扩展且可测试的 LLM Agent 框架,由 Forethought 开发。提供简洁的 Agent 构建抽象,支持自动工具选择、对话历史管理和自动化测试流程。
OxyGent 是京东开源的多 Agent 协作框架,支持灵活的 Agent 角色定义、任务分解和协作编排,适用于企业级 AI Agent 应用开发。
Open Agent Platform 是 LangChain 团队开源的 Agent 部署平台,强调多 Agent 运行、长时任务、可观测性与生产环境编排,适合作为 Agent 服务化落地基础设施。
Neuron AI 是一个 PHP 语言实现的智能体框架,用于构建生产级 AI 应用。支持连接 LLM、向量数据库和记忆系统,开发者可以快速创建能与数据交互的智能 Agent。
开源的 LLM 漏洞扫描器和 AI 红队工具包,支持对 LLM 应用进行自动化安全模糊测试,检测越狱、提示注入和对抗性攻击等风险。
ICML 2024 论文,LLM 编译器实现并行函数调用,显著提升 Agent 工具调用的效率和速度。
大语言模型安全领域的精选资源合集,涵盖论文、文章和研究资源,帮助研究人员和从业者深入了解LLM安全挑战与前沿进展。
AI Agent 的 iOS/Android 设备控制 CLI,让 AI 编程 Agent 能够直接操控移动设备进行测试和自动化操作。
Sourcery 是一个即时 AI 代码审查工具,能够自动检测代码问题、建议重构方案并提升代码质量,集成到开发者工作流中实现实时代码审查。
ShowUI 是一个开源的端到端视觉-语言-动作模型,专为 GUI 智能体和计算机使用场景设计,能理解屏幕截图并执行精确的界面操作。
轻量优雅的 AI 聊天客户端,支持多工作区、插件系统、跨平台同步、Artifacts 和 MCP 协议,本地优先
Neovim 的 MCP 客户端插件,无缝集成 MCP 服务器到编辑工作流中,提供直观的管理、测试和使用 MCP 服务器的界面。
完全本地化、自托管的 AI Agent 平台,在消费级硬件上运行,提供 OpenAI Responses API 的完整替代方案,强调隐私和灵活性。
桌面端 AI 助手,集成 GPT-5、Claude、Gemini、Ollama 等多模型,支持对话、视觉、语音、RAG、图像生成、代理和 MCP 插件
企业级 MCP 服务器运行与管理平台,提供容器化的 MCP 服务部署方案,支持权限隔离、网络策略、资源限制等安全机制,可通过 Kubernetes 或 Docker 统一管理大规模 MCP 服务器集群。
Shannon 是一个面向生产环境的多智能体编排框架,使用 Go 语言构建,专注于高效可靠的 Agent 协调与任务调度,适合企业级多 Agent 系统部署。
开源多 Agent 模拟平台,让多个由 LLM 驱动的 Agent 在共享环境中协作完成复杂任务,支持 Agent 角色定制、记忆系统和环境交互,是研究多 Agent 协作行为和社会模拟的理想实验框架。
高性能代码智能 MCP Server,将代码库索引为持久化知识图谱,支持 66 种语言和亚毫秒级查询,大幅减少 Agent 使用的 token 数量。
开源的 AI Agent 持久化记忆服务,支持 LangGraph、CrewAI、AutoGen 等主流框架,提供 REST API、知识图谱和自主记忆整合能力。
JVector 是由 DataStax 开发的高级嵌入式向量搜索引擎,纯 Java 实现,支持高效 ANN 搜索,适用于 JVM 环境下的 RAG 和 AI 应用。
DingoDB 是一个多模态向量数据库,支持使用兼容 MySQL 的统一 SQL 对结构化和非结构化数据进行 upsert 操作和向量查询,满足高并发和超低延迟的场景需求。
Vald 是一个高度可扩展的分布式向量搜索引擎,基于 Cloud Native 架构设计,支持海量向量数据的高性能近似最近邻搜索。
OpenAI Computer Using Agent (CUA) 官方示例应用,展示如何在多种计算机环境中通过 API 使用 CUA 实现图形界面自动化操作。
基于 Elixir 构建的分布式自主 Agent 框架,充分利用 BEAM 虚拟机的并发容错特性,支持动态工作流编排、Agent 信号路由和原子化任务执行,为生产级 Agent 系统提供高可用性和弹性伸缩能力。
开源 MCP 客户端,提供模型上下文协议工具的统一接入能力,支持将任意 MCP 服务器集成到 AI 应用中,简化工具调用流程。
AI Agent 劳动力平台,为每个团队成员分配专属的 AI Agent 小队,实现多 Agent 协同工作、任务编排和技能积累,帮助团队突破人力瓶颈,规模化交付复杂任务。
支持多用户、多语言的 ChatGPT Web 客户端,提供多种数据库持久化存储方案,可通过 Docker 一键快速部署。
本地 AI Agent 沙箱工具,通过文件系统权限控制让 AI 代理只能读写其所需的文件,保障本地运行安全。
n8n 自动化平台的 MCP 服务器,让 AI Agent 能够通过自然语言与 n8n API 交互,管理工作流和自动化任务。
微软官方 Learn MCP 服务器和 CLI 工具,为 LLM 和 AI Agent 提供实时、可信的微软技术文档与代码示例。
开源后台智能体编码系统,支持在后台自主执行编程任务,包括代码审查、测试生成和功能实现,让开发者专注于高价值工作。
Agent 评估框架,支持运行 Agent 基准测试和创建强化学习环境,用于衡量和改进 Agent 性能
LangGraph 的 Java 移植版本,用于在 Java 生态中构建 AI Agent 架构,无缝集成 LangChain4j 和 Spring AI,支持有状态的图式工作流和复杂 Agent 编排。
基于 AI 智能体工作流的修仙世界模拟器,利用多智能体协作还原智能、开放的仙侠世界,展示智能体工作流在复杂场景中的能力。
OpenAdapt 是一个面向桌面自动化与计算机使用场景的开源 Agent 工具,支持捕获用户操作、重放任务并构建可执行的自动化代理,适合 GUI Agent 和办公流程自动化。
MCP 协议命令行工具,支持通过 stdio 和 HTTP 传输方式与 MCP 服务器进行交互。方便开发者在终端中快速测试和调试 MCP 服务端功能。
面向企业工作流自动化的智能体 AI 框架,通过 LLM 驱动的自动化流水线处理代码审查、DevOps 等企业级任务。
GenAI 应用开发框架,通过结构化数据和链式调用语法简化 Agent 交互,事件驱动流管理复杂工作逻辑。
ChatArena 是一个多智能体语言博弈环境,为 LLM 提供多智能体交互、通信和协作能力的评估与训练平台,支持多种博弈场景。
自托管的常驻 AI Agent 平台,以容器化方式运行,支持创建多个带长期记忆的机器人,可连接 Telegram、Discord、飞书、Matrix 等平台。
Superlinked Inference Engine 是一个开源的嵌入推理服务器和生产集群,支持向量嵌入、重排序和信息提取,为 RAG 系统提供高性能的数据处理管道。
轻量级个人助手智能体框架,支持智能交互、多智能体协作和无缝工具集成,内置记忆系统和思维树推理能力。
MCP Language Server 为 MCP 客户端提供语义化的代码理解工具,包括跳转定义、查找引用、重命名和诊断等功能,让 AI 智能体获得精准的代码导航能力。
在 Arduino ESP32 上实现实时语音 AI 的开源项目,支持 100 多种语音 AI 模型,适用于 AI 玩具、智能伴侣和物联网设备。
首个全栈开源自进化通用 AI Agent,提供 Manus 和 Genspark AI 的完全本地替代方案,具备自主思考、任务规划、工具调用和知识积累能力,所有数据完全留在本地,不依赖任何云端 API。
让 AI Agent 操控你的浏览器完成实际任务的工具。通过自然语言指令驱动浏览器自动化操作,支持表单填写、数据提取和网页交互等场景。
Google ADK Java 版是 Google 提供的 Java Agent 开发工具包,支持构建、评估和部署复杂的 AI Agent 系统,填补了 Java 生态的 Agent 框架空白。
开源的多模型聊天界面,统一的对话入口连接各类 AI 模型,简洁现代的前端设计
ColiVara 是一套基于视觉嵌入的文档检索服务,无需 OCR 或文本提取,直接通过视觉模型对文档进行存储、搜索和检索,在文本和视觉文档上均达到领先的检索性能。
本地语音 AI 助手,支持与 Mac 对话、查询文档,无需云服务。提供端侧语音识别和 RAG 检索增强生成能力。
Mirascope 是一个轻量级 LLM 开发库,采用类型安全的 Pythonic 方式构建 LLM 应用,强调简洁而非框架约束。
针对 LLM 的提示词注入检测器,结合启发式规则、向量相似度和语言模型多重防御策略,有效识别和阻止恶意提示注入攻击。
将 AI Agent 视为 API 和微服务来构建、运行和扩展的框架,从第一天起就内置可观测性、可审计性和身份认证能力,适合企业级 Agent 服务的标准化交付。
Swift和Apple平台开发的开源AI Agent技能精选目录,为iOS/macOS开发者提供高质量的编程辅助技能库。
SWE-Lancer 是 OpenAI 发布的基准测试数据集,用于评估前沿大语言模型在自由职业软件工程任务上的表现,涵盖从简单 Bug 修复到复杂功能开发的多种真实场景。
WebArena 是一个用于评估自主 Web Agent 的真实基准环境,提供类 Gym 接口的交互式网站模拟,涵盖电商、论坛、CMS 等场景,支持端到端任务评估,是 Web Agent 研究领域的标准评测框架。
OctoTools 是一个带有可扩展工具集的智能体框架,专注于复杂推理任务,支持通过工具卡片系统灵活组合多种推理能力。
Adala 是一个自主数据标注 Agent 框架,通过 AI Agent 自动完成数据标注、分类和质量检查任务,显著提升数据处理效率。
CrewAI Tools 为 CrewAI 生态提供可复用工具集合,覆盖搜索、爬取、数据库、代码执行等常见 Agent 工具能力,适合快速扩展多 Agent 工作流。
功能完整的 Ollama LLM Web 界面,基于 Next.js 构建,支持本地模型对话、多模型切换和浏览器端持久化存储。
通用文档格式转换工具,支持从 PDF、图片、Word、PPT 等提取数据并转换为 Markdown、JSON、CSV 等多种格式。
KaibanJS 是一个 JavaScript 原生的多 Agent 框架,采用看板式方法管理多智能体协作,支持任务分配、角色定义和并行执行,适合 Web 开发者快速构建多 Agent 系统。
Windows 桌面自动化领域的 Playwright,让 AI Agent 能通过自然语言控制桌面应用程序
HyperDB 是一个面向 LLM Agent 设计的超快速本地向量数据库,提供轻量级的向量存储和相似度搜索能力,适合嵌入到 Agent 应用中作为即时记忆和知识检索组件。
LangMem 是 LangChain 团队提供的 Agent 记忆层工具,帮助开发者为 Agent 注入长期记忆、摘要回放与上下文管理能力,提升多轮任务表现。
开源自主编程 Agent,7x24 小时驻留在机器上自动维护应用运行状态,基于 Rust 构建。
强大的对话式 AI JavaScript 库,支持 React、Next.js 和原生 JS,可对接 LangChain、HuggingFace、Vercel AI 等多种 LLM 后端,提供开箱即用的聊天 UI 组件。
OpenReview 是一个开源、可自托管的 AI 代码审查机器人,由 Vercel 提供支持,能够自动分析 Pull Request 并提供代码审查建议。
Rust 编写的响应式 AI Agent 运行时,用于构建持久化、高可靠的智能代理系统。
首个开源的通用 GUI 自动化智能体框架,通过自然语言完全操控图形界面,利用思维可视化与链式推理实现空间感知与 HID 交互模拟。
企业级 AI Agent 协作平台,支持将多个 Agent 组合成定制化的 AI 助手团队,通过连接内部知识库和工具,让 AI 深度融入日常工作流程,为安全和工程团队提供可信赖的智能协作体验。
将 AI 连接到 Web 的工具套件,提供查询语言和 Playwright 集成,支持精准、大规模地与网页元素交互和提取数据,包含 REST API 和 Python/JS SDK。
在沙箱中运行编程 Agent 的工具,通过 HTTP 控制,支持 Claude Code、Codex、OpenCode 和 Amp,为 AI 编程 Agent 提供隔离的执行环境。
面向 AI 开发工具的上下文工程工具包,提供代码库映射、符号提取和多种代码搜索能力,帮助 AI Agent 更好地理解和操作代码库。
Phantom 是一个拥有独立计算环境的 AI 协作智能体,具备自我进化能力、持久化内存和 MCP 服务器支持,可以像真正的虚拟同事一样自主完成复杂任务。
HyperAgent 是基于 Playwright 的 AI 浏览器自动化框架,提供 page.ai()、page.perform()、page.extract() 等高级 API,内置 MCP 客户端和动作缓存,让 AI Agent 以自然语言指令操控网页浏览、交互和数据提取。
基于 Markdown 的 AI 智能体记忆系统,作为独立库提供记忆存储和检索功能,支持向量搜索和语义匹配,帮助智能体管理长期上下文。
Endee 是一个高性能向量数据库,通过优化的索引和执行引擎,在单节点上可处理多达十亿级向量数据,提供显著的性能提升,同时提供云端版本。
开源文档上下文 MCP 服务器,为 AI 编程助手提供精准的技术文档检索,替代 Context7 等商业方案。
TrustRAG 是一个注重可靠输入与可信输出的 RAG 框架,提供文档解析、分块、检索、重排序等完整 RAG 管线组件,支持多种检索策略和评估方法。
macOS上的AI Agent技能管理应用,可浏览、编辑和管理Claude Code、Cursor、Codex、Windsurf等多个平台的技能。
面向 AI 编码 Agent 的多 Agent 编排工具,支持 Claude Code、Pi 等多种编码 Agent 的可插拔运行时适配器,实现任务自动分发与协作。
BaseAI 是面向 Web 开发者的无服务器 AI Agent 框架,支持本地优先的 Agent 管道、工具与记忆构建,一条命令即可完成无服务器部署,适合快速上线 AI Agent 应用。
受武士启发的Claude Code多Agent系统,通过tmux编排并行AI任务,采用将军-家老-足轻的层级架构实现高效多Agent协作。
BrowserWing 将浏览器操作转化为 MCP 命令或 Claude Skill,让 AI Agent 高效可靠地控制浏览器,减少对 LLM 的依赖。
Agent-MCP 是一个基于模型上下文协议(MCP)的多智能体框架,使多个专业化 AI 智能体能够并行协作,高效完成项目不同层面的任务。
自组织多智能体协作平台,多个 AI 智能体作为自主团队工作,实现零人工干预的规划、执行、审查和巡检任务。
Langtrace 是一个基于 OpenTelemetry 的开源 LLM 应用可观测性工具,提供实时追踪、评估和指标监控,支持主流 LLM、智能体框架和向量数据库的集成。
KubeAI 是一个 Kubernetes 原生的 AI 推理运算器,支持在生产环境中轻松部署 LLM、VLM、嵌入模型和语音转文本模型,提供弹性扩缩容能力。
KubeAI 是面向 Kubernetes 环境的 AI 运行与推理平台,适合为 Agent 系统提供可扩展的模型服务与部署基础设施,尤其适合企业级集群场景。
Browserable 是一个可自托管的浏览器自动化工具,专为 AI Agent 设计,基于 Docker 容器提供安全的浏览器环境,支持 JavaScript SDK 调用,在 Web Voyager 基准测试中达到 90.4% 准确率。
轻量级、快速且安全的代码执行环境,支持多种编程语言,为Dify平台提供沙箱化的代码运行能力。
多模态 GUI Agent 论文和资源精选列表,系统整理了计算机使用、移动端操作等 GUI 交互 Agent 的前沿研究。
AI 浏览器自动化助手 Chrome 扩展,隐私优先,支持 MCP 协议,可替代 Claude Chrome 和 Manus Browser Operator
CVS Health 开源的 LLM 不确定性量化库,用于基于 UQ 的幻觉检测,提供置信度评分和幻觉缓解工具,帮助识别和降低 LLM 输出的不可靠内容。
精选 LLM 和 AI 智能体技能资源列表,兼容 Claude Code、Codex、Gemini CLI 和自定义 AI 智能体,助力智能体工作流定制化。
微软推出的 AI 智能体治理工具包,提供策略执行、零信任身份验证、执行沙箱和可靠性工程,覆盖 OWASP 智能体 Top 10 全部安全风险。
Neo4j 官方推出的 GraphRAG Python SDK,提供知识图谱构建、向量检索与图谱查询的一体化工具链,支持 Agent 化的图检索增强生成流程。
由Oxylabs AI Studio开发的高级浏览器AI工具,使用自然语言指令自动执行真实用户浏览任务,实现智能化的网页操作。
SQL驱动的RAG引擎,在查询时自动构建知识图谱,将SQL查询能力与RAG检索增强生成深度结合,提供高效的知识检索体验。
Apify 平台的 MCP 服务器,让 AI Agent 能够从社交媒体、搜索引擎、电商网站等提取结构化数据。
trpc-agent-go 是一个高性能的 Go 语言 AI Agent 框架,支持 LLM 集成、工具调用、多步推理和工作流编排,适合在微服务架构中构建企业级 Agent 系统。
开源的跨平台计算机使用智能体,支持在 Windows、macOS、Ubuntu 和 Android 环境中操作 GUI 界面,ICLR 2026 Oral 论文项目。
EmbedAnything 是一个用 Rust 构建的高性能嵌入推理和索引框架,提供模块化、内存安全的 RAG 数据摄取和索引管道,支持本地和云端部署。
Weights & Biases 推出的 AI 应用开发工具包,提供 LLM 调用追踪、评估实验管理和版本化能力,助力 AI 应用从原型到生产的全流程管理。
低代码多 Agent 协作平台,快速构建和协调多 Agent 团队完成复杂任务。
VectorDBBench 是向量数据库性能基准测试工具,支持对主流向量数据库(Milvus、Qdrant、Chroma、Weaviate 等)进行标准化性能评测和对比分析。
基于 Agent、MCP 和工作流驱动的增强型聊天机器人平台,支持多模型接入、可视化工作流编排和低代码配置。
生产级多 Agent 编排平台,支持 JSON 定义 Agent、多层记忆系统和内置可观测性,已在 200 多个企业级 AI Agent 项目中验证,提供完整的企业部署方案。
Kodus AI 是一个开源的 AI 代码审查工具,支持灵活选择模型和控制成本,可自动分析 Pull Request 并提供高质量的代码审查反馈。
由Pinecone驱动的检索增强生成(RAG)框架和上下文引擎。提供开箱即用的RAG解决方案,支持知识库构建、语义搜索、上下文管理。
轻量级且可移植的LLM沙箱运行时Python库,提供代码解释器功能,支持在隔离环境中安全执行AI Agent生成的代码。
Jupyter Notebook 的 MCP 服务器,让 AI Agent 能够与 Jupyter 内核交互、执行代码和管理笔记本。
AI 智能体评估与红队测试平台,提供系统化的安全评估和对抗性测试工具,帮助发现和修复智能体系统的安全漏洞。
Agentica 是一个 TypeScript AI 函数调用框架,利用编译器技术增强 LLM 的工具调用能力,通过类型安全的 Schema 自动生成函数调用,适合构建高可靠性的 AI Agent 后端。
通用日历同步工具和 MCP 服务器,支持聚合、同步和管理 Google、Outlook、Office 365、iCloud 等多平台日历。
构建浏览器 Agent 的开源框架,通过观察用户操作自动学习并执行网页任务,实现真实世界的浏览器自动化。
可扩展至 350 万上下文 token 的记忆智能体框架,附带用于任意智能体工作流 RL 训练的训练框架,解决长上下文记忆难题。
开源 AI 语音智能体,与 Asterisk/FreePBX 电话系统集成,通过 Audiosocket/RTP 技术实现低延迟的 AI 驱动电话客服和语音应答。
Python 实现的 Google Agent-to-Agent (A2A) 协议库,支持多 Agent 之间的通信和互操作。
开源 LLM 监控工具包,从提示词和回复中提取信号,帮助团队评估和监控大语言模型的质量与安全。
首个开源测试 Agent,支持 UI、API、安全、可访问性和视觉验证,无需编写代码即可实现全面自动化测试
面向 LLM Agent 的自主记忆系统,借鉴人类记忆机制实现 Agent 的动态记忆生成、检索与整合,支持记忆的自动演化与自组织。
轻量级、可回滚、可视化的 MCP Agent 长期记忆服务器,告别传统向量 RAG 和遗忘问题。
开源自主软件开发系统,基于大语言模型实现从需求到代码的全自动生成与迭代。
Agentic Radar 是一个面向 LLM Agent 工作流的安全扫描器。可自动检测智能体管道中的安全漏洞、提示注入风险和权限越界问题,帮助团队在部署前发现和修复 AI Agent 的安全隐患。
Salesforce AI Research 推出的自动提示词优化框架,利用 LLM 自动搜索和优化提示词以提升模型性能。
独立编写的AI编程Agent提示模板集合,涵盖系统提示、工具提示、Agent委派、记忆管理和多Agent协调,专为Claude Code优化。
持续运行约100小时的多Agent系统,专注于解决可以通过验证机制确认的复杂编程或数学难题。
OpenInference 是一个基于 OpenTelemetry 的 AI 可观测性检测规范和工具包,为 LLM 应用的推理过程提供标准化追踪、指标采集和 Span 定义,帮助开发者监控和调试 AI Agent 系统。
提供 OpenAI 兼容 API 端点的中间件,可将 MCP 工具桥接到任何支持 OpenAI API 的客户端和框架
chromem-go 是用 Go 实现的可嵌入式向量数据库,提供类似 Chroma 的接口,零第三方依赖,支持内存存储和可选持久化,适合轻量级 RAG 应用。
WordPress官方MCP适配器,将Abilities API桥接到Model Context Protocol,使MCP客户端能够程序化地发现和调用WordPress插件、主题和核心能力。
面向 AI Agent 的 Markdown 记忆管理系统,通过结构化的 Markdown 文件实现 Agent 的持久化记忆存储。支持上下文管理和记忆检索,让 AI Agent 具备长期记忆能力。
Layra 是一个企业级智能系统解决方案,结合可视化 RAG 和多步骤 Agent 工作流编排,提供开箱即用的文档解析、知识库构建和智能问答能力。
开源 AI Agent 桌面应用,支持 Windows 和 macOS 一键安装,内置 Claude Code、MCP 工具和 Skills 集成,提供沙箱隔离、多模型支持和飞书/Slack 集成。
Lantern 是一个 PostgreSQL 向量数据库扩展,为 PostgreSQL 添加高性能向量搜索能力,支持生成和索引嵌入向量,便于在现有数据库基础设施上构建 AI 应用。
多Agent系统中的潜在协作框架,探索Agent间隐式通信与协作机制,实现高效的多Agent协同推理与任务分配。
轻量级 AI Agent 框架,内置记忆系统、工具调用和思维树推理能力,支持多 Agent 协作和自主学习,兼容 OpenAI、DeepSeek、Qwen 等主流大模型,集成 MCP/SSE 协议。
Augment SWE-bench Agent 是 SWE-bench Verified 排行榜上排名第一的开源实现,展示了如何构建高性能的软件工程智能体来自动解决 GitHub Issue。
macOS上的轻量级Linux虚拟机工具,专为沙箱化LLM Agent而设计,提供简单易用的隔离环境来安全运行AI生成的代码。
深度研究Agent,帮助用户发现最佳的GitHub仓库,通过AI驱动的智能搜索找到最适合项目需求的开源项目。
专注于 Agent 协作的 AI Agent 框架,提供简洁的 API 设计和文档驱动的开发方式,支持多 Agent 间的任务分解、协调和结果聚合,适合构建复杂的多 Agent 协作系统。
LangSmith SDK 是 LangChain 团队提供的 LLM 应用与 Agent 可观测性工具链,支持 tracing、评测、数据集管理与调试,适合对生产级 Agent 工作流进行分析和优化。
跨平台超高性能 SQLite 向量搜索扩展,为嵌入式数据库带来向量检索能力,适用于本地优先的 RAG 应用和 Agent 记忆存储。
Inngest Agent Kit 是面向 TypeScript 的 Agent 开发工具集,将步骤编排、工具调用、流式执行与事件驱动工作流结合起来,适合构建生产级后台 Agent 任务。
通用 Agent 记忆系统,基于深度研究驱动,提供灵活的记忆架构,支持多种记忆类型(短期、长期、情景记忆)的统一管理与检索。
TanStack Store 是轻量级状态管理工具,适合与 Agent UI、工作流前端或实时控制台配合使用,在复杂交互场景中管理 Agent 状态与事件流。
Skales 是一个本地运行的 AI 桌面 Agent,支持 Windows、macOS 和 Linux。提供 Agent 技能系统(SKILL.md)、自主编码(Codework)、多 Agent 团队协作和桌面自动化,无需 Docker 或终端,支持 15+ AI 提供商。
模块化RAG系统与MCP Server架构的结合,通过Skill引导AI按照规范逐步完成代码,实现100%由AI生成的RAG系统。
Golf MCP 是生产级 MCP Server 框架,内置认证、可观测性、调试器、遥测和运行时,支持构建和扩展安全 AI Agent 基础设施。
Arrakis 是一个用 Go 编写的全可定制、可自托管的沙箱化解决方案,专为 AI 智能体代码执行场景设计,提供安全隔离的运行环境。
Meta 开源的大语言模型 Prompt 优化工具,通过自动化流程帮助开发者持续改进和优化 LLM 提示词效果。
灵活的多接口 AI Agent 框架,支持推理、工具调用、记忆、深度研究、区块链交互和 MCP 协议,可构建从简单对话到复杂研究任务的各类 Agent 应用。
面向LLM Agent训练和评估的端到端基础设施,提供从数据构建到模型训练再到效果评测的完整工具链。
AI Agent 安全网关,为编码助手提供安全防护、工作空间隔离和多路复用功能,支持 Claude、Copilot、Cline 等 IDE 插件,可拦截敏感数据泄露和恶意提示注入。
CodeFuse-muAgent 是一个由知识图谱引擎驱动的创新 Agent 框架,融合 EKG(企业知识图谱)技术,支持多 Agent 协作、RAG 增强检索和工具学习。
Blades 是一个基于 Go 的多模态 AI Agent 框架,由 Kratos 团队打造,支持视觉、语音和文本的多模态交互,提供 Agent 编排、工具调用和记忆管理能力。
私有 Agent 集群平台,每个 Agent 拥有独立的 GPU 加速桌面,支持 Claude、Codex、Gemini 及开源模型的全栈私有部署。
LLM 提示词管理和调试平台,提供 Prompt 日志记录、请求追踪、历史回放和调试功能,帮助团队系统化管理 LLM 交互和优化提示词。
开源的计算机使用代理基础框架,提供数据集、基准测试和基础模型,用于训练和评估能够控制桌面环境的 AI 代理。
基于 Rust 的多代理框架,专注于设计、仿真和审计,提供高性能的多智能体协作环境。
Git LRC 是一个免费、无限制的 AI 代码审查工具,在每次代码提交时自动运行审查,帮助开发者在开发流程中及时发现和修复代码问题。
SWE-AF 是一个自主软件工程舰队平台,采用多 Agent 工厂架构,通过调度器、编码 Agent、审查 Agent 和验证 Agent 的协同工作,实现从问题分析到代码修复的全自动化软件工程流程,在基准测试中获得 95/100 分。
NVIDIA 推出的端到端强化学习训练框架,用于编排工具调用和智能体工作流,优化多步骤智能体决策与工具使用策略。
基于 SearXNG 的 MCP 服务器,为 AI Agent 提供隐私友好的元搜索引擎能力。
支持 Web、桌面和移动端的 AI 代理客户端,兼容 Codex、Claude Code、OpenCode、Kimi 等多种代理,提供端到端加密的安全跨平台体验。
全面的提示注入防御方案合集,汇总了所有实用的和 proposed 的防御手段,是LLM安全研究的重要参考资源。
开源AI Agent桌面平台,一键下载模型并集成闭源LLM,支持离线RAG知识库和深度研究能力,数据完全本地化,支持Windows、Mac和Docker。
基于 Mem0 的 MCP 服务器,为 AI Agent 提供长期记忆能力,支持用户偏好记忆、上下文感知检索和跨会话记忆持久化,同时可作为 Python MCP 服务器开发的模板。
Dapr Agents 是一个构建自主、弹性和可观测 AI Agent 的框架,内置工作流编排、安全机制、状态管理和遥测能力,适合生产环境下的 Agent 部署。
Pipelex 是一种用于构建可组合 AI 工作流的声明式语言和开发工具,支持定义、调试和执行复杂的 LLM 管道和 Agent 工作流。
基于 llama.cpp 的 Agent 框架,支持结构化函数调用和 JSON 输出,无需微调即可与本地 LLM 交互。
SWE Agent 训练数据规模化生成工具包(NeurIPS 2025 D&B Spotlight),用于自动创建大规模软件工程 Agent 训练数据集,推动 SWE Agent 能力提升。
基于 LangGraph 多智能体工作流的 AI 软件工程系统,包含研究员和开发者智能体,通过智能规划与执行自动化代码实现。
开源的对话式语音 AI 智能体平台,支持自然语言电话交互、多语言语音合成和实时对话管理,适用于客服自动化和语音助手场景。
社区驱动的 AI 搜索桌面应用,基于 Electron 构建,将强大的 AI 语言智能直接带到桌面端,类似 Perplexity 的本地化替代方案。
Vectra 是基于本地文件的 Node.js 向量数据库,提供类似 Pinecone 的功能特性,支持语义搜索和文档嵌入,无需外部服务依赖,适合 Node.js 环境下的 RAG 应用开发。
LLM越狱技术合集,涵盖ChatGPT、Claude、Llama等主流模型的越狱提示词和Prompt泄露技术,是LLM安全研究的重要参考资料。
基于 Rust 构建的多 Agent 框架,支持多个智能体的构建、部署和协同调度,以高性能和内存安全为设计核心,适合对延迟和资源敏感的生产级多 Agent 系统。
MCP 顺序思考工具服务器,在推理各阶段推荐最有效的 MCP 工具,增强 AI 代理的工具选择能力
Agent SDK Go 是一个强大的 Go 语言框架,用于构建生产级 AI 智能体,提供工具调用、对话管理和多模型支持等核心功能。
开源端到端语音 AI 编排平台,用于构建实时对话语音代理,集成音频流、语音识别、语音合成、语音活动检测和多通道代理状态管理。
AI友好的语义代码搜索引擎,结合ripgrep的速度和tree-sitter AST解析,为AI编程助手提供精确的、上下文感知的代码理解能力。
AgentLabs 是一个面向 Agent 开发与测试的工具集合,强调实验、回放和开发流程辅助,适合帮助团队提升 Agent 迭代效率。
将认知架构与心理学记忆概念融入智能体 LLM 系统的实现,探索短期、长期和工作记忆在 AI 智能体中的工程化应用。
轻量级跨平台进程沙箱工具,基于OpenAI Codex运行时构建,支持文件、网络和凭证控制,可安全隔离执行任意命令。
AI Agent安全扫描器,可检测Agent配置、MCP服务器和工具权限中的安全漏洞,支持CLI、GitHub Action和GitHub App集成。
开源计算机使用代理,达到 82% OSWorld 验证准确率,提供全栈安全可审计的桌面自动化解决方案。
Eidolon 是首个 AI 智能体服务器,提供可插拔的智能体 SDK 和企业级就绪的运行时环境,支持多智能体编排、工具集成和生产环境部署。
面向 AI Agent 的沙箱化代码执行环境,支持本地和云端部署,具备大规模并行执行能力,为 SWE-agent 等编程 Agent 提供安全可靠的代码运行时。
Docker 官方推出的 MCP 服务器注册中心,用于集中发现、分发和管理 MCP 服务器,为 AI Agent 提供标准化工具接入方式。
Quantalogic 是一个基于 ReAct 模式的编程智能体框架,支持多种 LLM 后端,提供工具调用、推理链管理和可扩展的插件系统。
MCPAdapt 是一个适配器库,可将 650+ MCP Server 工具无缝接入主流 Agent 框架(LangChain、LlamaIndex 等)。
面向编程 Agent 的开源跨 Agent 记忆层,通过 MCP 协议兼容 Cursor、Claude Code、Windsurf 等 IDE。
面向开发者和创作者的 AI 工具、实用程序和资源精选集合,涵盖多种 Agent 开发工具。
数据工程工作流的 AI Agent 工具集,为数据处理管道提供智能化的 Agent 辅助能力。
多语言软件工程 Agent 基准测试集,扩展 SWE-bench 至多语言场景,用于评估 AI Agent 跨编程语言的 Issue 解决能力。
开源 AI Agent 网页任务评估框架,用于衡量和比较 AI Agent 在网页操作任务上的表现。
多模态多 Agent 文档理解框架,利用多个专业 Agent 协作完成复杂文档的分析和理解任务。
LangChain AWS 是 LangChain 的 AWS 集成库,支持使用 AWS Bedrock、Lambda 等服务构建 AI Agent,提供无缝的 AWS 云服务集成。
AI 劳动力平台,提供多 Agent 系统、AI Agent 和工具,帮助企业构建自主 AI 工作流。
多 Agent 协作框架,使 AI Agent 能够高效协作,帮助开发者构建强大的多 Agent 系统。
Redis 官方推出的 Agent 记忆服务,基于 Redis 为 AI Agent 和应用提供快速灵活的持久化记忆层,支持上下文管理和会话记忆。
WebMCP 启动模板,演示类似 DoorDash 的外卖应用,集成 9 个 AI Agent 工具(命令式和声明式)。
绕过商业 LLM 安全护栏的研究工具,用于评估和改进 LLM 安全防护机制的有效性。
LLM 安全测试框架,用于检测提示注入、越狱攻击和对抗性攻击,包含 190+ 探测器和 28 个提供者支持,单 Go 二进制文件。
AI Agent 工具的安全本地执行层,支持构建、验证和发布 MCP 工具,无需密码即可安全运行。
提示注入检测系统基准测试工具,用于评估和比较不同提示注入检测方案的有效性。
高速 AI Agent 信任层,提供提示注入检测、PII 过滤和内容安全防护等安全护栏功能。
AI Agent 网关,一次安装 MCP 服务器和技能即可跨所有 AI Agent 共享,统一管理和分发工具。
AI Agent 开源 EDR 终端检测与响应系统,监控自主 AI Agent 的进程、文件、网络和行为。
AI Agent 工具生态系统的元项目,整合 Mulch、Seeds、Canopy 和 Overstory 等多个 Agent 工具。
Taskade 官方 MCP 服务器和 OpenAPI 到 MCP 代码生成器,可从任何 OpenAPI 规范构建 AI Agent 工具。
轻量级事件驱动的具身智能多 Agent 系统框架,为物理世界 AI 应用提供高效的多 Agent 协作。
社区版 Spring AI Playground,为 AI Agent 工具提供安全本地执行层和 MCP 工具构建验证环境。
AI Agent 必备外部工具包集成指南,涵盖 Python Agent 框架的最佳外部工具集。
多 Agent 异常检测框架,全面自动化表格、图、时间序列等不同模态的异常检测流程。
蚂蚁集团开源的多 Agent 框架,支持创建和协调多个 AI Agent 协作完成复杂任务。
轻量级 AI 浏览器自动化 Agent 框架,提供简洁的 API 用于构建网页交互自动化工具。
聚合多种语言模型评估器的统一平台,提供标准化的 LLM 评估接口和安全性检测能力。
创建、管理和编排 stereOS AI Agent 沙箱环境的平台,提供安全的隔离运行环境。
RAG/LLM 安全扫描器,用于识别 AI 应用中的关键漏洞,包括配置错误、数据泄露和访问控制缺陷。
AI Agent 安全中间件,提供 8 层防御、DLP 数据流管控、提示注入检测和零依赖安全保障。
通过二分类方法研究大语言模型安全性,对提示注入攻击进行检测和分类分析。
轻量级 LLM 越狱防御库,提供多种防御策略来保护大语言模型免受越狱攻击。
基于模型上下文协议的文档处理 MCP 服务器,为 AI Agent 提供强大的文档处理和转换能力。
AI Agent 沙箱评估的开放分类和评分框架,包含 7 层防御和 7 种威胁模型的系统性评估体系。
Pydantic AI 的护栏能力扩展,提供成本跟踪、提示注入检测、PII 过滤和安全验证功能。
首个完全用 Rust 编写的本地开源 LLM 安全代理,提供高性能的 AI 安全防护层。
零代码 LLM 安全与可观测性代理,提供实时提示注入检测、PII 扫描和安全监控功能。
易用的 LLM 提示注入检测和输入净化 Python 包,支持多种检测方法和自定义规则。
面向 Python 数据科学工作流的 AI Agent 工具集,为 Agent 提供数据分析和可视化能力。
开源 LLM API 安全网关,提供提示注入检测、PII 脱敏、危险响应过滤等安全防护。
面向 LLM 应用的轻量级提示注入检测工具,提供简单高效的输入安全验证。
AI Agent 评估和强化学习的交互式沙箱环境,支持 Slack、LinkedIn 等第三方 API 测试。
开源 AI Agent 运行时,提供沙箱化执行环境、内置工具集和人机协同审批功能。
Graphlit 平台的 AI Agent 工具库,为 Python Agent 提供知识检索和内容处理能力。
动态将 OpenAPI 规范转换为 AI Agent 工具,实现 API 接口到 Agent 可用工具的自动转换。
为 AI Agent 提供隔离的 Docker 沙箱环境,具备网络隔离功能,专为 Opencode Agent 安全执行设计。
AI Agent 的 htop 式监控工具,实时追踪 Claude Code 和 Codex 的 Token 使用量、成本和工具调用。
AI Agent 工具定义安全扫描器,检测 Agent 工具接口中的安全漏洞和配置风险。
AI Agent 工具模式的加密签名和验证协议,防止工具定义被篡改和供应链攻击。
Taskara 是一个面向长期任务执行与多步骤自动化的 Agent 编排平台,强调任务持久化、调度与运行控制,适合需要稳定后台执行的 Agent 系统。
AI 红队测试武器库,提供多样化的提示词列表,用于 AI 安全测试和对抗性评估。
AI Agent 工具管理和安全的一体化平台,提供工具注册、权限控制和审计追踪功能。
防御 Agentic AI 威胁的工作代码示例集,包括提示注入检测、Claude Code 安全配置和 Agent 访问控制。
MicroSandbox 的 MCP 服务器,为 AI Agent 提供安全的沙箱执行环境,支持隔离运行不受信任的代码。