53AI Hub
开源 AI 门户平台,快速构建运营级 AI 门户来发布和运营 AI 智能体、提示词和 AI 工具,支持 Coze、Dify 等平台集成。
Agent 相关的开发工具和库
开源 AI 门户平台,快速构建运营级 AI 门户来发布和运营 AI 智能体、提示词和 AI 工具,支持 Coze、Dify 等平台集成。
阿里巴巴通义实验室开源的深度研究 Agent,采用多阶段迭代式信息检索和推理架构,能够对复杂问题进行深度分析、综合和总结,支持网页搜索和文档分析。
让Claude Code、Codex或任何编程Agent效率提升10倍的工具。通过看板管理Agent任务,追踪进度,优化工作流程。
BAML 是一个 AI 提示工程框架,通过类型安全的提示定义、自动测试、版本管理和多模型支持,将工程化实践引入 LLM 提示开发流程。
动态将 OpenAPI 规范转换为 AI Agent 工具,实现 API 接口到 Agent 可用工具的自动转换。
New API 是一个统一的 AI 模型聚合与分发平台,支持将各种 LLM 交叉转换为 OpenAI、Claude、Gemini 兼容格式,提供企业和个人的集中化模型管理网关。
为编程 Agent 提供浏览器开发者工具能力的 MCP 服务器,支持网页调试、性能分析和 DOM 操作自动化。
基于Rust构建的快速灵活LLM推理引擎,支持多种模型架构和量化方案,提供高性能的本地LLM部署能力。
Stream 开源的视觉与语音智能体框架,支持任意模型和视频提供商,利用边缘网络实现超低延迟的实时多模态 AI 交互。
AI Agent 必备外部工具包集成指南,涵盖 Python Agent 框架的最佳外部工具集。
AI Agent 工具的安全本地执行层,支持构建、验证和发布 MCP 工具,无需密码即可安全运行。
基于 LangGraph、FastAPI 和 Streamlit 构建的 AI Agent 服务全栈工具包,提供完整的 Agent 服务架构参考实现,包含 API 后端和交互式前端。
为 Ghidra 逆向工程平台提供 MCP 协议支持,让 AI Agent 能够自主进行二进制分析和漏洞发现。
AnythingLLM 是一体化 AI 生产力工具,支持本地部署的聊天界面、RAG 知识库、AI Agent 与多模型管理,隐私优先且零配置。
专为复杂研究和预测任务优化的深度研究 Agent 框架,其 MiroThinker-1.7 和 MiroThinker-H1 模型在 BrowseComp 基准上分别达到 74.0 和 88.2 分,支持多步骤推理和信息检索。
零代码 AI Agent 自动生成平台,采用 Harness Engineering 原则,统一集成工具、技能、记忆和编排能力,内置约束控制、反馈循环和管控面板,支持生产级 Agent 快速构建。
NVIDIA 开源的 AI Agent 工具包,用于高效连接和优化 AI Agent 团队协作,支持多 Agent 系统的编排、工具调用和工作流管理。
NVIDIA NeMo Guardrails 是一个开源工具包,用于为基于 LLM 的对话系统添加可编程的安全护栏,支持话题控制、安全防护和对话引导。
NVIDIA 推出的端到端强化学习训练框架,用于编排工具调用和智能体工作流,优化多步骤智能体决策与工具使用策略。
提示工程研究项目,致力于设计能帮助理解 AI 智能体行为的工程化提示词,探索智能体的推理机制。
开源 AI Agent 桌面应用,支持 Windows 和 macOS 一键安装,内置 Claude Code、MCP 工具和 Skills 集成,提供沙箱隔离、多模型支持和飞书/Slack 集成。
面向 AI 辅助开发的规范化工作流 MCP 服务器,提供需求规格驱动的开发流程工具,配备实时 Web 仪表盘和 VSCode 扩展,帮助开发者在 AI 辅助编程中保持结构化的项目管理。
Polymarket 官方的自主交易 AI 智能体,能在预测市场中自动进行交易决策和执行。
Portkey AI Gateway 是一个高性能 AI 网关,支持路由到 200+ LLM 提供商,内置 50+ AI 安全护栏,提供统一 API 接口。
精选 LLM 和 AI 智能体技能资源列表,兼容 Claude Code、Codex、Gemini CLI 和自定义 AI 智能体,助力智能体工作流定制化。
面向 AI Agent 的沙箱化代码执行环境,支持本地和云端部署,具备大规模并行执行能力,为 SWE-agent 等编程 Agent 提供安全可靠的代码运行时。
提供 OpenAI 兼容 API 端点的中间件,可将 MCP 工具桥接到任何支持 OpenAI API 的客户端和框架
macOS上的AI Agent技能管理应用,可浏览、编辑和管理Claude Code、Cursor、Codex、Windsurf等多个平台的技能。
AI Agent 工具管理和安全的一体化平台,提供工具注册、权限控制和审计追踪功能。
Arrakis 是一个用 Go 编写的全可定制、可自托管的沙箱化解决方案,专为 AI 智能体代码执行场景设计,提供安全隔离的运行环境。
AG-UI 是 Agent-User Interaction Protocol 的开源实现,定义了 AI Agent 与前端应用之间的标准化交互协议,由 CopilotKit 团队发起。
企业级 MCP 网关与注册中心,集中管理 AI 开发工具,提供安全 OAuth 认证、动态工具发现和统一访问控制,支持 Keycloak/Entra 集成。
AgentLabs 是一个面向 Agent 开发与测试的工具集合,强调实验、回放和开发流程辅助,适合帮助团队提升 Agent 迭代效率。
简单、开放的格式,用于指导编程Agent。通过结构化的AGENTS.md文件定义Agent行为、规则和技能,让AI编程助手更好地理解项目需求。
Agentic ADK 是一个 Agent 开发工具包,提供构建企业级 AI Agent 的核心抽象和工具。支持多种 LLM 后端、工具调用、记忆管理和工作流编排,加速 Agent 应用开发。
在 Arduino ESP32 上实现实时语音 AI 的开源项目,支持 100 多种语音 AI 模型,适用于 AI 玩具、智能伴侣和物联网设备。
OpenSandbox 是阿里巴巴开源的安全、快速、可扩展的 AI Agent 沙箱运行时环境。
AI 驱动的深度研究助手 Web 界面,支持 DeepSeek R1,结合搜索引擎迭代深入分析任何主题。
Claude Agent SDK 是 Anthropic 官方提供的 Python SDK,用于构建基于 Claude 的 AI Agent 应用。支持工具调用、多轮对话、Agent 编排等核心能力,是开发 Claude 原生 Agent 的首选工具包。
Crawlee 是一个面向 Node.js 的 Web 爬取和浏览器自动化库,支持 Puppeteer、Playwright、Cheerio 等多种引擎,专为构建可靠的爬虫而设计,可提取 HTML、PDF 等数据用于 AI、LLM 和 RAG 应用。
基于 AST 的代码结构化搜索、检查和重写 CLI 工具,使用 Rust 编写,支持 20+ 编程语言,为 AI 编程 Agent 提供精准的代码模式匹配能力。
集成多种即时通讯平台、LLM 和插件的 AI Agent 助手,支持 QQ、Telegram、Discord 等平台。
数据工程工作流的 AI Agent 工具集,为数据处理管道提供智能化的 Agent 辅助能力。
AWS Bedrock AgentCore SDK 是亚马逊官方提供的 Python SDK,用于构建 AWS Bedrock 上的 AI Agent 应用。提供 Agent 生命周期管理、工具集成、记忆和审计追踪等企业级能力。
Amazon Bedrock Agentcore 示例项目集,帮助开发者将 AI 智能体安全地部署到生产环境,提供企业级可靠性保障。
Pi Mono 是一个全面的 AI 智能体工具包,包含编码智能体 CLI、统一 LLM API、TUI 与 Web UI 组件库、Slack 机器人及 vLLM Pod 管理,一站式覆盖智能体开发全链路。
LiteLLM 提供统一的大模型调用接口与代理网关,简化多模型切换、路由与成本控制。
Blaxel AI SDK 是面向生产 Agent 系统的开发工具包,强调工具定义、执行控制、运行追踪与服务集成,适合企业内部 Agent 应用开发。
arXiv 论文搜索与分析 MCP 服务器,支持 AI 代理检索和深度分析学术论文
开源的对话式语音 AI 智能体平台,支持自然语言电话交互、多语言语音合成和实时对话管理,适用于客服自动化和语音助手场景。
面向 Roblox Studio 的 MCP 集成,让 AI Agent 可以参与游戏开发工作流、编辑资源并辅助自动化操作。
Botpress 是开源对话式 AI 平台,提供可视化流程编辑器、知识库集成、多渠道部署和 GPT/LLM Agent 构建能力,适合企业级聊天机器人开发。
字节跳动开源的长周期 SuperAgent 框架,支持研究、编码和创作任务,具备沙箱环境、记忆系统、工具调用和子 Agent 协同能力,可处理从分钟到小时级别的复杂任务。
AI Agent 的 iOS/Android 设备控制 CLI,让 AI 编程 Agent 能够直接操控移动设备进行测试和自动化操作。
WrenAI 是一个开源的 Text-to-SQL 和 Text-to-Chart GenBI Agent,内置语义层,支持用自然语言查询数据库,自动生成 SQL 语句和可视化图表,兼容 PostgreSQL、BigQuery、Snowflake 等十余种数据源。
Programmatic Tool Calling 的开源实现,展示 Agent 如何通过 MCP 风格机制执行代码和调用工具。
面向 OpenCode 的 Agentic 工作流工具,提供上下文工程支持,帮助编码 Agent 更好地组织项目知识。
Composio 是一个面向 Agent 的工具与 SaaS 集成层,帮助应用快速接入 Gmail、Slack、GitHub 等外部服务,适合多工具工作流与企业自动化场景。
DeepEval 是一个用于 LLM 应用的开源评估框架。提供丰富的评估指标和工具,支持单元测试、集成测试,帮助开发者构建可靠的 LLM 应用。
Contextal 是一个上下文管理与检索增强工具,适合在多轮 Agent、长对话和复杂知识注入场景中提升上下文组织和调用质量。
开放的 Agent 控制平面,为自主 AI Agent 提供执行前策略强制、审批门禁和审计追踪,兼容 LangChain、CrewAI、MCP 等主流框架。
面向开发者和创作者的 AI 工具、实用程序和资源精选集合,涵盖多种 Agent 开发工具。
Crawl4AI 是面向 LLM 与 Agent 的网页抓取工具,提供结构化提取、站点遍历、内容清洗与爬取控制能力,适合作为 Agent 获取外部网页知识的入口层。
CrewAI Tools 为 CrewAI 生态提供可复用工具集合,覆盖搜索、爬取、数据库、代码执行等常见 Agent 工具能力,适合快速扩展多 Agent 工作流。
RubyLLM 是一个优雅的 Ruby LLM API 封装库,提供统一接口访问 OpenAI、Anthropic、Gemini、Azure、Ollama 等多种 LLM 服务。内置 Agent、对话、视觉、工具调用和流式输出功能,支持 Rails 集成。
CVS Health 开源的 LLM 不确定性量化库,用于基于 UQ 的幻觉检测,提供置信度评分和幻觉缓解工具,帮助识别和降低 LLM 输出的不可靠内容。
编程Agent的开发环境,支持多个Agent安全独立地使用你偏好的技术栈工作。提供隔离的开发环境,避免冲突,提升协作效率。
上下文工程入门手册,受Karpathy和3Blue1Brown启发,系统讲解如何超越提示工程,掌握上下文设计、编排和优化的完整方法论。
Daytona 提供面向开发 Agent 与自动化任务的安全开发环境基础设施,适合作为代码 Agent、远程执行与开发者工作流自动化的运行底座。
Claude Code Router 是一个面向代码 Agent 场景的模型路由工具,可在不同模型与提供商之间统一调度请求,适合控制成本、延迟与不同编程任务的路由策略。
精选的AI工具系统提示词集合,适合AI Agent构建者和提示工程师。包含ChatGPT、Claude、Perplexity、Manus、Claude-Code等顶级AI工具的系统提示词。
开源一站式 AI 生产力平台,集通用 AI Agent、工作流引擎、即时通讯和在线文档于一体
E2B 提供面向 AI Agent 的安全云沙箱运行环境,支持代码执行、文件操作与隔离计算,适合作为代码 Agent、数据 Agent 与自动化任务的执行层。
ElevenLabs Python SDK 是官方提供的 Python 客户端库,用于访问 ElevenLabs 的语音 AI 服务。支持文本转语音、语音克隆、实时流式音频和 Conversational AI Agent,是构建语音 Agent 应用的关键工具。
本地 AI Agent 沙箱工具,通过文件系统权限控制让 AI 代理只能读写其所需的文件,保障本地运行安全。
FastRTC 是一个面向实时多模态与语音应用的开发工具,适合构建低延迟 Agent 对话、音视频交互和实时协作场景中的通信层能力。
AI 驱动的求职申请自动化 Agent,自动分析职位需求并定制简历,实现大规模精准投递。
用自然语言构建生产级 Agentic Workflow 的开发框架,支持浏览器自动化、计算机操作和 RAG 工作流
AI Agent可视化工作流构建器,由Firecrawl驱动。支持拖拽式Web抓取管道,实时执行,无需编写代码即可构建Agent工作流。
由大语言模型驱动的 AI 智能体和动画引擎,支持创建交互式动画和可视化内容。
Graphiti 是面向 Agent 记忆的时序知识图谱引擎,帮助系统持续沉淀长期上下文。
Phantom 是一个拥有独立计算环境的 AI 协作智能体,具备自我进化能力、持久化内存和 MCP 服务器支持,可以像真正的虚拟同事一样自主完成复杂任务。
GitHub官方Copilot命令行工具,将Copilot编程Agent的能力直接带到终端。支持代码生成、命令建议、错误修复等。
GitHub官方多平台SDK,用于将GitHub Copilot Agent集成到应用和服务中。支持多种编程语言和平台,提供统一的Agent API接口。
Google 开源的 Python 库,用于利用 LLM 从非结构化文本中精确提取结构化信息,支持源文本标注和交互式可视化,适用于数据标注和知识抽取场景。
Gradio Agents 是 Gradio 面向 Agent 构建的交互层工具,帮助开发者快速搭建可演示、可测试的 Agent 界面,适合原型验证与人机协作场景。
Graphlit 平台的 AI Agent 工具库,为 Python Agent 提供知识检索和内容处理能力。
基于大语言模型的自动化渗透测试 Agent 框架,利用 LLM 驱动安全测试和漏洞发现。
Guardrails AI 为大语言模型添加可编程的安全护栏,通过输入输出验证、结构化数据提取和自定义校验器确保 LLM 应用的可靠性和安全性。
AI Agent 网关,一次安装 MCP 服务器和技能即可跨所有 AI Agent 共享,统一管理和分发工具。
Agent 评估框架,支持运行 Agent 基准测试和创建强化学习环境,用于衡量和改进 Agent 性能
Excel 文件操作 MCP 服务器,让 AI 代理能够读取、创建和修改 Excel 电子表格
PromptTools 是开源的提示词测试与实验工具集,支持多种 LLM(OpenAI、LLaMA)和向量数据库(Chroma、Weaviate、LanceDB),帮助开发者系统化评估和优化 RAG 系统。
Helicone 是面向大模型应用的开源代理与监控平台,提供请求追踪、缓存与成本分析能力。
ComfyUI 中的 LLM Agent 框架,集成 MCP 服务器、语音合成、OCR、GraphRAG 等多种 AI 工具节点
开源 AI 语音智能体,与 Asterisk/FreePBX 电话系统集成,通过 Audiosocket/RTP 技术实现低延迟的 AI 驱动电话客服和语音应答。
smolagents 是 Hugging Face 推出的轻量级 Agent 框架,快速构建可调用工具的 LLM Agent。
HuggingFace 开源的本地语音智能体构建工具,基于开源模型实现端到端的语音对话能力,支持完全本地化部署。
Inngest Agent Kit 是面向 TypeScript 的 Agent 开发工具集,将步骤编排、工具调用、流式执行与事件驱动工作流结合起来,适合构建生产级后台 Agent 任务。
面向编码 Agent 的 Postgres 后端平台,集成认证、存储、计算、托管和 AI Gateway,便于 Agent 快速搭建应用后端。
Instructor 是一个 Python 库,为 LLM 提供结构化输出能力,基于 Pydantic 模型定义让 AI Agent 获得可靠的类型化响应,是构建 Agent 工具调用的关键基础设施。
AI Agent 工具生态系统的元项目,整合 Mulch、Seeds、Canopy 和 Overstory 等多个 Agent 工具。
Jina AI Serve 是一个云原生多模态 AI 应用构建框架,支持构建 RAG 管道、Agent 系统和多模态搜索应用。
动态 AI Agent 自动化平台,支持多 AI 提供商编排、自适应记忆、智能特性与灵活插件系统
AI 原生代理和数据平面,内置编排、安全防护、可观测性和智能 LLM 路由功能,帮助开发者专注于 Agent 核心逻辑,简化 LLM 应用的生产部署。
多语言文档智能提取框架,基于 Rust 核心引擎支持 PDF、Office、图片等 91+ 格式,提供 MCP 服务器、CLI 和 REST API 接入。
灵活的异构LLM推理与微调优化框架,支持在消费级硬件上高效运行大语言模型,提供内核级优化和多种量化方案。
LangMem 是 LangChain 团队提供的 Agent 记忆层工具,帮助开发者为 Agent 注入长期记忆、摘要回放与上下文管理能力,提升多轮任务表现。
Letta(原名 MemGPT)是一个开源框架,用于构建具有高级推理能力和透明长期记忆的有状态 AI Agent。它允许你在服务器中可视化测试、调试和观察 Agent。
LiveKit 是一个开源的实时音视频基础设施项目,为 AI Agent 提供语音交互能力。支持 WebRTC 传输,提供 Agent 框架、SIP 电话和实时转录,是构建语音 Agent 的核心基础设施。
RouteLLM 是一个用于 LLM 路由服务的评估框架,通过智能请求路由在降低推理成本的同时保持输出质量,支持多种路由策略的对比评测。
Go 语言实现的 Model Context Protocol SDK,支持在 LLM 应用与外部数据源和工具之间无缝集成
DemoGPT 是一个利用 LLM 自动生成演示应用的工具。用户只需描述需求,即可自动创建交互式演示原型,支持 Streamlit 和 Gradio 输出格式,适合快速验证 AI 应用概念。
Mem0 TS 是 Mem0 的 TypeScript 版本,为 Agent 应用提供长期记忆管理、用户偏好提取与上下文压缩能力,适合在 JS/TS 技术栈中构建有记忆的 Agent。
Mem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。
Meta 开源的大语言模型 Prompt 优化工具,通过自动化流程帮助开发者持续改进和优化 LLM 提示词效果。
Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。
微软开发的 AI 呼叫中心解决方案,支持通过 API 发起 AI 电话呼叫,也可直接拨打配置的电话号码与智能体对话。
Playwright MCP 是微软提供的 MCP 服务器,将 Playwright 浏览器自动化能力暴露给 AI Agent,支持网页交互、截图和结构化数据提取。
MindsDB 是一个 AI 分析查询引擎,可在实时数据上构建自主推理 Agent,连接多种数据源和 AI 模型。
Mintlify 是面向开发者文档与 AI 搜索体验的内容平台,适合为 Agent 工具链、SDK 与 API 产品提供结构化文档入口,也有助于提升 AI 助手可检索性。
高性能浏览器端LLM推理引擎,利用WebGPU在浏览器中直接运行大语言模型,无需服务器端计算,实现完全本地的AI推理。
移动端自动化 MCP 服务器,支持 iOS 和 Android 真机及模拟器上的自动化操作与数据抓取
全面的智能体技能集合,涵盖上下文工程、多智能体架构和生产级智能体系统,可用于构建、优化和调试需要高效上下文管理的智能体。
通用文档格式转换工具,支持从 PDF、图片、Word、PPT 等提取数据并转换为 Markdown、JSON、CSV 等多种格式。
集成语义搜索、LLM 编排和语言模型工作流的全能 AI 框架,支持 Agent、RAG 和向量数据库
AI编程Agent的通用技能加载器,支持一键安装各种技能包。扩展Agent能力,提供代码审查、测试生成、文档编写等技能。
OctoTools 是一个带有可扩展工具集的智能体框架,专注于复杂推理任务,支持通过工具卡片系统灵活组合多种推理能力。
OpenCompass 是一个全面的 LLM 评估平台,支持 Llama、Mistral、GPT-4、Qwen、GLM、Claude 等多种模型在 100+ 数据集上的基准评测。
GitAgent 是一个框架无关的、基于 Git 原生的 AI Agent 定义标准,将 Agent 的身份、规则、记忆、工具和技能以版本化文件的形式存储在 Git 仓库中,实现 Agent 的可复现与可协作。
OpenAI Customer Service Agents Demo 是基于 OpenAI Agents SDK 实现的客服场景 Agent 示例,演示了工具调用、上下文管理和智能客服工作流。
OpenAI 推出的 LLM 评估框架,提供标准化的基准测试注册表和工具集,用于系统评估大语言模型和 LLM 系统的性能表现。
面向分析师、量化交易和 AI Agent 的金融数据平台,提供股票、加密货币、经济数据等全方位金融数据接口。
自主 LLM Agent 框架,支持复杂任务的自动分解、工具调用与多步推理,由 OpenBMB 团队开发
OpenClaw 是一个开源个人 AI 助手平台,支持 25+ 消息通道(WhatsApp、Telegram、Slack 等),可连接多种 LLM 并管理个人知识库。
Open Interpreter 是一个自然语言计算机接口,让 LLM 能在本地运行代码执行文件操作、数据分析和系统管理任务。
OpenOperator 是面向计算机与浏览器控制的开源 Agent 项目,强调 GUI 自动化、任务执行与人机协作,适合桌面与网页操作型 Agent 场景。
OpenRouter Agents 是 OpenRouter 面向多模型 Agent 场景提供的平台能力,强调模型路由、工具调用与统一接入层,适合需要跨模型编排的 Agent 应用。
Continuous Claude 是一个面向 Claude Code 的上下文管理工具,通过 Hooks 机制维护状态账本和任务交接。支持无上下文污染的 MCP 执行和隔离上下文窗口的 Agent 编排,实现长时间对话的连续性。
深入讲解 LLM、RAG 和真实 AI 智能体应用的教程合集,包含丰富的 Notebook 示例,是学习 AI 工程化实践的优质资源。
Pipecat 是一个开源的语音和多模态对话 AI 框架,支持构建实时语音助手、视频代理和多模态智能体,集成多种 TTS、STT 和 LLM 服务。
面向 dbt 项目的 LLM 数据分析 Agent,可通过远程 MCP 服务器自动化分析数据模型和项目结构。
面向 Python 数据科学工作流的 AI Agent 工具集,为 Agent 提供数据分析和可视化能力。
AI 劳动力平台,提供多 Agent 系统、AI Agent 和工具,帮助企业构建自主 AI 工作流。
AgentGPT 是一个在浏览器中组装、配置和部署自主 AI 智能体的平台,用户可通过可视化界面创建具有特定目标的 AI Agent 并观察其自主执行任务。
在沙箱中运行编程 Agent 的工具,通过 HTTP 控制,支持 Claude Code、Codex、OpenCode 和 Amp,为 AI 编程 Agent 提供隔离的执行环境。
Rowboat 是一个开源的 AI 协作平台,内置长期记忆能力,支持多轮对话和上下文保持,可作为一个具备记忆功能的 AI 助手进行知识管理和任务协作。
ICLR 2024 Spotlight 论文项目,基于语言模型的仿真框架,用于识别具有工具使用能力的 LLM Agent 的潜在风险和安全隐患。
自托管的开源 AI 网关,统一 20+ LLM 提供商、数据库和文件访问,集成 RAG、语音和安全护栏功能,提供单一 API 接口。
基于 AI 的 Python 爬虫框架,利用大语言模型和知识图谱自动构建网页数据提取管道。
AIChat 是一个全功能 LLM 命令行工具,集成 Shell 助手、对话 REPL、RAG 检索、AI 工具和 Agent 功能。支持 OpenAI、Claude、Gemini、Ollama 等多种 LLM 提供商。
LLM 是 Simon Willison 开发的开源命令行与插件框架,用统一接口连接多种模型,并支持嵌入、模板、工具扩展与实验型 Agent 工作流,适合开发者快速验证想法。
开源的计算机使用 Agent 框架,像人类一样操作图形界面完成复杂任务,支持自主学习和经验积累。
Burp Suite 扩展,为安全测试流程加入 MCP 工具、AI 辅助分析、隐私控制以及被动和主动扫描能力。
斯坦福大学开发的通用生物医学 AI 智能体,能够自主完成生物信息学分析、文献检索和科学推理任务。
One API 是一个 LLM API 管理与分发系统,支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek 等主流模型的统一 API 适配,可用于 key 管理与二次分发,提供 Docker 镜像一键部署。
MCP 顺序思考工具服务器,在推理各阶段推荐最有效的 MCP 工具,增强 AI 代理的工具选择能力
社区版 Spring AI Playground,为 AI Agent 工具提供安全本地执行层和 MCP 工具构建验证环境。
bolt.diy 是一个开源的 AI 全栈应用构建平台,支持使用任意 LLM 提示、运行、编辑和部署完整的 Web 应用程序,提供可视化开发环境。
AI Agent 安全网关,为编码助手提供安全防护、工作空间隔离和多路复用功能,支持 Claude、Copilot、Cline 等 IDE 插件,可拦截敏感数据泄露和恶意提示注入。
企业级 MCP 服务器运行与管理平台,提供容器化的 MCP 服务部署方案,支持权限隔离、网络策略、资源限制等安全机制,可通过 Kubernetes 或 Docker 统一管理大规模 MCP 服务器集群。
HELM(Holistic Evaluation of Language Models)是斯坦福大学 CRFM 推出的语言模型综合评估框架,支持对大语言模型和多模态模型进行全面、可复现、透明的评估。
macOS 截图工具和 MCP 服务器,让 AI 智能体能捕获应用程序截图,支持通过本地或远程 AI 模型进行视觉问答。
Superagent 是一个 AI 应用安全防护平台,提供提示注入防护、数据泄露检测和有害输出过滤,可嵌入任何 AI 应用中。
Apple 原生工具的 MCP 集合,让 AI 代理能够访问 macOS 系统功能如备忘录、日历、提醒事项等
将 FastAPI 端点暴露为 MCP 工具的库,支持认证功能,让 AI 代理直接调用现有 API
TanStack Store 是轻量级状态管理工具,适合与 Agent UI、工作流前端或实时控制台配合使用,在复杂交互场景中管理 Agent 状态与事件流。
Taskade 官方 MCP 服务器和 OpenAPI 到 MCP 代码生成器,可从任何 OpenAPI 规范构建 AI Agent 工具。
TensorZero 是面向 LLM 应用与 Agent 系统的开源推理网关和优化平台,强调高性能推理、实验评测、路由控制与生产级观测能力。
使用 Rust 编写的沙箱化 TypeScript 解释器,专为 AI Agent 工具执行设计,可作为 MCP 工具调用的轻量替代方案。
CUA 是开源的计算机使用 Agent 基础设施,提供沙箱、SDK 和基准测试,支持 AI Agent 控制完整桌面环境。
无代码多 Agent 框架,可通过自定义数据构建 LLM Agent、工作流和应用,支持多种数据源接入
Deep Research 支持使用任意大模型进行深度研究,提供 SSE API 和 MCP 服务,支持 OpenAI、Gemini、DeepSeek、Ollama 等多种模型。
中国联通推出的企业级多租户 AI Agent 开发平台,支持 RAG、工作流编排、MCP 工具集成
面向金融科技和企业场景的 Agent 框架,提供任务编排、工具集成和生产级可靠性,支持多种 LLM 后端。
Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。
vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。
Pydantic AI 的护栏能力扩展,提供成本跟踪、提示注入检测、PII 过滤和安全验证功能。
轻量级纯Markdown技能,实现自主ML研究:跨模型评审循环、想法发现和实验自动化。无需框架,无锁定,支持Claude Code、Codex等任何LLM Agent。
高性能LLM推理API和聊天界面,集成DeepSeek R1的思维链推理与Anthropic Claude模型,实现深度推理能力。
面向 AI 智能体的 Shell 超级工具,提供丰富的命令行增强功能,帮助智能体更高效地在终端环境中执行任务。
面向自主 LLM Agent 的主动工具发现框架,帮助 Agent 在运行时发现和选择 MCP 工具。
开源 Agentic AI 沙箱矩阵,面向 Kubernetes 和云原生环境提供 Agent 执行与隔离能力。
CodeAct 是一个将代码执行作为 Agent 动作的核心框架,研究表明代码比纯文本更适合作为 Agent 的动作空间。支持代码生成、执行和反馈循环,是 OpenDevin/CodeAct 项目的核心思路来源。
Repomix 可将整个代码仓库打包为单一 AI 友好文件,方便将代码库提供给 Claude、ChatGPT、DeepSeek 等 LLM 进行分析、审查或生成代码。
Claude Code技能,用于生成生产级SVG和PNG技术图表。支持8种图表类型、5种视觉风格,具备深度AI/Agent领域知识。
深度研究Agent,帮助用户发现最佳的GitHub仓库,通过AI驱动的智能搜索找到最适合项目需求的开源项目。
文档格式转换 MCP 服务器,支持将网页、PDF、Office 文档等多种格式转换为 Markdown,方便 AI 代理处理
对比容器、WebAssembly、进程级隔离三种沙箱方案,结合实战代码讲解如何安全执行 Agent 生成的代码。
从裸 Playwright 到结构化提取,拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。
深入学习如何使用 Letta(原 MemGPT)构建具有长期记忆的有状态 AI Agent,解决 LLM 的上下文窗口限制问题。
结合真实落地经验,介绍如何用 Langfuse 搭建 Agent 追踪、评估与成本分析闭环。
从协议模型、服务端设计到权限隔离,系统讲解如何用 MCP 为 AI Agent 构建稳定的工具接入层。
学习如何使用 Ragas 和 DeepEval 评估 RAG 系统的质量,包括忠实度、答案相关性、上下文精确度等关键指标的测量方法。