最佳RAG 工具 Top 20
精选 20 个最受欢迎的开源RAG 工具项目,按 GitHub Stars 排名。
Firecrawl
142.2k StarsFirecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。
LangChain
140.6k StarsLangChain 是面向 Agent 工程化的开源框架与编排平台,提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。
llama.cpp
118.8k Starsllama.cpp 是一个用 C/C++ 编写的轻量级 LLM 推理引擎,可在消费级硬件上高效运行各类开源大语言模型。
Awesome LLM Apps
116.2k Stars100 多个可直接运行的 AI 智能体与 RAG 应用合集,涵盖克隆、定制和部署,是快速上手构建 LLM 应用的绝佳参考。
Supabase Vector
105.0k StarsSupabase 内置 pgvector 向量搜索,把 Postgres 变成 RAG 数据库。
vLLM
84.9k StarsvLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。
RAGFlow
84.0k Stars领先的开源 RAG 引擎,融合前沿 RAG 技术与 Agent 能力,为 LLM 提供高质量的上下文层,支持深度文档理解、知识库管理和智能检索。
Prompt Engineering Guide
76.1k Stars全面的提示工程指南,涵盖论文、教程、笔记本和资源,涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。
MinerU
72.6k StarsMinerU 是一个高质量文档解析工具,能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式,为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。
Hello Agents
63.0k Stars从零开始的智能体原理与实践教程,系统讲解 AI Agent 核心概念、框架使用和项目实战。
Pathway
62.8k StarsPathway 是一个 Python ETL 框架,支持流处理、实时分析、LLM 管道和 RAG 应用构建。
Docling
62.4k StarsDocling 是 IBM 开源的文档解析工具,支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据,专为 GenAI 和 RAG 管道设计。
TrendRadar
60.1k StarsAI 驱动的舆情监控与热点追踪工具,支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送,集成微信、飞书、钉钉、Telegram 等多种通知渠道,并支持 MCP 架构接入。
Embedchain
59.8k StarsEmbedchain 是一个面向 AI Agent 的通用记忆层,支持将多种数据源快速接入 LLM,构建具有上下文记忆的 AI 应用。
Mem0
59.8k StarsMem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。
Pathway LLM App
59.2k Stars即开即用的 RAG 和 AI 管道云模板,支持 Docker 部署,实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。
Context7
58.4k StarsContext7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。
codegraph
56.4k StarsCodeGraph 是为编码 Agent 设计的预索引代码知识图谱,自动同步代码变更,显著降低 Claude Code、Codex 等工具的 token 消耗。
Daily Stock Analysis
52.5k StarsLLM 驱动的 A/H/美股智能分析器,集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送,零成本定时运行。
LlamaIndex
50.5k Stars用于构建 LLM 应用的领先数据框架,提供 RAG、Agent 和 Workflow 一体化能力。
相关文章
Agent Memory 架构:短期、长期与共享记忆的设计取舍
系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆,从存储介质、生命周期、检索方式、典型框架到设计模式,完整覆盖 Agent 个性化和多 Agent 协作的工程实现。
Agent 记忆系统设计:从短期上下文到持久化知识
深入解析 Agent 记忆的四层架构,结合向量检索和记忆压缩的实战代码,帮你构建可扩展的 Agent 长期记忆系统。
小模型微调与边缘推理:让 AI Agent 在资源受限场景下跑得更快、更省
本文系统讲解小语言模型(SLM)在 Agent 场景中的微调策略与边缘推理架构,覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束,帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。