📚

最佳RAG 工具 Top 20

精选 20 个最受欢迎的开源RAG 工具项目，按 GitHub Stars 排名。

Firecrawl

142.2k Stars

Firecrawl 是专为 AI Agent 设计的 Web 数据 API，可将网页转换为结构化的 LLM 友好数据，支持爬取、抓取和搜索。

web-scrapingmcpragdata-extraction

LangChain

140.6k Stars

LangChain 是面向 Agent 工程化的开源框架与编排平台，提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。

agent-frameworkragorchestrationllm

llama.cpp

118.8k Stars

llama.cpp 是一个用 C/C++ 编写的轻量级 LLM 推理引擎，可在消费级硬件上高效运行各类开源大语言模型。

llm-inferencellamaggufcpp

Awesome LLM Apps

116.2k Stars

100 多个可直接运行的 AI 智能体与 RAG 应用合集，涵盖克隆、定制和部署，是快速上手构建 LLM 应用的绝佳参考。

agentragllmpython

Supabase Vector

105.0k Stars

Supabase 内置 pgvector 向量搜索，把 Postgres 变成 RAG 数据库。

vector-dbpostgresragsupabase

vLLM

84.9k Stars

vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎，支持连续批处理、PagedAttention 等优化技术，广泛用于生产环境中的大模型部署。

llmpythonframeworkapi

RAGFlow

84.0k Stars

领先的开源 RAG 引擎，融合前沿 RAG 技术与 Agent 能力，为 LLM 提供高质量的上下文层，支持深度文档理解、知识库管理和智能检索。

ragdocument-understandingknowledge-baseretrieval

Prompt Engineering Guide

76.1k Stars

全面的提示工程指南，涵盖论文、教程、笔记本和资源，涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。

prompt-engineeringragagentllm

MinerU

72.6k Stars

MinerU 是一个高质量文档解析工具，能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式，为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。

data-processingragpythonllm

Hello Agents

63.0k Stars

从零开始的智能体原理与实践教程，系统讲解 AI Agent 核心概念、框架使用和项目实战。

agentpythonframeworkrag

Pathway

62.8k Stars

Pathway 是一个 Python ETL 框架，支持流处理、实时分析、LLM 管道和 RAG 应用构建。

etlstreamingragreal-time

Docling

62.4k Stars

Docling 是 IBM 开源的文档解析工具，支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据，专为 GenAI 和 RAG 管道设计。

document-parsingpdfragpython

TrendRadar

60.1k Stars

AI 驱动的舆情监控与热点追踪工具，支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送，集成微信、飞书、钉钉、Telegram 等多种通知渠道，并支持 MCP 架构接入。

automationllmpythontools

Embedchain

59.8k Stars

Embedchain 是一个面向 AI Agent 的通用记忆层，支持将多种数据源快速接入 LLM，构建具有上下文记忆的 AI 应用。

memoryragembeddingsagent-tools

Mem0

59.8k Stars

Mem0 是面向 AI Agent 的长期记忆层，支持跨会话记忆管理与个性化上下文检索。

memoryragpersonalizationagent

Pathway LLM App

59.2k Stars

即开即用的 RAG 和 AI 管道云模板，支持 Docker 部署，实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。

ragpythondata-processingframework

Context7

58.4k Stars

Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具，帮助应用管理长上下文、检索注入与历史压缩，适合提升对话型 Agent 的上下文利用效率。

contextmemoryretrievaltypescript

codegraph

56.4k Stars

CodeGraph 是为编码 Agent 设计的预索引代码知识图谱，自动同步代码变更，显著降低 Claude Code、Codex 等工具的 token 消耗。

code-intelligencemcpraglocal-first

Daily Stock Analysis

52.5k Stars

LLM 驱动的 A/H/美股智能分析器，集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送，零成本定时运行。

agentpythonllmdata-processing

LlamaIndex

50.5k Stars

用于构建 LLM 应用的领先数据框架，提供 RAG、Agent 和 Workflow 一体化能力。

ragllmagent-frameworkdata

Memory记忆系统长期记忆

Agent Memory 架构：短期、长期与共享记忆的设计取舍

系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆，从存储介质、生命周期、检索方式、典型框架到设计模式，完整覆盖 Agent 个性化和多 Agent 协作的工程实现。

AI Agent记忆系统向量检索

Agent 记忆系统设计：从短期上下文到持久化知识

深入解析 Agent 记忆的四层架构，结合向量检索和记忆压缩的实战代码，帮你构建可扩展的 Agent 长期记忆系统。

small-language-modelsedge-inferencefine-tuning

小模型微调与边缘推理：让 AI Agent 在资源受限场景下跑得更快、更省

本文系统讲解小语言模型（SLM）在 Agent 场景中的微调策略与边缘推理架构，覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束，帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。