📚

最佳RAG 工具 Top 20

精选 20 个最受欢迎的开源RAG 工具项目,按 GitHub Stars 排名。

1

Firecrawl

142.2k Stars

Firecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。

web-scrapingmcpragdata-extraction
2

LangChain

140.6k Stars

LangChain 是面向 Agent 工程化的开源框架与编排平台,提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。

agent-frameworkragorchestrationllm
3

llama.cpp

118.8k Stars

llama.cpp 是一个用 C/C++ 编写的轻量级 LLM 推理引擎,可在消费级硬件上高效运行各类开源大语言模型。

llm-inferencellamaggufcpp
4

Awesome LLM Apps

116.2k Stars

100 多个可直接运行的 AI 智能体与 RAG 应用合集,涵盖克隆、定制和部署,是快速上手构建 LLM 应用的绝佳参考。

agentragllmpython
5

Supabase Vector

105.0k Stars

Supabase 内置 pgvector 向量搜索,把 Postgres 变成 RAG 数据库。

vector-dbpostgresragsupabase
6

vLLM

84.9k Stars

vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。

llmpythonframeworkapi
7

RAGFlow

84.0k Stars

领先的开源 RAG 引擎,融合前沿 RAG 技术与 Agent 能力,为 LLM 提供高质量的上下文层,支持深度文档理解、知识库管理和智能检索。

ragdocument-understandingknowledge-baseretrieval
8

Prompt Engineering Guide

76.1k Stars

全面的提示工程指南,涵盖论文、教程、笔记本和资源,涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。

prompt-engineeringragagentllm
9

MinerU

72.6k Stars

MinerU 是一个高质量文档解析工具,能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式,为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。

data-processingragpythonllm
10

Hello Agents

63.0k Stars

从零开始的智能体原理与实践教程,系统讲解 AI Agent 核心概念、框架使用和项目实战。

agentpythonframeworkrag
11

Pathway

62.8k Stars

Pathway 是一个 Python ETL 框架,支持流处理、实时分析、LLM 管道和 RAG 应用构建。

etlstreamingragreal-time
12

Docling

62.4k Stars

Docling 是 IBM 开源的文档解析工具,支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据,专为 GenAI 和 RAG 管道设计。

document-parsingpdfragpython
13

TrendRadar

60.1k Stars

AI 驱动的舆情监控与热点追踪工具,支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送,集成微信、飞书、钉钉、Telegram 等多种通知渠道,并支持 MCP 架构接入。

automationllmpythontools
14

Embedchain

59.8k Stars

Embedchain 是一个面向 AI Agent 的通用记忆层,支持将多种数据源快速接入 LLM,构建具有上下文记忆的 AI 应用。

memoryragembeddingsagent-tools
15

Mem0

59.8k Stars

Mem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。

memoryragpersonalizationagent
16

Pathway LLM App

59.2k Stars

即开即用的 RAG 和 AI 管道云模板,支持 Docker 部署,实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。

ragpythondata-processingframework
17

Context7

58.4k Stars

Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。

contextmemoryretrievaltypescript
18

codegraph

56.4k Stars

CodeGraph 是为编码 Agent 设计的预索引代码知识图谱,自动同步代码变更,显著降低 Claude Code、Codex 等工具的 token 消耗。

code-intelligencemcpraglocal-first
19

Daily Stock Analysis

52.5k Stars

LLM 驱动的 A/H/美股智能分析器,集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送,零成本定时运行。

agentpythonllmdata-processing
20

LlamaIndex

50.5k Stars

用于构建 LLM 应用的领先数据框架,提供 RAG、Agent 和 Workflow 一体化能力。

ragllmagent-frameworkdata

相关文章