📚

最佳RAG 工具 Top 20

精选 20 个最受欢迎的开源RAG 工具项目,按 GitHub Stars 排名。

1

Firecrawl

118.5k Stars

Firecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。

web-scrapingmcpragdata-extraction
2

Awesome LLM Apps

109.8k Stars

100 多个可直接运行的 AI 智能体与 RAG 应用合集,涵盖克隆、定制和部署,是快速上手构建 LLM 应用的绝佳参考。

agentragllmpython
3

RAGFlow

80.3k Stars

领先的开源 RAG 引擎,融合前沿 RAG 技术与 Agent 能力,为 LLM 提供高质量的上下文层,支持深度文档理解、知识库管理和智能检索。

ragdocument-understandingknowledge-baseretrieval
4

vLLM

79.7k Stars

vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。

llmpythonframeworkapi
5

Prompt Engineering Guide

74.4k Stars

全面的提示工程指南,涵盖论文、教程、笔记本和资源,涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。

prompt-engineeringragagentllm
6

Pathway

63.3k Stars

Pathway 是一个 Python ETL 框架,支持流处理、实时分析、LLM 管道和 RAG 应用构建。

etlstreamingragreal-time
7

MinerU

62.7k Stars

MinerU 是一个高质量文档解析工具,能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式,为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。

data-processingragpythonllm
8

Pathway LLM App

59.8k Stars

即开即用的 RAG 和 AI 管道云模板,支持 Docker 部署,实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。

ragpythondata-processingframework
9

Docling

59.6k Stars

Docling 是 IBM 开源的文档解析工具,支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据,专为 GenAI 和 RAG 管道设计。

document-parsingpdfragpython
10

TrendRadar

57.3k Stars

AI 驱动的舆情监控与热点追踪工具,支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送,集成微信、飞书、钉钉、Telegram 等多种通知渠道,并支持 MCP 架构接入。

automationllmpythontools
11

Embedchain

55.4k Stars

Embedchain 是一个面向 AI Agent 的通用记忆层,支持将多种数据源快速接入 LLM,构建具有上下文记忆的 AI 应用。

memoryragembeddingsagent-tools
12

Mem0

55.4k Stars

Mem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。

memoryragpersonalizationagent
13

Context7

55.0k Stars

Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。

contextmemoryretrievaltypescript
14

LlamaIndex

49.3k Stars

LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。

ragllmindexingpython
15

Hello Agents

47.6k Stars

从零开始的智能体原理与实践教程,系统讲解 AI Agent 核心概念、框架使用和项目实战。

agentpythonframeworkrag
16

LocalAI

46.2k Stars

LocalAI 是一个开源的本地 AI 推理引擎,支持在任意硬件上运行 LLM、视觉、语音、图像和视频模型,无需 GPU。提供与 OpenAI 兼容的 API,可完全本地化部署,保障数据隐私。

llmapilocalrag
17

Milvus

44.2k Stars

Milvus 是一个高性能的开源向量数据库,专为 AI 应用程序构建。支持大规模向量数据的存储、索引和相似度搜索,适用于 RAG、推荐系统等场景。

vector-databaseragsimilarity-searchgo
18

Quivr

39.1k Stars

Quivr 是一个开箱即用的 RAG 框架,支持将任意文件转化为知识库并与 GenAI 应用集成。兼容多种 LLM 和向量数据库,开发者只需专注于产品本身,无需从头构建 RAG 管道。

ragpythonvector-databasellm
19

Langchain-Chatchat

38.0k Stars

Langchain-Chatchat 是一个基于 Langchain 和多种大语言模型的本地知识库 RAG 与 Agent 应用平台,支持 ChatGLM、Qwen、Llama 等模型,提供对话、知识库管理、Agent 调用等功能。

ragllmpythonchatbot
20

LangExtract

36.4k Stars

Google 开源的 Python 库,用于利用 LLM 从非结构化文本中精确提取结构化信息,支持源文本标注和交互式可视化,适用于数据标注和知识抽取场景。

data-processingllmpythontools

相关文章