📚

RAG 工具

检索增强生成相关工具

🏆 查看排行榜

170 个项目

Firecrawl

142.2k · TypeScript

活跃

Firecrawl 是专为 AI Agent 设计的 Web 数据 API，可将网页转换为结构化的 LLM 友好数据，支持爬取、抓取和搜索。

web-scrapingmcprag +2

LangChain

140.6k · Python

活跃

LangChain 是面向 Agent 工程化的开源框架与编排平台，提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。

agent-frameworkragorchestration +2

llama.cpp

118.8k · C++

活跃

llama.cpp 是一个用 C/C++ 编写的轻量级 LLM 推理引擎，可在消费级硬件上高效运行各类开源大语言模型。

llm-inferencellamagguf +2

Awesome LLM Apps

116.2k · Python

活跃

100 多个可直接运行的 AI 智能体与 RAG 应用合集，涵盖克隆、定制和部署，是快速上手构建 LLM 应用的绝佳参考。

agentragllm +1

Supabase Vector

105.0k · TypeScript

活跃

Supabase 内置 pgvector 向量搜索，把 Postgres 变成 RAG 数据库。

vector-dbpostgresrag +1

vLLM

84.9k · Python

活跃

vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎，支持连续批处理、PagedAttention 等优化技术，广泛用于生产环境中的大模型部署。

llmpythonframework +2

RAGFlow

84.0k · Go

活跃

领先的开源 RAG 引擎，融合前沿 RAG 技术与 Agent 能力，为 LLM 提供高质量的上下文层，支持深度文档理解、知识库管理和智能检索。

ragdocument-understandingknowledge-base +3

Prompt Engineering Guide

76.1k · MDX

不活跃

全面的提示工程指南，涵盖论文、教程、笔记本和资源，涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。

prompt-engineeringragagent +2

MinerU

72.6k · Python

活跃

MinerU 是一个高质量文档解析工具，能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式，为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。

data-processingragpython +2

Hello Agents

63.0k · Python

活跃

从零开始的智能体原理与实践教程，系统讲解 AI Agent 核心概念、框架使用和项目实战。

agentpythonframework +1

Pathway

62.8k · Python

活跃

Pathway 是一个 Python ETL 框架，支持流处理、实时分析、LLM 管道和 RAG 应用构建。

etlstreamingrag +2

Docling

62.4k · Python

活跃

Docling 是 IBM 开源的文档解析工具，支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据，专为 GenAI 和 RAG 管道设计。

document-parsingpdfrag +1

TrendRadar

60.1k · Python

活跃

AI 驱动的舆情监控与热点追踪工具，支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送，集成微信、飞书、钉钉、Telegram 等多种通知渠道，并支持 MCP 架构接入。

automationllmpython +3

Embedchain

59.8k · Python

活跃

Embedchain 是一个面向 AI Agent 的通用记忆层，支持将多种数据源快速接入 LLM，构建具有上下文记忆的 AI 应用。

memoryragembeddings +2

Mem0

59.8k · Python

活跃

Mem0 是面向 AI Agent 的长期记忆层，支持跨会话记忆管理与个性化上下文检索。

memoryragpersonalization +1

Pathway LLM App

59.2k · Jupyter Notebook

活跃

即开即用的 RAG 和 AI 管道云模板，支持 Docker 部署，实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。

ragpythondata-processing +1

Context7

58.4k · TypeScript

活跃

Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具，帮助应用管理长上下文、检索注入与历史压缩，适合提升对话型 Agent 的上下文利用效率。

contextmemoryretrieval +1

codegraph

56.4k · TypeScript

活跃

CodeGraph 是为编码 Agent 设计的预索引代码知识图谱，自动同步代码变更，显著降低 Claude Code、Codex 等工具的 token 消耗。

code-intelligencemcprag +2

Daily Stock Analysis

52.5k · Python

活跃

LLM 驱动的 A/H/美股智能分析器，集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送，零成本定时运行。

agentpythonllm +2

LlamaIndex

50.5k · Python

活跃

用于构建 LLM 应用的领先数据框架，提供 RAG、Agent 和 Workflow 一体化能力。

ragllmagent-framework +2

LlamaIndex

50.5k · Python

活跃

面向 LLM 应用的数据框架，专注 RAG 与 Agent 数据接入。

ragllamaindexagent-tools +1

LlamaIndex

50.5k · Python

活跃

LlamaIndex 是一个用于构建 LLM 应用的数据框架，提供数据连接、索引构建、查询引擎和 Agent 工作流编排能力，是 RAG 领域的核心工具之一。

ragdata-frameworkindexing +2

LlamaIndex

50.5k · Python

活跃

LlamaIndex 是一个数据框架，用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力，支持多种数据源和向量数据库。

ragllmindexing +1

LocalAI

47.2k · Go

活跃

LocalAI 是一个开源的本地 AI 推理引擎，支持在任意硬件上运行 LLM、视觉、语音、图像和视频模型，无需 GPU。提供与 OpenAI 兼容的 API，可完全本地化部署，保障数据隐私。

llmapilocal +3

(24 / 170)

Memory记忆系统长期记忆

Agent Memory 架构：短期、长期与共享记忆的设计取舍

系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆，从存储介质、生命周期、检索方式、典型框架到设计模式，完整覆盖 Agent 个性化和多 Agent 协作的工程实现。

AI Agent记忆系统向量检索

Agent 记忆系统设计：从短期上下文到持久化知识

深入解析 Agent 记忆的四层架构，结合向量检索和记忆压缩的实战代码，帮你构建可扩展的 Agent 长期记忆系统。

small-language-modelsedge-inferencefine-tuning

小模型微调与边缘推理：让 AI Agent 在资源受限场景下跑得更快、更省

本文系统讲解小语言模型（SLM）在 Agent 场景中的微调策略与边缘推理架构，覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束，帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。

容错工具调用重试

Agent 工具调用容错：超时、重试、熔断、降级与幂等

系统梳理 Agent 工具调用的 7 大容错模式：超时分级、指数退避 + 抖动、熔断器、备用 Provider 链、可恢复错误分类、结构化校验、幂等键设计，让 Agent 在不稳定的真实环境中保持稳定输出。

LettaMemGPTAI Agent

构建有状态的AI Agent：Letta(MemGPT)深度实践指南

深入学习如何使用 Letta（原 MemGPT）构建具有长期记忆的有状态 AI Agent，解决 LLM 的上下文窗口限制问题。

上下文工程长上下文RAG

上下文工程：长对话 Agent 的上下文衰减与重建

长对话 Agent 不是败在模型能力，而是败在上下文管理。系统对比滑动窗口、检索注入和分层压缩三种策略，给出可落地的衰减诊断与重建方案。

RAG 工具

170 个项目

Firecrawl

LangChain

llama.cpp

Awesome LLM Apps

Supabase Vector

vLLM

RAGFlow

Prompt Engineering Guide

MinerU

Hello Agents

Pathway

Docling

TrendRadar

Embedchain

Mem0

Pathway LLM App

Context7

codegraph

Daily Stock Analysis

LlamaIndex

LlamaIndex

LlamaIndex

LlamaIndex

LocalAI

相关文章

Agent Memory 架构：短期、长期与共享记忆的设计取舍

Agent 记忆系统设计：从短期上下文到持久化知识

小模型微调与边缘推理：让 AI Agent 在资源受限场景下跑得更快、更省

Agent 工具调用容错：超时、重试、熔断、降级与幂等

构建有状态的AI Agent：Letta(MemGPT)深度实践指南

上下文工程：长对话 Agent 的上下文衰减与重建