Firecrawl
Firecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。
检索增强生成相关工具
Firecrawl 是专为 AI Agent 设计的 Web 数据 API,可将网页转换为结构化的 LLM 友好数据,支持爬取、抓取和搜索。
LangChain 是面向 Agent 工程化的开源框架与编排平台,提供模型接入、工具调用、RAG、记忆与可观测性的统一抽象。
llama.cpp 是一个用 C/C++ 编写的轻量级 LLM 推理引擎,可在消费级硬件上高效运行各类开源大语言模型。
100 多个可直接运行的 AI 智能体与 RAG 应用合集,涵盖克隆、定制和部署,是快速上手构建 LLM 应用的绝佳参考。
Supabase 内置 pgvector 向量搜索,把 Postgres 变成 RAG 数据库。
vLLM 是一个高吞吐量、低内存占用的 LLM 推理与服务引擎,支持连续批处理、PagedAttention 等优化技术,广泛用于生产环境中的大模型部署。
领先的开源 RAG 引擎,融合前沿 RAG 技术与 Agent 能力,为 LLM 提供高质量的上下文层,支持深度文档理解、知识库管理和智能检索。
全面的提示工程指南,涵盖论文、教程、笔记本和资源,涉及提示工程、上下文工程、RAG 和 AI 智能体等核心主题。
MinerU 是一个高质量文档解析工具,能够将 PDF 等复杂文档转化为 LLM 友好的 Markdown 和 JSON 格式,为 RAG 流程和 Agentic 工作流提供文档数据预处理能力。
从零开始的智能体原理与实践教程,系统讲解 AI Agent 核心概念、框架使用和项目实战。
Pathway 是一个 Python ETL 框架,支持流处理、实时分析、LLM 管道和 RAG 应用构建。
Docling 是 IBM 开源的文档解析工具,支持 PDF、Word、PPT、HTML 等格式转换为 AI 可用结构化数据,专为 GenAI 和 RAG 管道设计。
AI 驱动的舆情监控与热点追踪工具,支持多平台热点聚合、RSS 订阅、关键词筛选、AI 智能分析与简报推送,集成微信、飞书、钉钉、Telegram 等多种通知渠道,并支持 MCP 架构接入。
Embedchain 是一个面向 AI Agent 的通用记忆层,支持将多种数据源快速接入 LLM,构建具有上下文记忆的 AI 应用。
Mem0 是面向 AI Agent 的长期记忆层,支持跨会话记忆管理与个性化上下文检索。
即开即用的 RAG 和 AI 管道云模板,支持 Docker 部署,实时同步 Sharepoint、Google Drive、S3、Kafka 等数据源。
Context7 是 Upstash 面向 Agent 场景打造的上下文工程工具,帮助应用管理长上下文、检索注入与历史压缩,适合提升对话型 Agent 的上下文利用效率。
CodeGraph 是为编码 Agent 设计的预索引代码知识图谱,自动同步代码变更,显著降低 Claude Code、Codex 等工具的 token 消耗。
LLM 驱动的 A/H/美股智能分析器,集成多数据源行情、实时新闻、LLM 决策仪表盘和多渠道推送,零成本定时运行。
用于构建 LLM 应用的领先数据框架,提供 RAG、Agent 和 Workflow 一体化能力。
面向 LLM 应用的数据框架,专注 RAG 与 Agent 数据接入。
LlamaIndex 是一个用于构建 LLM 应用的数据框架,提供数据连接、索引构建、查询引擎和 Agent 工作流编排能力,是 RAG 领域的核心工具之一。
LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。
LocalAI 是一个开源的本地 AI 推理引擎,支持在任意硬件上运行 LLM、视觉、语音、图像和视频模型,无需 GPU。提供与 OpenAI 兼容的 API,可完全本地化部署,保障数据隐私。
(24 / 170)
系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆,从存储介质、生命周期、检索方式、典型框架到设计模式,完整覆盖 Agent 个性化和多 Agent 协作的工程实现。
深入解析 Agent 记忆的四层架构,结合向量检索和记忆压缩的实战代码,帮你构建可扩展的 Agent 长期记忆系统。
本文系统讲解小语言模型(SLM)在 Agent 场景中的微调策略与边缘推理架构,覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束,帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。
系统梳理 Agent 工具调用的 7 大容错模式:超时分级、指数退避 + 抖动、熔断器、备用 Provider 链、可恢复错误分类、结构化校验、幂等键设计,让 Agent 在不稳定的真实环境中保持稳定输出。
深入学习如何使用 Letta(原 MemGPT)构建具有长期记忆的有状态 AI Agent,解决 LLM 的上下文窗口限制问题。
长对话 Agent 不是败在模型能力,而是败在上下文管理。系统对比滑动窗口、检索注入和分层压缩三种策略,给出可落地的衰减诊断与重建方案。