📚

RAG 工具

检索增强生成相关工具

170 个项目

(24 / 170)

相关文章

Memory记忆系统长期记忆

Agent Memory 架构:短期、长期与共享记忆的设计取舍

系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆,从存储介质、生命周期、检索方式、典型框架到设计模式,完整覆盖 Agent 个性化和多 Agent 协作的工程实现。

AI Agent记忆系统向量检索

Agent 记忆系统设计:从短期上下文到持久化知识

深入解析 Agent 记忆的四层架构,结合向量检索和记忆压缩的实战代码,帮你构建可扩展的 Agent 长期记忆系统。

small-language-modelsedge-inferencefine-tuning

小模型微调与边缘推理:让 AI Agent 在资源受限场景下跑得更快、更省

本文系统讲解小语言模型(SLM)在 Agent 场景中的微调策略与边缘推理架构,覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束,帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。

容错工具调用重试

Agent 工具调用容错:超时、重试、熔断、降级与幂等

系统梳理 Agent 工具调用的 7 大容错模式:超时分级、指数退避 + 抖动、熔断器、备用 Provider 链、可恢复错误分类、结构化校验、幂等键设计,让 Agent 在不稳定的真实环境中保持稳定输出。

LettaMemGPTAI Agent

构建有状态的AI Agent:Letta(MemGPT)深度实践指南

深入学习如何使用 Letta(原 MemGPT)构建具有长期记忆的有状态 AI Agent,解决 LLM 的上下文窗口限制问题。

上下文工程长上下文RAG

上下文工程:长对话 Agent 的上下文衰减与重建

长对话 Agent 不是败在模型能力,而是败在上下文管理。系统对比滑动窗口、检索注入和分层压缩三种策略,给出可落地的衰减诊断与重建方案。