精选文章

Agent 工程实践 Agent 工程生产监控

Agent 灰度发布与生产监控：从 Prompt A/B 到自动回滚

改了 Prompt 怎么知道是变好了还是变差了？系统介绍 Agent 的 canary 发布、质量门禁、自动回滚架构，以及如何在生产环境中持续监控 Agent 行为漂移。

Agent 工程实践 RAGhallucination-detection

Agent 提示词注入防御：OWASP LLM01 七层纵深防护

基于 OWASP LLM Top 10 工程实践，系统讲解 Agent 提示词注入的七层纵深防御：输入清洗、指令隔离、最小权限、输出审计、护栏框架、持续红队评估和 Kill Switch，给出可落地的代码与工具链。

Agent 工程实践 small-language-modelsedge-inference

小模型微调与边缘推理：让 AI Agent 在资源受限场景下跑得更快、更省

本文系统讲解小语言模型（SLM）在 Agent 场景中的微调策略与边缘推理架构，覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束，帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。

Agent 工程实践容错工具调用

Agent 工具调用容错：超时、重试、熔断、降级与幂等

系统梳理 Agent 工具调用的 7 大容错模式：超时分级、指数退避 + 抖动、熔断器、备用 Provider 链、可恢复错误分类、结构化校验、幂等键设计，让 Agent 在不稳定的真实环境中保持稳定输出。

Agent 工程实践上下文工程长上下文

上下文工程：长对话 Agent 的上下文衰减与重建

长对话 Agent 不是败在模型能力，而是败在上下文管理。系统对比滑动窗口、检索注入和分层压缩三种策略，给出可落地的衰减诊断与重建方案。

Agent 工程实践 LLMOps成本优化

LLM Agent 成本控制：语义缓存与模型路由实战

Agent 生产最大的隐性成本不是 token 价格，而是重复调用和模型错配。从缓存策略、fallback chain 到路由规则，给出可量化的成本控制方案。

Agent 工程实践多智能体Multi-Agent

多智能体协作范式对比：Supervisor、Swarm 与 Graph

系统对比三种主流多 Agent 协作范式：Supervisor 监督者模式、Swarm 群体模式、Graph 图模式。给出可落地的选型决策、适用场景、典型框架与混合使用策略。

RAG 与知识系统 Chat UIOpen WebUI

Chat UI 平台选型指南：Open WebUI vs LobeChat vs LibreChat

三款主流开源 Chat UI 横评——Open WebUI(142k Stars)、LobeChat、LibreChat，从部署、RAG、多模型、用户管理、扩展性五个维度帮你选型。

Agent 工程实践 DifyAgent 工作流

Dify 深度实践：从 RAG 到 Agent 工作流的全流程低代码平台

Dify (145k Stars, $30M Pre-A) 是开源 LLM 应用开发平台的标杆。从 Docker 部署、RAG 管线、Agent 编排到 MCP 集成，本文带你全流程上手。

Agent 工程实践 GraphRAG知识图谱

GraphRAG 实战：用知识图谱给 Agent 装上关联理解能力

传统向量 RAG 只能找到"相似的块"。GraphRAG 提取实体关系构建知识图谱，让 Agent 理解"谁、在哪、什么时候、和什么有关"。对比 Microsoft GraphRAG 和 LightRAG 两条技术路线。

Agent 工程实践语音 AgentLiveKit

语音 Agent 生产部署实战：LiveKit Agents 从原型到百万并发

语音 Agent 是下一个爆发点。LiveKit(11k Stars, 支撑 ChatGPT 高级语音)提供完整框架，本文从 pipeline 拆解到生产部署，手把手搭建可商用的语音 Agent。

Agent 工程实践 ClineVS Code

Cline 深度实战：在 IDE 和终端中部署 AI 编码 Agent

从 CLI、VS Code 扩展到 Kanban 多 Agent 看板，系统讲解 Cline 三大部署形态与 MCP 集成实践，打造人机协作的 AI 编码工作流。

Agent 工程实践 LiteLLM成本治理

LiteLLM 实战：从成本治理到团队 API Key 的工程化落地

基于 LiteLLM 官方文档与 51k Star 仓库，深入讲解 Virtual Key、Proxy Guardrails、复杂路由和数据库成本治理，把团队 LLM 调用从"散装"升级为可审计平台。

Agent 工程实践 OpenManusAI Agent

OpenManus 深度解读：无邀请码的通用 AI Agent 实践

基于 OpenManus 官方仓库实际代码，解读其简洁架构、工具层、浏览器自动化与 MCP 扩展方式，并给出本地部署与竞品对比。

Agent 工程实践 Ray分布式计算

Ray 分布式 Agent 编排：从单机原型到集群部署

利用 Ray 的分布式运行时能力，讲解如何将单机 Agent 原型扩展为可水平缩放的集群部署方案。

Agent 工程实践 sandbox-executionmicrovm

代码沙箱在 AI Agent 中的实践：从 Docker 到 microVM 的选型矩阵

五款主流沙箱技术横评，给出 E2B / Modal / Firecracker / gVisor / Kata 的延迟、安全、运维成本对比。

Agent 工程实践 security-guardrailsred-team

AI Agent 安全护栏与红队测试实战：从规则引擎到对抗评估

五层防御 + 红队闭环，5 个开源项目落地可复制方案，避开 prompt 越狱与 PII 泄露。

Agent 工程实践 deep-researchagent-architecture

Deep Research Agent 架构实战：从单轮搜索到迭代推理

拆解五个开源 Deep Research 项目的迭代检索、事实验证、报告生成三大子阶段，附可复制的 query 改造代码。

Agent 工程实践 llm-gatewaymodel-routing

LLM 路由与多模型网关降本实战：一份生产级多模型架构

四款主流 LLM 网关横评，多模型 fallback / 智能路由 / 成本观测 / 场景调度四大模式落地。

Agent 工程实践 Agent 评估LLM 评测

Agent 评估与测试体系：从单轮评分到端到端流水线

大多数团队靠"看起来对了"来判断 Agent 质量。真正的评估需要三层指标、不腐烂的数据集、以及不会什么都同意的评判器。本文给出可运行的代码和可落地的决策框架。

Agent 工程实践 AI Agent工作流编排

Agent 工作流编排实战：从 DAG 到状态机的生产级模式

多数 Agent 工作流并非败在模型能力，而是败在编排层。对比 DAG、状态机、可视化构建器三种编排范式，给出可复制的生产级错误处理、人工审批和条件分支代码。

Agent 工程实践 AI 编程Coding Agent

AI 编程 Agent 深度对比：从 CLI 到 IDE 内嵌的架构取舍

从 CLI-first、IDE-集成到完全自主三种架构出发，对比七款主流编程 Agent 的上下文管理、工具访问和自主度，帮你为每个开发场景选对工具。

Agent 工程实践 Browser AgentWeb 自动化

Browser Agent 实战：让 AI 操控浏览器的架构与陷阱

从裸 Playwright 到结构化提取，拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。

RAG 与知识系统 RAGChunking

RAG 进阶：Chunking 策略与检索优化的实战取舍

大多数 RAG 管线在检索环节就失败了——根因是 chunking 策略。本文从五种分块方法、混合搜索、Reranking 到完整生产管线，给出可落地的决策框架。

Agent 工程实践 AI Agent记忆系统

Agent 记忆系统设计：从短期上下文到持久化知识

深入解析 Agent 记忆的四层架构，结合向量检索和记忆压缩的实战代码，帮你构建可扩展的 Agent 长期记忆系统。

Agent 工程实践 AI Agent可观测性

Agent 可观测性体系构建：从链路追踪到自动评估

系统讲解 Agent 可观测性的三大支柱——链路追踪、指标监控和自动评估，帮你构建生产级 Agent 监控体系。

Agent 工程实践 AI Agent安全

AI Agent 安全攻防实战：从 Prompt 注入到纵深防御

系统梳理 AI Agent 面临的三大攻击面，结合实战代码讲解提示注入防御、工具权限隔离和输出过滤的纵深防御策略。

Agent 工程实践 AI Agent沙箱

AI Agent 沙箱与代码执行安全：隔离策略与实战方案

对比容器、WebAssembly、进程级隔离三种沙箱方案，结合实战代码讲解如何安全执行 Agent 生成的代码。