🤖

Agent 框架

用于构建 AI Agent 的核心框架

252 个项目

(24 / 252)

相关文章

Agent 工程生产监控Prompt A/B 测试

Agent 灰度发布与生产监控:从 Prompt A/B 到自动回滚

改了 Prompt 怎么知道是变好了还是变差了?系统介绍 Agent 的 canary 发布、质量门禁、自动回滚架构,以及如何在生产环境中持续监控 Agent 行为漂移。

Agent 评估LLM 评测自动化测试

Agent 评估与测试体系:从单轮评分到端到端流水线

大多数团队靠"看起来对了"来判断 Agent 质量。真正的评估需要三层指标、不腐烂的数据集、以及不会什么都同意的评判器。本文给出可运行的代码和可落地的决策框架。

Memory记忆系统长期记忆

Agent Memory 架构:短期、长期与共享记忆的设计取舍

系统对比 Agent Memory 的三大类别——短期记忆、长期记忆、共享记忆,从存储介质、生命周期、检索方式、典型框架到设计模式,完整覆盖 Agent 个性化和多 Agent 协作的工程实现。

small-language-modelsedge-inferencefine-tuning

小模型微调与边缘推理:让 AI Agent 在资源受限场景下跑得更快、更省

本文系统讲解小语言模型(SLM)在 Agent 场景中的微调策略与边缘推理架构,覆盖 QLoRA 量化、推理引擎选型、上下文压缩与工具调用约束,帮助在边缘端以低延迟、低成本、强隐私地部署生产级 Agent。

容错工具调用重试

Agent 工具调用容错:超时、重试、熔断、降级与幂等

系统梳理 Agent 工具调用的 7 大容错模式:超时分级、指数退避 + 抖动、熔断器、备用 Provider 链、可恢复错误分类、结构化校验、幂等键设计,让 Agent 在不稳定的真实环境中保持稳定输出。

AI Agent工作流编排DAG

Agent 工作流编排实战:从 DAG 到状态机的生产级模式

多数 Agent 工作流并非败在模型能力,而是败在编排层。对比 DAG、状态机、可视化构建器三种编排范式,给出可复制的生产级错误处理、人工审批和条件分支代码。