精选文章

AI Agent 开发相关的技术文章和教程

Agent 评估与测试体系：从单轮评分到端到端流水线

大多数团队靠"看起来对了"来判断 Agent 质量。真正的评估需要三层指标、不腐烂的数据集、以及不会什么都同意的评判器。本文给出可运行的代码和可落地的决策框架。

AgentList Team · 2026年4月28日

Agent 评估LLM 评测自动化测试

Agent 工作流编排实战：从 DAG 到状态机的生产级模式

多数 Agent 工作流并非败在模型能力，而是败在编排层。对比 DAG、状态机、可视化构建器三种编排范式，给出可复制的生产级错误处理、人工审批和条件分支代码。

AgentList Team · 2026年4月28日

AI Agent工作流编排DAG

AI 编程 Agent 深度对比：从 CLI 到 IDE 内嵌的架构取舍

从 CLI-first、IDE-集成到完全自主三种架构出发，对比七款主流编程 Agent 的上下文管理、工具访问和自主度，帮你为每个开发场景选对工具。

AgentList Team · 2026年4月28日

AI 编程Coding AgentCLI

Browser Agent 实战：让 AI 操控浏览器的架构与陷阱

从裸 Playwright 到结构化提取，拆解三层浏览器自动化抽象的适用场景、生产模式和常见踩坑。

AgentList Team · 2026年4月28日

Browser AgentWeb 自动化Playwright

RAG 进阶：Chunking 策略与检索优化的实战取舍

大多数 RAG 管线在检索环节就失败了——根因是 chunking 策略。本文从五种分块方法、混合搜索、Reranking 到完整生产管线，给出可落地的决策框架。

AgentList Team · 2026年4月28日

RAGChunking检索优化

Agent 记忆系统设计：从短期上下文到持久化知识

深入解析 Agent 记忆的四层架构，结合向量检索和记忆压缩的实战代码，帮你构建可扩展的 Agent 长期记忆系统。

AgentList Team · 2026年4月21日

AI Agent记忆系统向量检索

Agent 可观测性体系构建：从链路追踪到自动评估

系统讲解 Agent 可观测性的三大支柱——链路追踪、指标监控和自动评估，帮你构建生产级 Agent 监控体系。

AgentList Team · 2026年4月21日

AI Agent可观测性链路追踪

AI Agent 安全攻防实战：从 Prompt 注入到纵深防御

系统梳理 AI Agent 面临的三大攻击面，结合实战代码讲解提示注入防御、工具权限隔离和输出过滤的纵深防御策略。

AgentList Team · 2026年4月21日

AI Agent安全Prompt Injection

AI Agent 沙箱与代码执行安全：隔离策略与实战方案

对比容器、WebAssembly、进程级隔离三种沙箱方案，结合实战代码讲解如何安全执行 Agent 生成的代码。

AgentList Team · 2026年4月21日

AI Agent沙箱代码执行

MCP Server 开发实战：为 Agent 构建自定义工具链

从零构建生产级 MCP Server，涵盖工具定义、鉴权设计、流式响应和测试策略，帮你把任何 API 变成 Agent 可用的工具。

AgentList Team · 2026年4月21日

MCPAgentTool Server

精选

MCP 协议实战：给 Agent 接上可扩展工具生态

从协议模型、服务端设计到权限隔离，系统讲解如何用 MCP 为 AI Agent 构建稳定的工具接入层。

AgentList Team · 2026年2月25日

MCPAgentTool Calling

精选

Agent 可观测性落地手册：用 Langfuse 做全链路追踪

结合真实落地经验，介绍如何用 Langfuse 搭建 Agent 追踪、评估与成本分析闭环。

AgentList Team · 2026年2月18日

Langfuse可观测性Tracing

PydanticAI 生产实践：类型驱动的 Agent 设计模式

聚焦结构化输出、工具调用和错误恢复，介绍 PydanticAI 在生产环境中的实用设计模式。

AgentList Team · 2026年2月11日

PydanticAIAgentPython

Web 自动化 Agent 实战：browser-use 的能力边界与最佳实践

详解 browser-use 在网页任务自动化中的优势与限制，并给出稳定执行和失败恢复策略。

AgentList Team · 2026年2月5日

browser-useWeb AutomationAgent

Qdrant + RAG 检索优化指南：从召回到回答质量

面向生产场景，总结使用 Qdrant 构建 RAG 检索层时的索引、过滤、重排与评估策略。

AgentList Team · 2026年1月30日

QdrantRAGVector Database

精选

用MetaGPT打造AI软件团队：从需求到代码的全流程自动化

深入介绍 MetaGPT 如何通过角色扮演实现软件开发全流程自动化，包括产品经理、架构师、工程师等角色协作的实践指南。

AgentList Team · 2025年3月1日

MetaGPTMulti-Agent软件开发

精选

向量数据库选型指南：Milvus、Chroma、Weaviate深度对比

全面对比主流开源向量数据库 Milvus、Chroma 和 Weaviate 的性能、功能和适用场景，帮助你选择最适合 RAG 应用的向量数据库。

AgentList Team · 2025年2月28日

向量数据库RAGMilvus

精选

RAG系统评估实战：使用Ragas和DeepEval构建高质量检索增强生成应用

学习如何使用 Ragas 和 DeepEval 评估 RAG 系统的质量，包括忠实度、答案相关性、上下文精确度等关键指标的测量方法。

AgentList Team · 2025年2月25日

RAG评估Ragas

精选

构建有状态的AI Agent：Letta(MemGPT)深度实践指南

深入学习如何使用 Letta（原 MemGPT）构建具有长期记忆的有状态 AI Agent，解决 LLM 的上下文窗口限制问题。

AgentList Team · 2025年2月22日

LettaMemGPTAI Agent

精选

AI编程助手对比：Aider、Continue、Cursor哪家强？

详细对比 Aider、Continue 和 Cursor 三款热门 AI 编程助手，从功能、体验、定价等维度帮助你选择最适合的开发工具。

AgentList Team · 2025年2月20日

AI编程助手AiderContinue

精选

2025年AI Agent开发框架选型指南

深入对比 LangChain、LangGraph、CrewAI、AutoGen 等主流 AI Agent 框架，帮助你选择最适合的开发工具。

AgentList Team · 2025年2月15日

AI AgentLangChainLangGraph

精选

从零开始构建你的第一个AI Agent

手把手教你从零开始构建一个完整的 AI Agent，涵盖环境配置、核心组件开发、工具集成等完整流程。

AgentList Team · 2025年2月10日

AI Agent入门教程Python

精选

多智能体协作系统架构设计

深入探讨多智能体(Multi-Agent)系统的设计原则、架构模式和最佳实践，帮助你构建高效的协作系统。

AgentList Team · 2025年2月8日

Multi-Agent系统架构协作模式

精选

AutoGPT本地部署完全指南

详细介绍 AutoGPT 的本地安装部署方法，包括环境配置、Docker 部署、常见问题解决等完整教程。

AgentList Team · 2025年2月5日

AutoGPT部署教程Docker

RAG技术详解：让AI Agent拥有知识库

深入解析检索增强生成(RAG)技术，教你如何为 AI Agent 构建私有知识库，提升回答的准确性和可靠性。

AgentList Team · 2025年2月1日

RAG向量数据库知识库