Arize Phoenix
活跃简介
Phoenix 是面向 LLM 与 Agent 应用的开源观测与评估工具,支持在线追踪与离线诊断。
核心特性
- 基于 OpenTelemetry 的 LLM 应用运行时可观测性追踪
- LLM 驱动的评估,用于响应和检索质量基准测试
- 版本化数据集,用于实验、评估和微调
- 提示词管理,支持版本控制、标签和实验
- Playground 用于优化提示词、对比模型和回放追踪调用
- 内置 PXI Agent,用于调试追踪和导航 Phoenix
适用场景
💡 追踪和调试 LangChain、LlamaIndex、OpenAI SDK 的 LLM 调用
💡 使用内置评估工具评估 RAG 管道检索质量
💡 系统性地对比提示词版本和模型变体
💡 监控生产环境 LLM 性能并检测回归
💡 使用版本控制和 A/B 测试管理提示词库
分类
快速开始
pip install arize-phoenix → import phoenix as px → px.launch_app() → 打开 http://localhost:6006 → 使用 OpenTelemetry 埋点 LLM 代码