相关项目
Helicone
5.2k · TypeScript
Helicone 是面向大模型应用的开源代理与监控平台,提供请求追踪、缓存与成本分析能力。
observabilityproxyanalytics +1
Arize Phoenix
8.9k · Jupyter Notebook
Phoenix 是面向 LLM 与 Agent 应用的开源观测与评估工具,支持在线追踪与离线诊断。
observabilityevaltracing +1
TruLens
3.2k · Python
TruLens 是一个用于评估和跟踪 LLM 应用的开源工具。提供针对 RAG 应用的专门评估功能,包括上下文相关性、接地性和答案相关性等评估维度。
llmevaluationobservability +1
AgentOps
5.4k · Python
AgentOps 是一个 AI Agent 可观测性平台,提供 Agent 监控、调试和评估功能,帮助开发者优化 Agent 性能。
observabilitymonitoringdebugging +1