TensorZero
活跃简介
TensorZero 是面向 LLM 应用与 Agent 系统的开源推理网关和优化平台,强调高性能推理、实验评测、路由控制与生产级观测能力。
核心特性
- 统一 LLM 网关:通过单一 API 访问所有主流 LLM 提供商,10k+ QPS 时 p99 延迟开销 <1ms
- 生产级可观测性:将推理和反馈存储在自有数据库中,提供完整 UI 和编程访问
- 自动优化(Autopilot):分析可观测性数据、设置评估、优化提示并自动运行 A/B 测试
- 评估框架:使用启发式、LLM 评委和自定义指标对单次推理或端到端工作流进行基准测试
- 内置实验能力:A/B 测试、路由、回退、重试、负载均衡和细粒度速率限制
- OpenAI SDK 兼容:一行代码集成——支持现有 OpenAI、OpenTelemetry 和提供商 SDK
适用场景
💡 统一 API 网关替代各提供商集成,集中路由和回退
💡 生产环境中 LLM 聊天机器人和代理的自动提示优化与 A/B 测试
💡 跨团队和使用场景的成本跟踪、用量监控和自定义速率限制
💡 通过内置评估管道对提示更改和模型替换进行性能基准测试
分类
快速开始
通过 Docker 部署 TensorZero Gateway(`docker compose up`),将 OpenAI 兼容客户端指向 `http://localhost:3000/openai/v1`,并将模型名称改为 `tensorzero::model_name::provider::model`。完整设置约 5 分钟。