LiteLLM 实战:从成本治理到团队 API Key 的工程化落地

基于 LiteLLM 官方文档与 51k Star 仓库,深入讲解 Virtual Key、Proxy Guardrails、复杂路由和数据库成本治理,把团队 LLM 调用从"散装"升级为可审计平台。

AgentList Team · 2026年6月21日
LiteLLM成本治理LLM GatewayGuardrailsAPI Key 管理多模型

上一篇横评了四款 LLM 网关,本文深入 LiteLLM——51k+ Star、生产部署最广的开源 LLM 网关。差异化在团队工程化:Virtual Key、Guardrails、Postgres 审计、成本分摊、自动路由。

差异化定位

解决"团队/公司的 LLM 治理":虚拟 key + 预算、Postgres 记录成本、网关层 Guardrails、Langfuse/Helicone 可观测、YAML 路由策略。

Proxy Server 部署

uv tool install 'litellm[proxy]'
litellm --config config.yaml --port 4000

Docker Compose 用 ghcr.io/berriai/litellm-database:main-latest 镜像,需设置 LITELLM_MASTER_KEYLITELLM_SALT_KEY

Virtual Key

通过 HTTP API /key/generate 创建:

curl -X POST 'http://litellm:4000/key/generate' \
  -H "Authorization: Bearer $LITELLM_MASTER_KEY" \
  -d '{"user_id":"alice@","team_id":"engineering","models":["gpt-4o"],"max_budget":200}'

业务侧用 OpenAI SDK,base_url 指向 LiteLLM,api_key 用虚拟 key。

成本治理

  • /key/info?key=... 查询 key 支出
  • /team/info?team_id=... 查询团队支出
  • /global/spend/report?group_by=team 全局报表
  • 创建 key 时可指定 max_budgettpm_limitrpm_limit

自动路由

Proxy 内置 Complexity Router,根据请求复杂度自动选择模型:

- model_name: smart-router
  litellm_params:
    model: auto_router/complexity_router
    complexity_router_config:
      tiers:
        SIMPLE: gpt-4o-mini
        MEDIUM: gpt-4o
        COMPLEX: claude-sonnet

简单问答走 mini,复杂代码走 Sonnet,月成本可降 30-60%。

Guardrails

guardrails:
  - guardrail_name: presidio-pii
    litellm_params: { guardrail: presidio, mode: pre_call }
  - guardrail_name: lakera-jailbreak
    litellm_params: { guardrail: lakera, mode: post_call, api_key: os.environ/LAKERA_API_KEY }

支持 Presidio、Lakera、Aporia、Guardrails AI、Bedrock、Azure Content Safety 等。

可观测性

Langfuse:配置 success_callback: ["langfuse"] 并设置 LANGFUSE_PUBLIC_KEYLANGFUSE_SECRET_KEYLANGFUSE_HOST。 Helicone:设置 HELICONE_API_KEY。业务代码无改动。

实战

5 个 App 统一接入 LiteLLM:1 个 gateway + Postgres + Redis + Virtual Key + Complexity Router + Langfuse。

30 天收益:离职处理 24h→5min,月成本 -35%,5xx 告警 30min→1min。

适用场景

公司级治理、多团队成本分摊、合规审计。单脚本直接 OpenAI SDK。

总结

LiteLLM 把 LLM 网关从"路由层"升级为"运营层"。月用量 1 万美元以上或 5+ AI 应用,通常 3-6 个月 ROI 转正。