Weights & Biases

活跃
GitHub Python MIT

简介

W&B 是面向机器学习与 LLM 应用的实验追踪、可视化与协作平台,支持 Agent 训练评估、超参管理与模型注册全流程。

核心特性

  • 实验追踪 — 自动记录超参、指标、系统资源与代码版本,支持实验对比与可视化
  • W&B Models — 提供 artifacts 模型注册、版本管理与部署到生产的能力
  • W&B Weave — LLM 与 Agent 专用 trace 工具,支持 prompt 评估、对话回放与质量评分
  • Sweeps 超参搜索 — 集成贝叶斯与网格搜索,自动跑大量实验找到最佳超参组合
  • 团队协作 — 实验报告与可视化面板可一键分享,支持团队评论与权限管理
  • 报告与 Dashboard — 拖拽式构建可发布的实验报告,支持内嵌图表与交互组件

适用场景

💡 跟踪 Agent 训练与微调实验,对比不同模型与超参组合的效果
💡 用 Weave 记录 LLM 调用 trace,调试 Agent 决策链路并评估输出质量
💡 管理 Agent 提示工程实验,记录 prompt 版本与对应的评估分数
💡 在团队内部共享实验报告与可视化面板,统一 Agent 研发流程
💡 把训练好的模型注册到 W&B Artifacts 并发布到生产推理服务

快速开始

pip install wandb
wandb login
import wandb
wandb.init(project='agent-eval', config={'lr': 0.001, 'model': 'claude-sonnet-4-6'})
for step in range(100):
  wandb.log({'loss': 0.1 * step, 'accuracy': 0.9 + 0.001 * step})
wandb.finish()

相关项目