Weights & Biases
活跃简介
W&B 是面向机器学习与 LLM 应用的实验追踪、可视化与协作平台,支持 Agent 训练评估、超参管理与模型注册全流程。
核心特性
- 实验追踪 — 自动记录超参、指标、系统资源与代码版本,支持实验对比与可视化
- W&B Models — 提供 artifacts 模型注册、版本管理与部署到生产的能力
- W&B Weave — LLM 与 Agent 专用 trace 工具,支持 prompt 评估、对话回放与质量评分
- Sweeps 超参搜索 — 集成贝叶斯与网格搜索,自动跑大量实验找到最佳超参组合
- 团队协作 — 实验报告与可视化面板可一键分享,支持团队评论与权限管理
- 报告与 Dashboard — 拖拽式构建可发布的实验报告,支持内嵌图表与交互组件
适用场景
💡 跟踪 Agent 训练与微调实验,对比不同模型与超参组合的效果
💡 用 Weave 记录 LLM 调用 trace,调试 Agent 决策链路并评估输出质量
💡 管理 Agent 提示工程实验,记录 prompt 版本与对应的评估分数
💡 在团队内部共享实验报告与可视化面板,统一 Agent 研发流程
💡 把训练好的模型注册到 W&B Artifacts 并发布到生产推理服务
分类
快速开始
pip install wandb
wandb login
import wandb
wandb.init(project='agent-eval', config={'lr': 0.001, 'model': 'claude-sonnet-4-6'})
for step in range(100):
wandb.log({'loss': 0.1 * step, 'accuracy': 0.9 + 0.001 * step})
wandb.finish()