Weights & Biases

活跃

GitHub Python MIT

简介

W&B 是面向机器学习与 LLM 应用的实验追踪、可视化与协作平台，支持 Agent 训练评估、超参管理与模型注册全流程。

核心特性

实验追踪 — 自动记录超参、指标、系统资源与代码版本，支持实验对比与可视化
W&B Models — 提供 artifacts 模型注册、版本管理与部署到生产的能力
W&B Weave — LLM 与 Agent 专用 trace 工具，支持 prompt 评估、对话回放与质量评分
Sweeps 超参搜索 — 集成贝叶斯与网格搜索，自动跑大量实验找到最佳超参组合
团队协作 — 实验报告与可视化面板可一键分享，支持团队评论与权限管理
报告与 Dashboard — 拖拽式构建可发布的实验报告，支持内嵌图表与交互组件

适用场景

💡 跟踪 Agent 训练与微调实验，对比不同模型与超参组合的效果

💡 用 Weave 记录 LLM 调用 trace，调试 Agent 决策链路并评估输出质量

💡 管理 Agent 提示工程实验，记录 prompt 版本与对应的评估分数

💡 在团队内部共享实验报告与可视化面板，统一 Agent 研发流程

💡 把训练好的模型注册到 W&B Artifacts 并发布到生产推理服务

分类

📊 可观测性 ⚡ Agent 工具

快速开始

pip install wandb
wandb login
import wandb
wandb.init(project='agent-eval', config={'lr': 0.001, 'model': 'claude-sonnet-4-6'})
for step in range(100):
  wandb.log({'loss': 0.1 * step, 'accuracy': 0.9 + 0.001 * step})
wandb.finish()

访问 GitHub 访问官网查看文档

Weights & Biases

简介

核心特性

适用场景

标签

分类

快速开始

相关项目

Blaxel AI SDK

Helicone

Plano

AxonHub