DeepSpeed
活跃简介
Microsoft 开源的深度学习分布式训练优化库,提供 ZeRO 内存优化、3D 并行、混合精度训练等核心能力,支持千亿参数模型的高效训练与推理加速。
核心特性
- ZeRO 优化器 — 将优化器状态、梯度和参数分片到多 GPU,显著降低内存占用
- 3D 并行 — 支持张量并行、流水线并行和数据并行同时使用
- 超长序列训练 — 通过 Ulysses Sequence Parallelism 训练超长上下文序列
- 混合专家(MoE) — 内置 DeepSpeed-MoE,支持万亿参数模型训练
- 推理加速 — DeepSpeed Inference 优化 Transformer 模型推理性能
- 多硬件支持 — 兼容 NVIDIA、AMD、Intel GPU 及 CPU 训练
适用场景
💡 大规模 LLM 预训练 — 使用 ZeRO-3/ZeRO-Infinity 在数千 GPU 上训练千亿参数模型
💡 指令微调与 RLHF — 基于 DeepSpeed-Chat 进行低资源高效 RLHF 训练
💡 科学计算加速 — 通过 DeepSpeed4Science 方案优化分子动力学、天气预报等科学模拟
💡 多模态大模型训练 — 利用 DeepSpeed-VisualChat 训练视觉语言模型
分类
快速开始
# 安装 DeepSpeed
pip install deepspeed
# 验证安装
ds_report
# 使用 DeepSpeed 运行训练脚本
deepspeed --num_gpus=4 train_script.py
# 或通过 PyTorch Lightning 集成使用
pip install pytorch-lightning