DeepSpeed

Active

GitHub Python Apache-2.0

Description

Microsoft's open-source deep learning distributed training optimization library, featuring ZeRO memory optimization, 3D parallelism, and mixed-precision training for efficient training of trillion-parameter models.

Key Features

ZeRO optimizer — Partitions optimizer states, gradients, and parameters across GPUs for massive memory savings
3D parallelism — Combines tensor, pipeline, and data parallelism simultaneously
Ultra-long sequence training — Ulysses Sequence Parallelism for training on extremely long context sequences
Mixture of Experts — Built-in DeepSpeed-MoE supports trillion-parameter model training
Inference acceleration — DeepSpeed Inference optimizes Transformer model inference performance
Multi-hardware support — Compatible with NVIDIA, AMD, Intel GPUs and CPU training

Use Cases

💡 Large-scale LLM pretraining: Train trillion-parameter models on thousands of GPUs with ZeRO-3/ZeRO-Infinity

💡 Instruction fine-tuning and RLHF: Efficient RLHF training with low resource requirements via DeepSpeed-Chat

💡 Scientific computing acceleration: DeepSpeed4Science optimizes molecular dynamics, weather forecasting, and other simulations

💡 Multimodal large model training: Train vision-language models with DeepSpeed-VisualChat

Quick Start

# Install DeepSpeed
pip install deepspeed

# Verify installation
ds_report

# Run training script with DeepSpeed
deepspeed --num_gpus=4 train_script.py

# Or use via PyTorch Lightning integration
pip install pytorch-lightning

Visit GitHub Visit Website View Docs

DeepSpeed

Description

Key Features

Use Cases

Tags

Categories

Quick Start

Related Projects

Megatron-LM

Agently

Atomic Agents

AutoChain