pipeline-parallelism

Paddle Distributed Training Examples. 飞桨分布式训练示例 Resnet Bert GPT MOE DataParallel ModelParallel PipelineParallel HybridParallel AutoParallel Zero Sharding Recompute GradientMerge Offload AMP DGC LocalSGD Wide&Deep

benchmark cloud lightning elastic unsupervised-learning large-scale data-parallelism paddlepaddle model-parallelism distributed-algorithm self-supervised-learning pipeline-parallelism pretraining fleet-api paddlecloud

Updated Jul 25, 2023
Python

Oneflow-Inc / libai

Star

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

nlp deep-learning transformer large-scale data-parallelism model-parallelism distributed-training self-supervised-learning oneflow pipeline-parallelism vision-transformer

Updated Jul 25, 2023
Python

alibaba / EasyParallelLibrary

Star

Easy Parallel Library (EPL) is a general and efficient deep learning framework for distributed model training.

deep-learning gpu memory-efficient data-parallelism model-parallelism distributed-training pipeline-parallelism

Updated Mar 31, 2023
Python

Shenggan / awesome-distributed-ml

Star

A curated list of awesome projects and papers for distributed training or inference

distributed-systems machine-learning deep-learning high-performance-computing model-parallelism pipeline-parallelism

Updated May 25, 2023

AlibabaPAI / DAPPLE

Star

An Efficient Pipelined Data Parallel Approach for Training Large Model

pipeline-parallelism hybrid-parallelism distribution-strategy-planner

Updated Dec 11, 2020
Python

saareliad / FTPipe

Star

FTPipe and related pipeline model parallelism research.

nlp deep-neural-networks distributed-training fine-tuning pipeline-parallelism t5

Updated May 16, 2023
Python

nawnoes / pytorch-gpt-x

Star

Implementation of autoregressive language model using improved Transformer and DeepSpeed pipeline parallelism.

pytorch transformer gpt pipeline-parallelism deepspeed

Updated Jan 2, 2022
Python

Shigangli / Chimera

Star

Chimera: Efficiently Training Large-Scale Neural Networks with Bidirectional Pipelines.

transformers distributed-deep-learning pipeline-parallelism

Updated Oct 10, 2022
Python

fanpu / DynPartition

Star

Official implementation of DynPartition: Automatic Optimal Pipeline Parallelism of Dynamic Neural Networks over Heterogeneous GPU Systems for Inference Tasks

machine-learning reinforcement-learning scheduling pytorch neural-networks model-parallelism treelstm pipeline-parallelism dynamic-neural-network dynpartition