标签: nnScaler | 知识笔记

nnScaler：重塑深度学习并行策略，大幅提升训练效率

MPress: Democratizing Billion-Scale Model Training on Multi-GPU Servers via Memory-Saving Inter-Operator Parallelism

地址：https://www.usenix.org/system/files/osdi24-lin-zhiqi.pdf

中文解读：https://mp.weixin.qq.com/s/GV_CF9fPpxsPBNbEsvhS5g

MouseSun大约 39 分钟