MPress 分类 | 知识笔记

MPress 通过存储保存算子间并行性在多GPU服务器上实现十亿规模级模型训练的民主化

MPress: Democratizing Billion-Scale Model Training on Multi-GPU Servers via Memory-Saving Inter-Operator Parallelism

地址：https://par.nsf.gov/servlets/purl/10410479

MouseSun大约 36 分钟