nccl
nccl
NCCL是一款独立的库,提供标准的 GPU 通信例程,支持全规约(all-reduce)、全收集(all-gather)、规约(reduce)、广播(broadcast)、规约并散播(reduce-scatter)以及任意基于发送/接收的通信模式。该库经过优化,能够在使用 PCIe、NVLink、NVSwitch 以及基于 InfiniBand Verbs 或 TCP/IP 套接字的网络平台上实现高带宽。NCCL 支持任意数量的 GPU,无论是安装在单节点还是跨多个节点的系统中,并且可以在单进程或多进程(如 MPI)应用程序中使用。
大约 24 分钟