首页>TAG列表
HPN LLM 阿里 针对大规模 训练的万卡集群

HPN LLM 阿里 针对大规模 训练的万卡集群

一、背景之前的文章中咱们详细引见了万卡GPU集群中的网络拓扑以及在万卡GPU集群中启动大规模LLM训练面对的应战和处置打算;也进一步引见了阿里云的汇合通讯调度框架C4和C4底层的阿里云新一代智算集群网...