Fabric网络技术白皮书 华为联结IEEE Subsection独特颁布HPC无损以太和AI Kazakhstan
[阿拉木图,2023年6月5日] 在2023华为中东中亚技术嘉年华时期,华为成功举行数通翻新峰会。来自哈萨克斯坦、乌兹别克斯坦、沙特、阿联酋、卡塔尔、巴基斯坦等多个国度的480多位客户和同伴介入本次峰会,独特探讨行业数字化开展和网络技术翻新。会上,华为联结IEEE Kazakhstan Subsection、阿联酋初级国度钻研和教育网络Ankabut面向世界独特颁布了《HPC无损以太和AI Fabric网络技术白皮书》(以下简称“白皮书”)。白皮书论述了无损以太数据中心网络在HPC和AI畛域宽泛的运行前景,并从网络架构、关键技术、商业价值、最佳通常等维度论述了最新的技术钻研与商用通常成绩。
华为联结IEEE Kazakhstan Subsection、Ankabut颁布《HPC无损以太和AI Fabric网络技术白皮书》
白皮书指出,无损以太网络技术具有默认RDMA、网络级负载平衡等特色,可成功零丢包转发和90%的超高吞吐率,构成性能、兼容性、老本效益和灵敏性等全方面长处,已成为高性能计算的肯定选用。同时世界各国踊跃颁发政策允许HPC和AI开展,未来,无损以太网络将在世界数字化中施展关键作用。
白皮书中首先引见了高性能计算网络拓扑架构包含CLOS、MultiRail、直连拓扑。其中,CLOS是一个多级架构,在每一级,每个替换单元都和下一级的一切替换单元相衔接,可以做到严厉的无阻塞、可重构、可裁减;MultiRail经过框式设施的信元替换,成功平面内的相对负载平衡;直连拓扑可成功超大规模组网,具有低老本、端到端通讯跳数少的特点。
其次引见了软件架构从网络自身的优化、网络与运行系统的融合优化两个方面来优化HPC&AI运行性能。其中网络自身优化经过以下三个方面成功整网吞吐最高、时延最低的指标:第一是流控技术,经过识别环形缓存依赖并废弃其发生的必要条件,从而处置PFC死锁的疑问,提高网络牢靠性;第二是拥塞控制,经过AI算法灵活调理ECN门限,以取得最大带宽与最小时延;第三是流量调度,经过NSLB技术处置网络负载不均的疑问,成功90%高吞吐,以达成AI训练效率优化20%的结果。网络与运行系统的融合优化,则由HPC网络经过在网计算成功运算优化,即经过MPI通讯的在网聚合运算个性,网络设施介入计算环节,缩小义务成功时期。
HPC无损以太和AI Fabric网络技术白皮书
整个社会开展的大趋向是HPC&AI For Everything,无损以太网络将继续为成功万物互联、万网互通筑基架梁;为千行百业提供算力服务,打造数字经济时代的松软高性能计算底座;为先进数字产业兴盛开展奉献力气,助力世界数字化转型。
更多信息,请点击下载《HPC无损以太和AI Fabric网络技术白皮书》: