持中立姿态 以技术翻新为驱动 金山云助力大模型开展落地
,金山云颁布了最新财报 人工智能业务的体现尤为突出。据财报数据显示,人工智能业务支出已增长至3.26亿元,占私有云支出的比例高达26%,且较上一季度成功了翻倍的清楚增长。
这一亮眼效果,与金山云坚决推进业务战略 密无法分。金山云初级副总裁刘涛 自2022年开局,金山云便着手启动业务整理,被动收缩CDN业务规模,并严厉挑选行业云名目,踊跃掌握人工智能带来的机会。 将更多资源投入到计算、大数据、数据库及AI等高利润率、高壁垒的产品畛域。这一战略调整,显然为金山云在人工智能业务上的迅猛开展
金山云初级副总裁刘涛
技术翻新打破,深耕大模型服务
为了更好地服务大模型客户,金山云在多方面深耕细作,紧跟用户需求,继续推进技术翻新与打破,这不只助力了泛滥大模型企业高效成功训练和推理上班,更为大模型时代的片面来到注入了微弱能源。
大模型时代,企业对算力的需求旺盛。 刘涛强调,算力业务并不是方便地售卖设备,而是涵盖了算力供应、 、存储以及平台才干等多个复杂而关键的环节。
针对客户不同场景中的需求,经过异构算力成功计算效能最大化 ,确保算力资源的稳固与短缺。
方面,金山云经过深化的技术研发,有效处置了稳固性、工程实施准确性等一系列应战。特意是在网络部署方面,金山云 应答大规模集群部署带来的网络部署和颤抖等难题。
妇孺皆知,大模型训练面临着 的应战,须要高性能的网络通讯来允许数据传输和同步。金山云从老本和 并且在多个名目中成功通常。此外,金山云自研的RoCE网络监控平台提供集群端侧和网侧的基础消息与目的、网络缺点感知和告警、被动排障才干;在GPU智能化运维插件方面,经过整合资源治理、配件监控和Kubernetes调度才干,成功秒级缺点感知、分钟级成功缺点自愈举措,这又从运维层面为客户提供了方便。其提供了翻新性的三维形式展现网络拓扑及衔接相关,经常使用户能够直观感知带宽应用率及网络颤抖或缺点位置。
的优化。针对模型训练对数据的高度依赖,金山云经过自研平台,成功了比放开数据框架CCNet更高的 效率,并在存算分别场景中展现出清楚长处。 针对生成式AI客户对数据荡涤的需求,金山云还整合星曜裸金属主机EPC、大数据平台KMR和对象存储KS3推出了针对该场景的数据荡涤处置打算,满足预训练数据集、微调数据集生成关于数据荡涤的需求。
为了满足客户对更高带宽兑付才干的需求,金山云开发了 KS3加快型,最高可提供1Tbps/PB的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能优化了上百倍 存储上去启动训练,训练义务须要访问NAS, 对象存储之上,提供十分高的带宽兑付才干。
集群规模更大时,就会触及checkpoint ,整个作业义务就要暂停,基于上一次性的checkpoint 更长,复原的代价也就会更大。为了处置在处置大规模集群的checkpoint缓存疑问,金山云研发了 ,经过并发处置,大幅优化了写入速度,缩短了训练因缺点终止后的复原期间,为客户提供了愈加高效、牢靠的训练环境。
在平台才干方面,金山云针对不同客户需求,灵敏调整服务战略。关于平台才干相对单薄的客户,金山云搭建了瀚海平台,这是一个针对大模型闭环的训练平台,涵盖了数据标注、荡涤、品质评测到数据配方治理的全方位服务,有效降落了客户的经常使用门槛。
中立定位,护航大模型企业持重前行
在当今百模大战的环境下,金山云仰仗其共同的中立定位和技术长处,成为泛滥企业信任的协作同伴。 刘涛引见了金山云的共同长处。
首先,金山云作为一家中立的云服务商,其共同定位使其能够站在客户的角度,提供愈加主观、专业且无成见的倡导与服务。这种中立性确保了金山云在为客户提供处置打算时,不会因任何潜在的利益抵触而侵害客户的利益,从而赢得了客户的信任与好评。
其次,金山云不只是一家云服务提供商,更是一站式MaaS处置打算服务商。从IaaS层的资源供应,到PaaS平台才干,再到下层的模型训练,金山云提供了片面的允许。这种一站式的服务形式极大地简化了客户在 大模型环节中的复杂度,使他们能够愈加方便、高效地成功模型的训练和推理,进而优化业务效率与竞争力。
最后,金山云还深知企业在实践工程实施中或者遇到的各种应战。因此,除了提供基础的云服务和MaaS处置打算外,金山云还为客户提供专业的咨询服务。无论是前期的规划与设计,还是模型调优、落地实施等关键环节,金山云都能仰仗丰盛的阅历和专业的技术团队,为客户提供量身定制的处置打算,确保客户的名目能够顺利推进并取得成功。
多维度服务构建智算云,灵敏应答企业多样需求
随着数字化转型的深化推进,越来越多的企业开局关注如何应用人工智能技术优化业务效率和竞争力。智算云作为提供算力服务的关键平台,能够为企业提供定制化的算力处置打算,满足其在人工智能研发、高性能计算等方面的需求
刘涛指出,智算云的概念远超于单纯的算力提供范围,它实践上是一个涵盖多维度的综合体系。其中包含了机器的保养与监控、网络基础设备的构建、治理运维的全方位允许,以及平台配件资源和网络资源的精细调度。它还触及下层的作业义务治理和推理义务治理等多个环节,构成了一个严密相连、高效协同的闭环。
刘涛进一步强调,智算云的外形 局限于私有云畛域。实践上,如智能驾驶汽车企业,因为面临严厉的数据合规要求,因此须要领有专属的Region来确保数据的合规性与安保性。金山云正是基于这一洞察, 提供私有云专区处置打算,这是一种翻新的散布式云树立形式,能够满足客户对数据安保和合规性的高要求。金山云与客户私有云环境的身份验证系统启动集成,成功了一致的治理界面和API允许,为客户提供了方便的经常使用体验。
除此之外,金山云还努力于提供私有云服务,片面满足企业在智算、网络、存储、推理框架以及训练义务等方面的多元化需求。而这一切,都无需企业自行承当基座树立和运维等繁琐义务。金山云规划并推出智算平台,经过在私有云侧树立账户、计量等治理配置,同时在企业私有环境中部署详细业务,成功了私有云与私有云的无缝对接与高效协同。
在继续优化私有云计算才干方面,金山云雷同不遗余力。公司不只推出了面向企业级的性能保证型云主机X8,以满足客户对高性能的厚道要求; 公司还首发了基于英特尔®至强®6能效核处置器的第九代云主机高效型SE9 ,在计算性能、内存性能、网络才干和存储才干等方面,SE9均成功大幅优化 愈加灵敏、高效的形式满足客户的多样化需求。与此同时,金山云还倾力打造了完备的智能计算集群,仰仗弱小的技术实力和丰盛的行业阅历,片面满足客户在智算场景下的各类需求。