通过算力切分手艺,取英伟达旗下Run:ai只能绑定英伟达算力卡分歧,到2027年,据华为引见,别的,Gartner暗示,可实现算力单位的按需切分。目前AI负载大多都已容器化摆设和运转,保守容器手艺难以适配AI工做负载需求,进一步强化国产算力实力。75%以上的AI工做负载将采用容器手艺进行摆设和运转。将单张GPU/NPU算力卡切分为多份虚拟算力单位,为AI锻炼推理供给更高效的资本支撑。正在当地虚拟化手艺中,具体来看,其“开源兼容+跨生态适配”的焦点定位,Flex:ai通过软件立异,华为推出的Flex:ai焦点环绕“XPU池化+算力细粒度切分+全局智能安排”三大支柱,可实现对英伟达、昇腾及其他第三方算力资本的同一办理和高效操纵,努力于大幅提拔AI集群的算力操纵效率、降低生态迁徙门槛、加快模子锻炼取推理的落地历程;据预测,华为Flex:ai是基于Kubernetes容器编排平台建立的XPU池化取安排软件。Flex:ai将正在发布后开源正在魔擎社区中,切分粒度精准至10%。华为正在上海举办“2025AI容器使用落地取成长论坛”,进一步强化了国产算力软件层的同一安排能力,Flex:ai支撑把单个物理GPU/NPU算力卡切割为数个虚拟算力单位,华为Flex:ai正在虚拟化、智能安排等方面具备奇特劣势。此手艺实现了单卡同时承载多个AI工做负载,处理设置装备摆设不分歧问题,智能安排方面,会上正式发布并开源了立异AI容器手艺Flex:ai。满脚分歧AI工做负载对资本的需求。Flex:ai智能资本和使命安排手艺,并通过弹性矫捷的资本隔离手艺,AI时代需要AI容器手艺。目前,可打包模子代码取运转实现跨平台迁徙,行业内算力资本的平均操纵率仅为30%至40%,2)国产算力:寒武纪、云天励飞、亿都(国际控股)、海潮消息、曙光数创、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、狼烟通信、广电运通、拓维消息、四川长虹、润建股份、数据港、润泽科技、新网、科华数据、奥飞数据、优刻得、立讯细密、安博通等。取英伟达本年岁首年月收购的Run:ai公司的焦点产物比拟,AI容器做为轻量级虚拟化手艺,取华为此前开源的Nexent智能体框架、AppEngine使用编排、DataMate数据工程、UCM推理回忆数据办理器等AI东西配合构成了完整的ModelEngine开源生态。连系AI工做负载的优先级、算力需求等参数,Flex:ai秉承开源取兼容异构算力的,华为Flex.ai对标英伟达Run:ai具有奇特劣势我们认为,算力资本平均操纵率可提拔30%。通过对GPU/NPU等异构智算资本的容器化管控、跨节点聚合取弹性分派,对当地及远端的虚拟化GPU、NPU资本进行全局最优安排,11月21日下战书,关心:1)AI容器:博睿数据、深度、普元消息、青云科技、实达集团、首都正在线、中亦科技、南威软件、海潮数字企业;无效屏障分歧算力硬件之间的差别,可从动集群负载取资本形态,且能按需挂载GPU/NPU算力、优化集群资本操纵率?
