华为数据存储产品线总裁周跃峰19日预告,华为或于明年初推出AI Data Platform实体产品,将集成推理加速、多模知识库生成与检索,使存储从“存得下”升级为“AI数据平台”。(美联社)
(北京22日讯)华为发表AI黑科技杠上英伟达(Nvidia),21日推出AI领域的突破性技术“Flex:ai”,透过算力切分技术,将单张图形处理器(GPU)或神经网络处理器(NPU)算力卡切分为多份虚拟算力单元来弹性调度使用,让算力资源平均利用率提升30%。
中国基金报报道,华为公司副总裁、华为数据存储产品线总裁周跃峰表示,Flex:ai能够释放基础设施潜力,开源加速AI真正走向平民化。
华为的Flex:ai技术,与英伟达旗下Run:ai公司的核心技术类似。同时,Flex:ai是能够让AI行业化落地的重要工具之一,华为在发布Flex:ai后,同步开源至魔擎社区,建构完整的全流程AI开发工具平台(ModelEngine)开源生态。
为什么推出Flex:ai?华为方面认为,在大模型时代,容器技术与AI是天然搭档。容器技术作为一种羽量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立且羽量级的镜像,实现跨平台无缝迁移,解决模型部署存在环境配置不一致的痛点。此外,传统容器技术已经无法完全满足AI工作的负载需求,AI时代需要AI容器技术。
华为认为Flex:ai具备两大独特优势。
一是虚拟化,除了在本地虚拟化技术中实现算力单元的按需切分,Flex:ai独有的“拉远虚拟化”技术,可以不做复杂的分散式任务设置,将集群内各节点的空闲算力聚合形成“共用算力池”。
二是智慧调度,Flex:ai的智慧资源和任务调度技术,可以自动感知集群负载与资源状态,结合AI工作负载的优先顺序、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全域最优调度,满足不同AI工作负载对资源的需求。
Flex:ai的发布和开源,助力华为构建完整的ModelEngine开源生态,作为大模型训练、推理和应用开发的AI平台,可以提供从资料预处理到模型训练、优化及部署的一站式服务。