【芯视野】进击多元算法时代,DPU之争如何获得更大赢面?

来源:爱集微 #芯视野# #DPU# #异构计算#
2.6w

DPU这个名号变得响亮是从2020年开始的。彼时,英伟达宣布完成对以色列网络芯片商Mellanox高达69亿美元的收购交易,随即就推出了这笔收购的成果——新一代DPU。英伟达创始人兼CEO黄仁勋强大的带货能力为DPU点亮光环,同年初创公司Fungible对DPU大肆推广。AMD收购赛灵思以补齐FPGA短板,前不久又宣布以约19亿美元收购云服务提供商Pensando,至此AMD也正式进入DPU领域。

DPU市场蛋糕持续做大和爆发。与此同时,国内短时间内也涌现数十家DPU初创企业,中科驭数、大禹智芯、芯启源、益思芯、星云智联、云豹智能等本土DPU企业正组成推动DPU国产替代的主力军。

在这场围绕数字化时代的异构计算大乱斗中,混合CPU+GPU大有成为未来大算力计算芯片设计的趋势,分食数据中心计算市场的DPU拥有多大潜力?  

DPU——算力释放的关键芯片

DPU,全名Data Processing Units(数据处理单元),宛若一块微型计算板、拥有更强的处理性能,是可以为CPU“减负”的一种新型专用处理器。在全球计算、存储和网络基础设施也在发生根本转变的当下,数据中心已成为新型计算单元,随着通用CPU的扩展性表现逐渐滑坡,复杂工作负载转向智能网卡(SmartNIC)或是DPU。DPU通过处理器和SmartNIC的组合,兼顾传输和计算的需求,于此DPU也被看作是SmartNIC技术的演化增强版本。主要的云服务提供商和网卡供应商基于不同的解决方案,开发不同的SmartNIC,并向DPU方向升级。DPU成为继CPU和GPU之后第三颗重要的算力芯片,相关技术的适用范围在这时也开始明朗。

DPU主要承担网络、存储和安全的加速处理任务,旨在满足网络侧专用计算需求,尤其适用于服务器量多、对数据传输速率要求严苛的场景。具体看来,DPU对CPU所不擅长的网络协议处理、数据加解密、数据压缩等数据处理任务,可以顺滑地接手,并且对各类资源分别管理、扩容、调度。以X86为例,DPU加上与自身密切集成的硬件加速器,释放了X86处理器内核,从而使计算机不过度依赖CPU供应商。与此同时,DPU也可以像GPU一样进行高性能任务卸载。如今的DPU(如英特尔定义的IPU)正在接管所有的工作负载,其应用远远超出网络堆栈加速,它囊括了服务加速、虚拟化堆栈存储、应用程序加速以及如今数据中心需要的基础设施任务,

图:通过将部分运算挪至DPU减少CPU运算;图源:英伟达

DPU作为一个独立的处理器,具有完全可编程性,兼具安全或测量启动功能,可以看作是通往主机的网络流量的消防带。DPU可实现基础设施可信的解决方案,仅启动处于供应商高度保护、特定版本的操作系统,运行特定的软件堆栈,而与主机软件完全隔离。以英伟达的DPU为例,当计算机系统物理上不联网时,DPU实现防止入侵,从而承载了物理隔离安全特性的功能。

图:DPU可作为CPU和存储的中枢;图源:英伟达

拥有如“缝合怪”般功能属性、潜力巨大的DPU同时吸引了学术界的目光,如色列理工学院电子与计算机工程学院正在探索DPU的GPU管理领域。

算力大斗法、DPU之技术漩涡

由于DPU需要大量的软件来配合系统工作,系列芯片与客户和场景强绑定,很难保证通用属性,所以目前DPU在市面上占有率并不高。以色列理工学院副教授、以色列理工学院电子与计算机工程学院副教授MarkSilberstein在接受集微咨询(JW Insights)采访时表示,当DPU被用来处理流量时,网络栈层级间的频繁切换会耗损大量成本。DPU通常被用来处理传入流量,终止安全传输层协议意味着要DPU上要运行整个TCP栈,由于网络栈的层次之间相辅相成,因而不能随意取走网络处理管线中的一节,让它们一部分在DPU上运行,一部分在CPU上运行,故而频繁切换会耗损大量成本。另一方面,如果将所有运算都堆至DPU上并未正确地卸载硬件任务时,DPU的处理速度将会变慢。最后,性能不强的DPU不适合以线路速率处理整个流量。在DPU/智能网卡被更广泛地使用前,必须解决以上问题。

Mark表示,在算法和硬件方面上看,DPU的性能和算力比不过X86处理器,但算力的性价比很高。一个单独装载Arm核的NIC的性能仅为X86的1/3或1/5,但DPU的耗能远低于X86处理器,由此降低了成本。因此,在计算机对算力没有很高的要求时,可以利用DPU网络延迟极低的特性,在不经过PCIe到CPU的情况下进行运算处理。但DPU运行时需要ASIC或NIC内部进行智能处理,只引导部分流量进入DPU,放行其余流量直接进入主机。

海外巨头已经祭出算力组合拳,例如AMD打出CPU+GPU+FPGA+DPU超级套餐,磨刀霍霍向Intel。反观国内这两个赛道的企业,却还在单打独斗,DPU相关的本土企业创新速度也落后于国际巨头智能网卡硬件壁垒,只能寄望于华为阿里,初创中有组合拳意识的仅有壁仞科技——自研GPU,投资了CPU和DPU。

市场潜力即将释放,全球玩家如何引领新局面

赛迪顾问的数据显示,从2023年开始全球DPU市场规模将突破百亿美元,并进入年增长率超过50%的增长快车道。而在中国DPU市场规模在2023年也将有300亿元人民币以上,呈现跳跃式增长。目前从全球 DPU 产业格局来看,产品应用仍相对分散,还未催生大量新的应用和服务,带动相关硬件和软件系统平台也有待增长。与海外群雄逐鹿的赛况不同,本土DPU行业目前主要以创业公司为主导,少有大体量的科技公司进入。

图源:赛迪顾问

图源:赛迪顾问

参照过往AI芯片市场竞争格局的转变历史,DPU赛道很可能也将不再是一个初创企业混战的市场。随着越来越多资本和大企业的涌入,最终有实力的大公司将成为整个市场的主导力量。集微咨询(JW Insights)分析师冯翔表示,国外巨头都在着力在点、线、面三大维度布局,如通过并购或产品线的拓展布局线,实现核心技术转化为主营收入,围绕上下游进行串联实现面的拓展,对本土企业来说,点突破就很难,线面则更难,未来仍任重而道远。

DPU对云场景强依赖,需要企业充分理解大规模云厂商业务需求、定义架构特性,以及大芯片的工程实现能力,到底是独立通用还是附属专用,能否成为网络基础设施中的主流方案,有待观望。企业需要关注整体的生态,刺激到云基础设施的计算需求。我国的互联网生态日渐强劲以及数据大爆发推动了对算力的需求,给予算力经济有利的发展条件。另外,我国对网络安全的愈加重视,让DPU在确保网络安全方面更有大展拳脚的机会,实现从数据安全到数据中心安全的全方位覆盖。

(校对/李梅)

责编: 李梅
来源:爱集微 #芯视野# #DPU# #异构计算#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...