自ChatGPT横空出世掀起国内百模大战以来,拉动算力需求出现爆发式增长,也促进算力基础设施由通用算力为主向通算、智算、超算一体化演进。据IDC预计,2021-2026年期间,中国智能算力规模年复合增长率达52.3%,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1271.4 EFLOPS。
在这一趋势作用下,作为算力底座的云计算技术,对异构算力需求越来越高。中科驭数高级副总裁张宇认为,算力核心来源将是三U即GPU、CPU、DPU一体,CPU实现通用算力,GPU释放智能算力,DPU支撑基础I/O算力,实现多卡、多机数据的高速同步,缺一不可。
DPU作为新型算力基础设施的一股新生力量,在各行各业数据中心的应用也在逐步深入,而不同的场景需要多元化的DPU支持,在这方面一直专注于DPU研发、基于自研KPU芯片架构率先发布三代DPU、持续构建生态和扩展应用的中科驭数,显现出强劲的竞争力。
在最近举办的以“DPU构建高性能云算力底座”为主题的线上技术开放日活动上,中科驭数集中展现了其在低时延、云原生及智算中心三大关键场景下的技术成果与五大核心DPU解决方案,凸显了中科驭数在高性能数据中心建设与云算力基础设施升级中的坚实力量。
推动算力基础设施发展 应用多点开花
“DPU是解决数据中心计算效率低、资源利用率低、安全性低‘三低’问题的关键技术。中科驭数正不遗余力地参与并积极推动算力基础设施的发展,DPU技术开放日既是对DPU技术应用的典型方案展示,也是DPU技术在重要细分场景走向成熟的标志。”中科驭数创始人、CEO鄢贵海表示。
在云计算方面,中科驭数高性能云原生底座方案为DPU在云计算中落地应用夯实基础,带来物理隔离、业务卸载、硬件加速、业务快速迭代等诸多优势。通过将工作节点的存储、网络、管理等基础设施组件完全卸载到DPU硬件,释放Worker节点的CPU算力资源给到业务系统,帮助集群算效比大幅提升,极大提升了云基础设施的服务效能与稳定性。
张宇介绍,DPU已在某头部云计算厂商的云数据中心中落地。基于DPU的方案使得裸金属服务的业务逻辑发生了明显变化,可以大大缩短裸金属服务的交付时间,实现了虚拟网络功能的全面卸载,也为存算分离相关的多种存储技术提供了统一的接口。
针对云原生业务的复杂性和高时效性需求,中科驭数提出了基于DPU的极速服务网格方案,以服务网格化繁为简,有效降低了系统时延,为用户带来了前所未有的极致云原生业务体验。目前,基于DPU的服务网格方案已成功应用于国内某知名证券机构,引入中科驭数方案后,在七层服务治理下,时延降至100-130微秒;在四层流量下仅需40微秒。
在数据安全领域,中科驭数展示了高性能国产密码卸载方案,依托自主研发的加解密引擎,确保安全业务在保证极高效率的同时,实现了自主可控的安全保障。采用此方案,可降低主机CPU利用率至90%以上,确保业务零丢包,提高安全性能,减少客户工作量。
在智算、超算领域,并行文件系统是一种常见且重要的分布式文件存储系统。中科驭数推出的RDMA加速并行文件系统解决方案,采用RDMA网络DPU卡代替传统网卡,将RDMA网络应用与并行文件系统,突破了传统的存算速度瓶颈,解锁了存算之间的高速通道,以更少的计算资源提供更强的网络传输能力。
面对证券期货交易领域对低时延的严苛要求,中科驭数信创低时延网络解决方案凭借异构加速技术的创新应用,实现了自主安全且时延领先的技术突破,在系统层兼容各类国产操作系统,在应用层广泛适配多家业内金融软件厂商的交易系统,从而支撑核心交易业务从底层硬件到上层软件,向全信创平台迁移,同时还能获取媲美非信创的时延性能。
软硬协同发展 持续增添新动能
伴随着数字经济时代的全面开启,算力不仅成为新的关键生产力,也成为大国博弈的核心竞争力。国内DPU赛道也站满了各路玩家,如阿里云、腾讯、字节跳动等互联网巨头,以及一些DPU创业公司中科驭数、星云智联、云脉芯联、大禹智芯、益思芯、芯启源等。
随着大模型作为一种新型基础设施逐渐普及,AI将赋能千行百业,算力资源需求爆发性增长,数据中心将迎来新一轮的大规模扩容和升级,发展云端算力成为明确方向,对DPU需求也持续增长。有数据显示,未来几年云与数据中心领域每年国内服务器出货量将维持在500万台左右,其中DPU渗透率在10%左右,单台服务器可以配置一块到多块DPU板卡,预计每年DPU需求量将在100万片左右。
尤其是最近加快建设算力基础设施的各种重磅政策和方案接连出台,利好DPU产业发展。2023年10月,工信部、中央网信办、国务院国资委等六部门2023年10月联合印发《算力基础设施高质量发展行动计划》,提出到2025年算力规模超过300 EFLOPS,并将DPU设为重要任务之一。
在DPU比拼层面,一方面尽管DPU发展有不同的路线,但DPU SoC已成为当前国外头部云服务提供商和DPU厂商的主流技术路线。另一方面,生态至关重要。
中科驭数独辟蹊径,创新性地提出了软件定义加速器技术路线,自主开发敏捷异构KPU创新架构,解决了DPU设计碎片化的问题,且具有软件定义可配置、低设计成本、计算高效的优势,目前已迭代三代,第四代DPU也即将上市。
在软件生态方面,中科驭数自研的DPU软件开发平台HADOS,可兼容多种操作系统,大幅降低应用软件开发难度。目前,中科驭数全面拥抱国产化生态,已与国内6大CPU芯片、12家主流操作系统、9家主流数据库厂商、8家头部云/云原生厂商、17家TOP级服务器厂商完成兼容性适配。并且参与了10大开源社区平台建设,共同推动技术发展。
值得一提的是,中科驭数还牵头并参与了30余项行业标准及团队标准的制定,成为DPU标准的重要推动者和参与者。
发展至今,中科驭数从芯片底层架构,到网络、存储、计算等上层应用系统已形成深厚的核心技术积累。面向未来,张宇总结道,DPU将带动算力基础设施计算体系结构的变化,在软硬件协同、架构层面快速迭代,中科驭数也将持续优化DPU的低时延、高吞吐,加强推进在低时延、云原生及智算中心等关键场景的落地,为国内算力基础设施增添新动能。