近日,台积电共封装光学(CPO)传出消息,应英伟达、博通两大客户要求,相关技术开发正在加速推进,预计下半年有望实现小批量产,2026年开始放量。除此之外,英伟达、博通、Marvell等也都释放出有关CPO的进展消息,使得业界有关光模块对铜互联替代的讨论再次热了起来。
大厂力推CPO步伐加速
人工智能迭代加速,使得具备更高带宽潜力的光互联技术受到业界广泛关注。日前台积电再传消息,成功实现了CPO与先进半导体封装技术的集成。其与博通合作,在3nm工艺上调试成功CPO关键技术——微环调制器(MRM),有望在2025年下半年量产1.6Tbps光电器件。
此外,英伟达对光互联技术的态度也受到业界关注。有消息称,英伟达计划于2025年3月在其GTC大会上推出支持115.2Tbps信号传输的CPO交换机新品。该交换机将搭载36个光引擎。英伟达还计划在2026年量产的Rubin服务器机架系统中首度应用CPO技术。
Marvell也于日前宣布在整合CPO技术的定制AI加速器上取得突破,从目前使用铜互连的单个机架内的数十个XPU,拓展到横跨多个机架的数百个XPU,实现了更高的宽带密度,同时具有最佳延迟和功率效率。
AI需求为光互联提供需求基础
共封装光学(CPO)技术是一种新兴的光电子集成技术,旨在将光学元件(如光模块)与电子芯片(如交换芯片或ASIC芯片)集成在同一封装体内,通过缩短交换芯片与光引擎之间的距离,可以实现更高效的光通信和更高的光电集成密度。
目前,CPO技术在数据中心、高性能计算(HPC)、通信系统、传感器网络和生物医学等多个领域都展现出广泛的应用前景,特别是随着人工智能迭代加速,业内普遍认为,CPO器件可能是在4-8机架系统中,提供数万个器件高速互连的唯一选择。阿里云无影事业部总裁张献涛在接受记者采访时表示,光模块在大模型发展起来之后备受关注。
北京大学电子学院研究员、博士生导师常林也表示,在过去大约10年间,受互联网大数据、高性能计算驱动,数据中心光模块的传输带宽基本保持了每两年翻一番的更新速度,特别是大模型热潮的爆发,对数据中心的传输带宽速度提出更高的要求。这使数据中心光模块成为硅光技术最主要的一个应用场景。
目前国内大多数的数据中心使用的是400G速率的可插拔光模块解决方案,而向800G甚至更高的速率升级,意味着更高昂的软/硬件成本和后期运维成本。这使采用光模块取代铜互联具有了一定的现实基础。
按照目前流行的说法,2025年或者2026年,即从1.6T速率开始,传统可插拔光模块的速率升级将有可能达到极限。咨询机构LightCounting也预测,CPO出货量预计将从800G和1.6T端口开始,2025年开始商用,2026至2027年开始规模上量。
光铜之辩仍将长期持续
不过,CPO技术目前仍然需要解决电光互连的可靠性和稳定性等问题,硅穿孔(TSV)、凸点(Bumping)和重布线(RDL)等都对工艺水平提出更高要求。此外,该技术的成本也需进一步优化,包括光模块大规模部署的成本问题、兼容性和互操作性,以及功耗和散热等。采访中,有业内人士指出,目前铜缆技术的传输速度也在提高,慢慢地也能等同于400G、 800G插拔光模块的速率。价格上更是优于同等速率光模块。
因此,总体而言,在短期内主流厂商的态度仍然是以铜互联为主,但是长期看好光互联的发展潜力。博通在其最新的Tomahawk 5 Bailly交换机中采用了共封装光学(CPO)技术,解决了传统铜缆在信号传输距离上的限制,同时极大地减少了功耗。但是,博通在设计数据中心内部机架级别的交换解决方案时,仍倾向于优先采用铜缆连接技术。目前,博通的技术已能在一定范围内实现最高4米的有效铜缆连接,从而在机架内部设备间实现高效、低成本的数据传输。但对超出铜缆连接距离范围的长距离传输需求或跨机架数据交换情况,博通则依赖光连接技术。
在2024年的GTC大会上,英伟达推出GB200超级芯片,该芯片就大量采用“铜连接”设计。GB200 NVL72服务器内部使用的电缆长度累计接近2英里,共有5000条独立铜缆。但英伟达表示,在跨机柜集群场景中,仍然需要大宽带的光连接和更高速率的光模块来支持。特别是在跨机柜集群场景中,对6T光模块的需求将大幅增加。英伟达的策略是尽可能多地部署DAC(直接电缆或直连铜缆)高速铜缆,同时在需要长距离传输的场景中采用光模块。
TrendForce在《Co-Packaged Optics技术在数据中心的发展路径与技术解析》报告中提到,CPO初期渗透方向可能集中于中长距的Frontend网络传输场景,这是因为中长距已普遍使用光通讯,具备较高替代性。从光收发模块全面过渡CPO仍需1~2年时间,初期CPO交换器成本显著高于光收发模块,需随学习曲线的成熟来降低成本,才能逐步进入市场。