GTC 2025大会无新意?看英伟达如何策略调整

来源:爱集微 #英伟达# #黄仁勋# #GTC#
2711

当前的英伟达面临挑战。在刚刚过去不久的美股“黑色星期一”上,美股“七姐妹”(美国科技股七巨头)总市值单日缩水近7600亿美元(约合人民币5.5万亿元)。其中,英伟达跌幅超5%,从年初至今股价下跌超过20%,市值与高峰期相比缩水近万亿美元。DeepSeek议题的持续发酵,服务器厂商的不断开发并推出专有AI芯片,以及大客户如微软等需求的不确定性,均是英伟达不得不面对的重要挑战。即使是英伟达在AI芯片领域占据的有利位置,也需要不断进行策略调整,以适应变化的市场形势。

3月19日凌晨,英伟达CEO黄仁勋在GTC 2025上发表主题演讲,除发布新一代Blackwell Ultra架构GB300系列芯片外,还公布了四年三代GPU架构的技术路线图,此外还包括在人形机器人、自动驾驶、量子计算等方面的布局。可以看出英伟达希望通过推出高性能、低功耗的产品,保持其在通用AI芯片市场的优势,同时加大在芯片、网络等领域的全面布局,巩固了其在AI算力领域的领先地位。不过,资本市场似乎并没有买账,上述产品并未超出人们此前的预期,在其演讲期间,英伟达股价持续走低,最终收跌3.43%。

Blackwell Ultra(GB300)正式登场

毫无疑问,英伟达新一代 Blackwell Ultra 架构的GB300系列芯片是本届GTC的最大热点。其将配备8组12-Hi HBM3E内存,提供高达288GB的板载内存,性能相比上一代产品提升 50%。

系统方面,其拥有GB300 NVL72机架级和B300 NVL16系统两个版本。GB300 NVL72可连接72块Blackwell Ultra GPU和36块Grace CPU,采用机架式设计,密集FP4推理算力达到1.1EFLOPS,FP8训练算力达到0.36EFLOPS,是GB200 NVL72的1.5倍。而根据新闻稿,HGX B300 NVL16在大型语言模型推理方面的速度比Hopper快11倍,提供7倍的算力和4倍的内存,能够为AI推理等最复杂的工作负载带来突破性的性能提升。

英伟达合作伙伴预计将从2025年下半年起提供基于Blackwell Ultra的产品。针对市场进行展望时,黄仁勋表示,Blackwell芯片推出一年来,AI行业取得了巨大进展,AI功能越来越强大了。2024年全球前四大云服务提供商共采购130万片Hopper架构芯片。2025年,它们又购买了360万Blackwell芯片。黄仁勋预计,2028年,建设数据中心投入的资本支出将超过1万亿美元。

不过,英伟达的GB200和B200芯片从设计到出货的过程经历波折,初期就因芯片设计缺陷问题导致出货延迟,后又因CoWoS-L制程良率较低,初期仅有约60%,远低于CoWoS-S的90%以上水平,这进一步影响了产能。黄仁勋在去年12月确认,GB200已进入满载生产阶段,并计划在今年第一季度实现大规模出货。但用户会不会跳过GB200/B200,而转向下一代GB300?这是一个值得观察的要点。

发布“四年三代”技术路线图

在演讲中,黄仁勋还公布了Blackwell之后下一代GPU架构Rubin的路线规划,包括Vera Rubin 和Rubin Ultra两代产品。Vera Rubin由Rubin GPU和Vera CPU组成,Vera CPU拥有88个定制Arm核心、176个线程;Rubin GPU由两颗GPU裸Die拼接,拥有288GB HBM4内存,FP4峰值推理能力可达50PFLOPS。Rubin Ultra系统由Rubin Ultra GPU和Vera CPU组成,Rubin Ultra GPU将由4颗GPU裸Die拼接,拥有1TB HBM4e内存,FP4峰值推理能力可达100PFLOPS。

英伟达预计,Vera Rubin的平台将于2026年下半年开始出货,机架方案分别为Vera Rubin NVL144和Rubin Ultra NVL576。Vera Rubin NVLink 144的性能将是GB300 NVL 72的3.3倍。Rubin Ultra NVL576将于2027年下半年推出,能够进行15EF的FP4推理,5 EF的FP8训练,其性能约为GB300 NVL72的14倍。

黄仁勋还介绍了Rubin之后再下一代芯片架构——Feynman,根据路线图,Feynman架构将于2028年登场。

CPO网络交换机2026年将推出

数据交换是限制AI算力升级的关键指标。日前就有关于英伟达将在GTC 2025上推出CPO交换机新品的消息。英伟达也不负众望,本次推出了新的Spectrum-X硅光子以太网交换机,作为Spectrum-X光子以太网和Quantum-X光子InfiniBand平台一部分,包括128个800Gb/s端口或512个200Gb/s端口,总带宽可达到100Tb/s,以及512个800Gb/s或2048个200Gb/s端口,总吞吐量可达400Tb/s。

人工智能迭代加速,使得具备更高带宽潜力的光互联技术受到业界广泛关注。但是在实际应用过程中,如何进行成本优化,如何解决大规模部署中的兼容性和互操作性问题等,业界的讨论仍有很多。英伟达计划Spectrum-X光交换机将在2026年推出,届时能否掀起一轮光互联技术对传统铜缆的替代同样是一个观察点。

长期布局具身智能、量子计算

英伟达将机器人视作下一个数万亿美元产业,这些年来都在重点布局。GTC2025上,英伟达推出首个开放、可定制的通用人形推理和技能基础模型Isaac GR00T N1。英伟达还与谷歌DeepMind和迪士尼研究中心合作开发开源物理引擎Newton,用于机器人学习,预计今年晚些时候完成开发。

黄仁勋表示,通用机器人时代已经到来。借助英伟达Isaac GR00T N1 和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟AI时代的下一个前沿。

英伟达近年来也在长期布局量子计算。英伟达将于当地时间3月20日首次举办“量子日(Quantum Day)”活动。黄仁勋将与来自十多家量子计算行业领导企业的顶尖高管共聚一堂,进行小组讨论,讨论话题涵盖量子计算中现在可能和可用的技术、量子技术的发展方向等。

算力与能耗始终是AI大模型的发展瓶颈,量子计算被认为是解决经典AI系统日益增长的局限性,实现更快训练、更少能源消耗的解决方案。英伟达将展示其在量子计算领域的最新进展,包括量子计算模拟器和相关软件开发工具,进一步推动量子计算与AI的结合。

写在最后

人工智能的发展瞬息万变,这让英伟达亦不免需求面临诸多挑战。从GTC2025的一系列发布与举措来看,针对微软、谷歌等客户需求的不确定性,以及谷歌TPU、亚马逊Trainium等专有AI芯片的竞争,英伟达希望通过推出高性能、低功耗的产品,保持其在通用AI芯片市场的优势。同时加大在芯片、网络等领域的全面布局,巩固了其在AI算力领域的领导地位。并通过具身智能、量子计算等领域的布局,为未来的技术突破和市场扩展奠定基础,抢占未来市场的先机。

然而,英特尔近日宣布了委任半导体行业资深人士陈立武作为新一任的CEO人选,人工智能所带来的巨大市场机会是其所必须抓住的。AMD 董事长兼执行官苏姿丰亦于日前现身北京,其宣称AI将是未来几年非常重要的技术。而据最新报道,谷歌准备携手联发科开发下一代张量处理单元(TPU)。

2025年的AI芯片领域不仅没有止歇,反而变得越来越热闹。如何保持领先位置将是英伟达面临的主要挑战。

责编: 张轶群
来源:爱集微 #英伟达# #黄仁勋# #GTC#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...