在英伟达股价因受DeepSeek影响而经历了一轮过山车般的起伏后,黄仁勋终于站了出来。
2月21日,一段黄仁勋的受访视频出现在其合作伙伴DataDirect Networksg公司举办的线上活动。在访谈中,他首次公开回应了DeepSeek是否利好英伟达的相关话题。
图为英伟达CEO黄仁勋访谈画面
“R1让实际情况恰恰相反”
“DeepSeep-R1作为全球首个开源的推理模型,令人十分兴奋。R1模型的开源,让全球的热情也变得非常高涨。”黄仁勋表示。
他首先否定了一个既有认知:从投资者的角度来看,有这样一种思维定式:AI世界就是先做预训练,然后就是推理。而“推理”就是给AI提出一个问题,它立刻给出答案。
“虽然不知道这种思维源自哪里,但它显然是错误的。”黄仁勋强调。
为此,黄仁勋给出了详细的解释:正确的模式是先进行预训练,让模型对信息有一个基础的理解,预训练后要持续保持严谨。第二个阶段是最为重要的后训练(post training),也就是模型学会解决问题的过程。在这一阶段,模型已经有了基础的信息,而后运用这些基础知识去解决实际问题。后训练阶段与一系列不同的学习范式相关。在这些范式的推动下,AI技术在过去五年发展得非常迅猛,计算需求也因而变得极为密集。“大家会觉得预训练要少得多,但是他们忘记了预训练之后的第二部分——后训练其实(计算需求量)是相当大的。”他表示。
黄仁勋提到了第三条缩放定律(scaling law)。推理越多,回答问题前思考得就越多,推理效果就会越好,这是一个计算量相当大的过程。
“所以市场对DeepSeek R1问世的反应是‘天呐,AI到头了!’,就好像有了它,我们便不再需要进行任何计算了,但实际情况恰恰相反。”黄仁勋表示。
市场是否“买单”?
2025年1月,DeepSeek推出低算力成本的开源大语言模型R1,以仅560万美元的训练成本实现了与OpenAIo1等闭源模型相当的性能。这一成果挑战了传统AI训练依赖高算力芯片堆料的商业模式。
受此影响,英伟达市值曾一度下跌,尤其在1月27日跌去近17%,一夜蒸发近6000亿美元,创美股单日市值蒸发纪录。当时,投资者们担忧AI行业对英伟达芯片的需求可能大幅减少,导致市场对算力泡沫的恐慌。
事实上,英伟达官方在股价暴跌后迅速发声,指出DeepSeek的成功恰恰证明了其芯片的实用性,并强调“推理阶段需要大量英伟达GPU和高性能网络”,未来市场需求将随着AI应用扩展而增长。但当时的发声并未对其股价回升起到实际效果。
随后市场逐渐认识到,DeepSeek的创新可能推动更多中小型企业进入AI领域,反而刺激对GPU等算力芯片的增量需求。英伟达股价在接下来近一个月里震荡回升,目前已逐渐“收复失地”。
值得关注的是,此次黄仁勋的发声在英伟达财报公布之前,2月26日美股盘后,英伟达将公布四季度财报。虽然此次黄仁勋正面表达了对于DeepSeek问世将利好英伟达未来的信心,但市场的真正反映将有赖于其财报给出的关键数据。