沐曦、壁仞领衔上市潮,国产GPU“适配革命”悄然推进

来源:爱集微 #商汤科技# #国产芯片#
3w

近期,国内A股与港股掀起一轮GPU头部企业上市的高潮。25年12月摩尔线程、沐曦股份先后在科创板挂牌,聚焦自主可控;到了2026年,壁仞科技打响了IPO 开门红,后续还将有更多GPU及算力芯片企业冲刺IPO。这些企业的成功上市募资,可进一步加码研发,加速推动国产 GPU 替代,为 AI 产业链自主可控筑牢 “算力底座”。

但一个不容忽视的挑战是,国产芯片的发展必须与大模型进行深度适配,方能充分释放硬件性能,解决生态协同机制薄弱等问题。商汤科技作为AI行业龙头企业,近年来积极拥抱国产化硬件生态,与国产算力芯片企业均建立了长期、稳定的战略合作伙伴关系。2025年7月商汤科技联合国产生态伙伴发布“商汤大装置算力Mall”,上述企业均积极参与,通过与商汤SenseCore大装置等的全面适配,形成“技术互补、资源共享、场景互哺”的合作生态。在推进国产化适配,破解国产芯片“可用难用”困境、构建自主可控的AI产业生态中,商汤科技始终走在前列。

双向奔赴:大模型与国产芯片的适配之道

算力芯片的国产化是当前社会广泛关注的重大热点议题。近年来,华为昇腾、寒武纪、壁仞、沐曦、摩尔线程等企业陆续推出AI芯片产品,在核心算力参数上已经逐步追平国际同类产品,具备了支撑千亿参数级大模型训练与推理的硬件基础。但不容忽视的问题是,适配不足仍然制约着实际性能的发挥。AI大模型无论训练还是推理,对芯片算力的稳定性、高效性、兼容性都有着极高要求,国产芯片唯有与大模型实现深度适配,才能充分释放硬件算力潜能。

另一方面,大模型的规模化落地与商业化突破,同样离不开适配优化后的国产算力支撑,稳定可靠的本土算力底座是大模型跨越技术试验期、走向千行百业的核心保障。这种 “芯片赋能模型落地,模型反哺芯片优化”的双向依存,正是大模型与国产芯片“双向奔赴”的核心逻辑,也是AI产业国产化的必由之路。

传统上,与大模型适配更多是由芯片公司来承担完成。然而商汤科技的实践却改变了这一行业逻辑。其通过一系列主动作为,实现对国产AI芯片的多维度适配覆盖,已完成头部主流国产芯片的全面适配,覆盖从训练到推理、从轻量部署到高性能计算的全场景需求,极大推进了国产硬件生态的发展进程。

标杆引领:联动国产AI芯片核心企业

商汤与壁仞科技的合作体现了“算力供给-算法需求”的核心匹配逻辑。双方通过基于对商汤SenseCore大装置的全面适配,以国产替代战略为共同导向,最终形成了一个“技术互补、资源共享、场景互哺”的合作生态,实现了资源的有效整合与共享。

与寒武纪的合作中,则充分体现了商汤科技全栈技术能力对支撑算力芯片适配的优势。为充分释放国产算力潜力,商汤科技在Seko系列模型与LightX2V框架设计之初,便引入了低比特量化、压缩通信、稀疏注意力等硬件友好创新机制,从而将推理性能提升3倍以上,可以有力支撑国产算力芯片,从底层创新到场景落地,提升效率与稳定性,降低企业使用门槛。

商汤与沐曦的合作表明,商汤与国产算力芯片企业不仅停留在产品采购与技术支持的层面。在产品技术层面,双方可以形成底层技术的开放共建共享。商业化落地方面,可以通过技术深度适配,确保国产芯片在商汤大装置中高效运行。生态层面,基于“商汤大装置算力Mall”这一生态联盟平台,还可以实现资源的有效整合与共享。

商汤科技与摩尔线程在长期协同形成的“双向赋能”也具有标志性的意义。商汤科技与摩尔线程多年来保持长期业务合作。摩尔线程的MTT S系列GPU完成与商汤大装置SenseCore的全面适配,实现了对商汤日日新多模态大模型体系的支持。在真实的业务压力下,商汤不仅帮助摩尔线程验证性能、打磨产品,完成产品从“可用”到“好用”的淬炼;同时商汤科技也借助芯片企业的渠道资源触达更多潜在客户,形成“生态扩容—客户增长—业绩提升”的良性循环。

通过与商汤合作,国产AI芯片已经实现在千亿参数级大模型的训练与推理任务中,接受工业级标准的严苛考验,通过了真实业务场景的规模化验证,未来还将经历万亿乃至更高参数级大模型的淬炼。

直面痛点:破解行业适配协同难题

值得注意的是,大模型与国产芯片的适配绝非简单的技术对接,而是涵盖硬件架构优化、软件栈兼容、算法调优、场景验证的全流程协同,其中需要面临多重行业性难题。这一方面是因为国产芯片厂商众多,架构设计差异显著,导致异构算力集群的调度逻辑复杂,不同芯片难以实现高效协同;另一方面,软硬件生态尚不完善,适配标准缺乏统一规范,上下游技术衔接存在断层,增加了适配的技术难度与沟通成本;同时,跨域训练中稳定性不足、资源利用率偏低等问题,进一步制约了国产算力的规模化应用。这些挑战相互交织,成为阻碍AI产业国产化进程的重大挑战。

面对这些行业痛点,商汤科技日前率先发布基于DeepLink的异构混合调度方案,为解决国产算力适配、架构设计差异化等问题提供了核心技术支撑。DeepLink是由上海人工智能实验室推出的人工智能开放计算体系,其目标是搭建在硬件芯片与深度学习软件框架之间进行适配的桥梁。商汤大装置与上海人工智能实验室长期协作,发布的基于DeepLink的异构混合调度方案,可实现多种国产芯片之间的协同通信与统一调度,并自动进行并行策略优化和负载均衡,真正做到“不同芯片,同一平台”的协同工作,释放异构集群的计算潜力;同时显著提升了异构调度与弹性算力能力,以秒级弹性伸缩、分钟级故障恢复等,保障大模型训练过程稳定、高效、可控。此外,该方案还可以兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,适配稠密模型与MoE架构,支持训练与推理的高效执行。

在技术方案之外,商汤科技以“商汤大装置算力Mall”为核心载体,推进多方协同生态破局。打一个比方,“商汤大装置算力Mall”就像一个“面向未来的算力超级市场”。商汤科技联动华为昇腾、壁仞、沐曦、寒武纪、摩尔线程等硬件厂商,麒麟软件等软件伙伴及众多行业用户,可以让开发者和企业客户能够像选购商品一样,自由组合和调配多样化的算力资源、平台工具和行业模型服务。在算力层面,提供高效、稳定、自主可控且具有成本优势的异构计算基础设施,为各类应用场景提供算力保障。在语料层面,与库帕思等伙伴合作提供的高质量数据集、数据清洗、标注及合规安全管理服务,提升模型训练的数据源质量。在算法方面,客户可直接基于商汤“日日新”多模态大模型等,快速完成模型微调和二次开发。

与此同时,商汤科技还依托自身丰富的应用场景优势,为芯片厂商提供精准的性能反馈,持续打磨适配效果。以商汤科技“日日新”多模态大模型为例,多模态是大模型未来发展的趋势,也是国产AI芯片的重要应用场景。商汤科技在视频生成等多模态领域积累了大量真实业务场景,可以为芯片厂商提供更加精细化的优化方向。这种基于真实场景的协同攻关,让适配不再是 “纸上谈兵”,而是能够精准匹配业务需求,推动国产芯片与大模型的适配效果持续迭代升级。

写在最后

商汤科技之所以能在国产化芯片适配领域能够完成这么多的主动突破核心源于,在战略层面,商汤科技形成了“大装置—大模型—应用”三位一体战略,从根源上解决了适配的碎片化问题。在技术层面,商汤科技具备的全栈适配能力如基于DeepLink技术的异构协同可以对不同芯片企业给予有力支撑。在生态层面,已与华为昇腾、寒武纪、中科曙光、摩尔线程、沐曦、壁仞等主流国产芯片深度适配,具备多元协同整合能力。在场景层面,拥有AIGC、具身智能、产业智能化等领域积累大量真实场景,可为适配提供验证环境。这些优势让商汤科技可以构建起全流程协同整合能力。

可以预期,未来商汤科技还将拓展与更多国产芯片企业的合作,覆盖更多细分场景与芯片类型,面向更大规模的集群部署,拓展更大范围生态辐射,为破解国产芯片“可用难用”困境、构建自主可控的AI产业生态提供关键支撑。

责编: 爱集微
来源:爱集微 #商汤科技# #国产芯片#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...