• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
集微视频
登录登录
bg_img
search_logo
大家都在搜

凭借三大核心技术,壁仞科技完成Qwen3旗舰模型训练适配与优化

作者: 爱集微 05-15 11:59
相关舆情 AI解读 生成海报
来源:壁仞科技 #Qwen3# #壁仞科技#
7333

近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,壁仞科技已实现Qwen3系列模型在国产GPU平台的高效全栈式训练与推理支持。

4月29日,阿里巴巴通义千问正式发布并开源8款新版Qwen3系列“混合推理模型”。从官方披露的数据来看,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1等顶级模型相比,表现出极具竞争力的结果。

壁仞科技在Qwen3发布后数小时内完成了全系列模型的推理支持。受益于前期适配DeepSeek-V3满血版训练的关键技术和成功经验,壁仞科技进一步升级快速实现Qwen3-235B-A22B旗舰版最大参数量模型的训练适配与优化支持。基于壁仞科技自研Megatron-LM-BR训练插件,用户可实现大模型零代码修改下无缝运行,开箱即用。

值得关注的是,Megatron-LM-BR融合了壁仞科技自主知识产权的三大核心技术:虚拟层+动态重排、Async Offload、多维算子融合,实现了适配通用性与训练性能的双重保障。

业界首创"虚拟层+动态重排"技术,显著降低流水线气泡

阿里开源的Pai-Megatron-Patch发布了Qwen3 MoE 模型的最佳实践,但Qwen3-235B-A22B模型包含94个Transformer Layer,其默认的策略如PP8无法均衡切分Layer导致无法使用Interleave with Virtual Pipeline高效流水线机制,因此造成流水线等待问题。壁仞科技基于Megatron-LM-BR自主研发了"虚拟层+动态重排"技术:通过插入两个虚拟层将总层数扩展至96层,实现均匀切分以支持Interleave with Virtual Pipeline机制;同时对部分Layer进行动态重排,使流水线计算通信负载均衡,从而显著降低流水线气泡率。

业界首创Async Offload技术,实现精度无损极速预训练

为发挥算力优势和提升显存效率,壁仞科技自主研发Async Offload(异步卸载)机制:将大量激活张量和优化器状态异步迁移至CPU内存,仅使用64张GPU卡即可支持Qwen3-235B-A22B精度无损的全参模型高效预训练;而业界其他已发布案例至少需要256卡,另外其他方案如FP8可以降低显存消耗,但容易对精度产生影响。壁仞科技同时还支持智能重计算策略,动态识别显存瓶颈层,实现"算力换空间"智能决策。通过Async Offload和重计算显存优化双擎技术,壁仞科技实现了算力开销和显存节约的最佳均衡。

融合算子多维加速体系,充分释放算力潜能

针对GroupedMLP、Permutation、Unpermutation等关键耗时算子,壁仞科技基于其GPU架构特点实现了泛化的图算/通算融合优化。支持多计算操作极致的片上融合、张量处理器与矢量处理器极致异步融合、多级缓存的流水融合、以及计算与通信融合,并进一步引入自动化的Kernel Selection技术,基于硬件计算/通信/访存建模的Cost Model针对不同工作负载自适应选择最优内核实现,将芯片综合能效发挥到极致,同时也确保了通用的泛化能力。在保持精度无损的同时,达成计算效率、硬件利用率与内存带宽的多维度协同优化。

责编: 爱集微
来源:壁仞科技 #Qwen3# #壁仞科技#
分享至:
THE END
相关推荐
  • 壁仞科技“传输数据的方法、系统、计算装置、介质和程序产品”专利获授权

  • 即刻适配!壁仞科技完成Qwen3全系列模型支持

  • 摩尔线程GPU率先支持Qwen3全系列模型

  • Qwen3发布当天,寒武纪已完成全系列支持

  • 壁仞科技与科华数据达成战略合作,共启发展新篇章

  • GPU厂商壁仞再融资,获上海国投母基金领投

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
爱集微

微信:

邮箱:laoyaoba@gmail.com


11w文章总数
12012.5w总浏览量
最近发布
  • 【回应】H20受限后英伟达将向中国推出哪款芯片?黄仁勋最新回应;自动紧急制动系统新国标意见稿发布,拟于2028年1月1日实施

    11小时前

  • 【挑战】英特尔押注18A制程 能否挑战台积电晶圆代工霸主地位?苹果服务部门面临双重压力:法律竞争下盈利前景堪忧

    11小时前

  • 【强劲】台积电先进制程产能利用率持续强劲,2nm或在量产后第四个季度满载;传Sanmina Corp.正洽谈收购AMD旗下工厂

    11小时前

  • 【违规】因业绩信披违规,众泰汽车收警示函;华阳变速:公司为比亚迪供应乘用车零部件产品

    11小时前

  • 重庆氮化镓明星企业陷破产危机!镇江振芯进入破产清算程序;黄仁勋密会台积电、鸿海等30家供应链高层;苹果供应链转移遇阻

    11小时前

最新资讯
  • 欧洲投资银行发起“科技欧盟”项目,以增强AI、半导体竞争力

    2小时前

  • 设备+材料双轮驱动:万业企业如何卡位国产替代“深水区”

    3小时前

  • 华润微电子:润新微电子外延生产基地建成

    4小时前

  • 韩产业部长会面美贸易代表,下周启动具体磋商

    4小时前

  • 黄仁勋就中国市场表态,H20芯片后不会再推出Hopper系列产品

    7小时前

  • 天津市促进人工智能创新发展行动方案印发,支持CPU、GPU等核心芯片研发与迭代

    7小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号