Day 0适配GLM-5.1|壁仞科技率先完成智谱新一代旗舰模型适配

来源:壁仞科技Birentech #智谱# #GLM51# #壁仞科技#
958

4月8日,智谱正式上线并开源新一代旗舰模型GLM-5.1。作为目前全球最强的开源模型,GLM-5.1在长程任务(Long Horizon Task)处理能力上实现了显著突破。壁仞科技(06082.HK)壁砺™166系列产品在模型发布当日率先完成适配,成为国内首批适配GLM-5.1的国产GPU厂商之一。

GLM-5.1基于BR166芯片完成推理任务

针对GLM-5.1的744B MoE架构、200K长上下文、DSA稀疏注意力等核心特性,壁仞科技开展全栈深度优化;依托自研芯片的高算力优势与BIRENSUPA™软件栈的算子级深度协同能力,基于vLLM、SGLang两大主流开源框架,精准适配40B激活参数与Interleave Thinking交叉推理模式,实现200K上下文无损推理。同时,通过MoE调度、稀疏计算、Tensor Parallel、Context Parallel、MTP等多重优化技术,实现低时延、高吞吐的高效推理。

壁砺™166系列为数据中心大算力训推一体芯片,可满足万亿参数模型需求,广泛应用于大语言模型、多模态AIGC、图像与语音处理等领域。凭借卓越的技术成熟度与出色的开箱即用特性,壁砺™166系列产品可显著降低开发者的模型部署与应用门槛,以全栈化能力助力国产SOTA(目前最佳)大模型规模化落地,推动AI应用普惠向实。

关于GLM-5.1的官方介绍

相比于GLM-5,GLM-5.1的整体能力得到了全面提升,并在长程任务(Long Horizon Task)处理能力上实现了显著突破。有别于当前以分钟级交互为主的模型,GLM-5.1能够在单次任务中持续、自主地工作长达8小时,凭借自主规划、执行与迭代进化,最终交付完整的工程级成果。

一、综合性能SOTA

GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。下图是业内最具代表性的三个代码评测基准的平均结果,包括衡量模型专业级软件开发工作的SWE-Bench Pro、像工程师一样操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo。三项综合平均分,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一的成绩。

在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。

二、你睡觉的8小时,是模型上班的8小时

过去两年,行业用Benchmark衡量模型有多智能。GLM团队认为,下一阶段的衡量标准应该是“能工作多久”,即模型在长程任务(Long-Horizon Task)中的表现。在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

国产算力的快速适配能力,是大模型落地的核心支撑,也是国产AI产业崛起的核心引擎。目前,壁仞科技已具备与全球前沿算法协同进化的能力,并成为业内极少数全面适配SOTA大模型的国产算力厂商之一。壁仞科技将持续深化与国产大模型厂商合作,让开发者与客户在第一时间拥抱全球最前沿模型能力,推动国产大模型从“技术领先”迈向“应用领先”,共建开放繁荣、自主可控的人工智能产业生态。

责编: 爱集微
来源:壁仞科技Birentech #智谱# #GLM51# #壁仞科技#
THE END
关闭
加载

PDF 加载中...