• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

DeepSeek发布Prover-V2模型 参数量达6710亿

作者: 张轶群 04-30 20:06
相关舆情 AI解读 生成海报
来源:爱集微 #DeepSeek# #Prover# #671B#
1.1w

今日,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

责编: 陈兴华
来源:爱集微 #DeepSeek# #Prover# #671B#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • 宝马:将把DeepSeek AI整合到中国市场新车型中

  • 工信部:1-2月5G手机出货量4161.9万部,国产品牌占比85%

  • 美国突祭禁令!英伟达未预警客户 中国H20订单恐全数泡汤

  • 我们为什么仍然需要十万卡集群?——管窥“后DeepSeek时代”算力芯片市场的变与不变

  • DeepSeek联合清华大学发表论文 旨在提高AI模型效率

  • 李开复:DeepSeek让中美AI差距缩小至只剩三个月

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
张轶群

微信:zyqjordan23

邮箱:zhangyq@ijiwei.com

集微网记者,关注IC产业,深度报道、企业报道


1806文章总数
536.6w总浏览量
最近发布
  • 美企CEO信心指数创近50年来最大跌幅

    6小时前

  • 美国制造业活动连续第四月萎缩 进口指标降至16年最低

    6小时前

  • 绿通科技拟收购知名设备商大摩半导体

    7小时前

  • 李斌回应蔚来车主高速睡着:辅助驾驶不是自动驾驶

    7小时前

  • 美商务部长:即使关税政策被取消 美总统也有权采取其他行动

    10小时前

最新资讯
  • 美企CEO信心指数创近50年来最大跌幅

    6小时前

  • 美国制造业活动连续第四月萎缩 进口指标降至16年最低

    6小时前

  • 绿通科技拟收购知名设备商大摩半导体

    7小时前

  • 李斌回应蔚来车主高速睡着:辅助驾驶不是自动驾驶

    7小时前

  • “5G+量子”虚拟电厂调度车网互动 超6000辆次新能源汽车参与

    8小时前

  • 小米华为车圈口水战引热议:雷军修改微博,另一高管疑似回应

    8小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号