• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

DeepSeek发布Prover-V2模型 参数量达6710亿

作者: 张轶群 04-30 20:06
相关舆情 AI解读 生成海报
来源:爱集微 #DeepSeek# #Prover# #671B#
1.2w

今日,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

责编: 陈兴华
来源:爱集微 #DeepSeek# #Prover# #671B#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • Kimi和DeepSeek又又又撞车?

  • 宝马:将把DeepSeek AI整合到中国市场新车型中

  • 工信部:1-2月5G手机出货量4161.9万部,国产品牌占比85%

  • 美国突祭禁令!英伟达未预警客户 中国H20订单恐全数泡汤

  • 我们为什么仍然需要十万卡集群?——管窥“后DeepSeek时代”算力芯片市场的变与不变

  • DeepSeek联合清华大学发表论文 旨在提高AI模型效率

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
张轶群

微信:zyqjordan23

邮箱:zhangyq@ijiwei.com

集微网记者,关注IC产业,深度报道、企业报道


1806文章总数
536.6w总浏览量
最近发布
  • “技术+专利”双轮驱动:中兴通讯打造知识产权战略新范式

    06-13 10:29

  • AMD Instinct MI350系列GPU发布 行业最强AI性能 明年MI400更劲爆!

    06-13 08:53

  • 爱簿智能推出E300 AI计算模组:自研AI SoC芯片AB100 50TOPS国产算力

    06-11 20:48

  • 国科微:拟购买中芯宁波94.366%股权 股票复牌

    06-05 22:54

  • 前4个月国家高新区规上工业企业营业收入同比增长7.3%

    06-05 22:16

最新资讯
  • 市场压力下,三星晶圆代工部门高级技术高管流失加剧

    4分钟前

  • AMD与AI创企合作,加速芯片和软件设计创新

    14分钟前

  • 谷歌320亿美元收购Wiz交易面临美国反垄断审查

    22分钟前

  • 华海清科“金属膜厚在线测量补偿方法、膜厚传感器和设备”专利获授权

    36分钟前

  • 诺思“一种空气隙型压电体声波器件异质集成方法和该器件”专利获授权

    36分钟前

  • 新程汽车产业链项目落地合肥高新区,总投资5.5亿元

    8小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号