• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

DeepSeek发布Prover-V2模型 参数量达6710亿

作者: 张轶群 04-30 20:06
相关舆情 AI解读 生成海报
来源:爱集微 #DeepSeek# #Prover# #671B#
1.7w

今日,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

责编: 陈兴华
来源:爱集微 #DeepSeek# #Prover# #671B#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • DeepSeek揭示中国下一代AI芯片! 「这些」公司可能成为供应商

  • 特斯拉携手DeepSeek、字节跳动,在华推AI语音助理

  • 摩尔线程:目前已原生支持FP8,并支持DeepSeek相应功能

  • DeepSeek因AI芯片问题推迟R2发布

  • 英媒:印度为何培养不出英伟达、DeepSeek?

  • DeepSeek母公司幻方量化员工被抓,6年非法套取上亿元佣金

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
张轶群

微信:zyqjordan23

邮箱:zhangyq@ijiwei.com

集微网记者,关注IC产业,深度报道、企业报道


1847文章总数
536.6w总浏览量
最近发布
  • 传祺向往S9预售 25.99万起搭载乾崑智驾ADS 4

    2小时前

  • AI定义汽车时代,如何为车企差异化创新筑基?

    08-25 17:32

  • “你好BOE”五周年庆典,找到一个“好屏友”

    08-24 11:55

  • Haivivi完成2亿元A轮融资 红杉等多家一线资本参投

    08-25 11:33

  • 摩尔线程:目前已原生支持FP8,并支持DeepSeek相应功能

    08-23 18:12

最新资讯
  • 突然确认!小米澎湃OS 3将于明日发布

    53分钟前

  • 美国财长贝森特称不会入股英伟达,台积电主宰产业对美构成风险

    59分钟前

  • 三名员工离职同时,Meta GenAI产品总监加入OpenAI

    1小时前

  • 地平线余凯:未来五至十年全行业最终会走向全场景无人驾驶

    1小时前

  • 传祺向往S9预售 25.99万起搭载乾崑智驾ADS 4

    2小时前

  • 业绩翻数倍增长!产品量价齐升让地平线坐稳智驾市场“一哥”

    2小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号