• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

科大讯飞:星火大模型单次训练成本和DeepSeek V3在一个层次

作者: 黄仁贵 02-14 10:35
相关舆情 AI解读 生成海报
来源:爱集微 #科大讯飞#
1.9w

近日,科大讯飞在接受机构调研时表示,训练成本是讯飞星火大模型的竞争优势,单次训练成本和DeepSeek V3在一个层次,而且后面优化路径也很明确,目前以昇腾910B为代表的国产硬件还不支持FP8精度训练以及DualPipe的实现,随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。

基于此前在评语模型、强化学习方面的积累,科大讯飞在2024年10月就实现了蒙特卡洛树搜索(MCTS)等算法创新并跑通了深度推理模型训练算法,因为只能使用国产算力,额外花费2个月完成华为昇腾910B算力的适配和优化并大幅提升训练效率(训练效率相比A100从55%提升到85%),于今年1月15日完成了星火深度推理模型X1的训练和发布。

虽然当前X1模型很小(仅130亿参数),但依靠科大讯飞算法和数据优势,星火X1已达到可以和OpenAI o1-preview对标的水平;科大讯飞表示,随着国产算力的逐步到位,模型参数增加后,公司完全有信心实现数学答题和过程思维链能力全面对标甚至超过OpenAI o1。

责编: 邓文标
来源:爱集微 #科大讯飞#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • 科大讯飞斥资7000万元在湖北成立两家人工智能公司

  • 科大讯飞2024年营收233.43亿元,净利润同比下降14.78%

  • 国产大模型:既需向上突破也要向下扎根

  • 刘庆峰:科大讯飞将做全栈自主可控的大模型国家队

  • 总投资4.5亿元,中颖电子第二总部基地正式启用

  • 讯飞医疗:AI技术领域持续突破 “一体两翼”框架迭代演进

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
黄仁贵

微信:ren378087210

邮箱:huangrg@ijiwei.com

邀您一起关注汽车电子,关注智驾未来!


6204文章总数
26.4w总浏览量
最近发布
  • SiC营收规模居中国公司第三,基本半导体冲击港交所IPO

    14小时前

  • 旷达科技:芯投微消费级滤波器和车规级滤波器订单持续增加中

    16小时前

  • 天准科技:基于地平线J6平台域控产品线已获多个POC开发项目机会

    16小时前

  • 上汽正式受让“尚界”商标,加速第五界上市进程

    16小时前

  • 一汽解放:公司已开始测试验证L4级厂区无人物流车

    17小时前

最新资讯
  • 荣耀400系列,用实力和诚意宠粉年轻人

    2小时前

  • 90天豁免期后,中国企业如何应对关税战?

    5小时前

  • 全球首个《人形机器人智能化分级》标准亮相,为行业商业化按下“加速键”

    6小时前

  • 印度施压监控设备商:海康、小米、摩托罗拉等须提交源码

    6小时前

  • 中国商务部宣讲稀土管制政策,或放松对欧芯片企业出口

    6小时前

  • 机构:2024年中国半导体设备支出达495.5亿美元

    6小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号