• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

华科团队于国际设计自动化会议(DAC 2025)发表 存内科学计算架构研究成果

作者: 集小微 07-08 19:38
相关舆情 AI解读 生成海报
来源:HUST集成电路学院 #DAC# #存算一体# #华科#
1.7w

DAC (Design Automation Conference),全称国际设计自动化会议, 由美国计算机协会(ACM)和电气与电子工程师协会(IEEE)联合主办,始于1964年,拥有超过60年的历史,是全球芯片设计与自动化领域规模宏大、影响深远、历史悠久的顶级会议之一。

华中电子科技大学集成电路学院缪向水、李祎教授团队在近日于美国旧金山召开的第62届DAC会议上报告了基于阻变存储器的存算一体技术最新研究成果“ReSMiPS: A ReRAM-based Sparse Mixed-precision Solver with Fast Reordering Algorithm”。该工作为稀疏矩阵方程求解这一重要基础问题,提供了一种高能效、高精度的存算一体求解架构。我院2023级博士生付雨阳,2019级博士生李健聪(已毕业,现于香港科技大学从事博士后研究)为论文共同第一作者,李祎教授和香港智能晶片与系统研发中心陈佳博士为论文共同通讯作者。华中科技大学是论文第一完成单位。

稀疏矩阵方程(Ax=b)求解是科学计算、具身智能等领域的基础数学问题。基于CPU和GPU的传统数字求解器在执行大规模稀疏矩阵方程求解时,由于“存-算”分离的冯·诺依曼计算架构,面临着严重的访存瓶颈,难以满足高效求解需求。尽管基于阻变存储器(ReRAM)的存算一体技术为高效的矩阵计算提供了一种潜在硬件架构,但是,一方面存储器的交叉阵列结构仅适配稠密矩阵计算,在部署稀疏矩阵时,大量0元素不可避免的会导致算力的浪费。另一方面,存算一体架构通常受制于模拟计算机制,难以满足稀疏矩阵方程的双浮点精度(FP64)求解需求。

针对上述问题,研究团队构建了一套基于ReRAM的混合精度异构存算一体求解架构ReSMiPS,以实现稀疏矩阵方程的高效、高精度求解,取得了以下进展:

在矩阵部署层面,针对稀疏矩阵在ReRAM阵列上的高效部署难题,提出了一种快速稀疏矩阵排序算法(Fast Sparse Matrix Reordering Algorithm,FSMR)。FSMR算法通过对称化变换矩阵并兼顾带宽压缩特性,相较Cuthill-Mckee等现有重排算法,可以实现非零元素的高效聚簇,显著提升阵列利用率,突破稀疏矩阵乘法在阵列中的计算并行度限制(图1(a))。

在数据映射层面,针对FP64精度数据在ReRAM阵列中的存储和计算开销限制,提出了一种IF64数据映射格式,该数据格式兼顾了IEEE-754标准FP64格式的数据动态范围,同时通过约束尾数位宽,降低了硬件资源开销,结合所设计的浮点存算一体单元,可显著加速浮点稀疏矩阵计算(图1(b))。

图1. (a)FSMR算法效果示意;

(b)基于ReRAM的浮点稀疏矩阵乘法架构

在架构层面,提出了结合IF64的ReRAM浮点矩阵乘法单元与FP64精度的数字处理单元的混合精度求解架构。通过ReRAM浮点计算单元加速近似求解,FP64数字单元实现误差修正的方式,在实现与CPU/GPU相当的数值求解精度的同时,降低大规模稀疏矩阵的迭代求解延时,提升求解能效(图2)。

使用SuiteSparse稀疏矩阵数据集的评估结果显示,ReSMiPS实现10-15的高精度求解时,计算速度相对 NIVIDA RTX 4070 Ti GPU提升约600倍,能耗降低至1/2100,且得益于FSMR算法对大规模稀疏矩阵条件数的约束,ReSMiPS在负载矩阵条件数达1018的恶劣收敛条件下,仍能实现稳定条件。该研究成果不仅突破了ReRAM存算一体技术在高精度稀疏矩阵方程求解中的应用瓶颈,也为未来芯片设计自动化、数字孪生等重要应用场景提供了可行的硬件加速方案。

图2. 基于ReSMiPS系统的稀疏矩阵方程求解框架

本论文研究工作得到了国家科技创新2030重大研究计划(No. 2021ZD0201201)、国家重点研发计划(No. 2022YFB450010),湖北省杰出青年基金、华中科技大学基础研究支持计划等项目的资助,以及华中科技大学国家集成电路产教融合创新平台的支持。


责编: 集小微
来源:HUST集成电路学院 #DAC# #存算一体# #华科#
分享至:
THE END
相关推荐
  • 中国科学院微电子所在RRAM存算一体芯片研究方面取得进展

  • 自主创新再添利器,国产存算一体芯片实现端边 AI 普惠

  • 我国团队国际首创存算一体排序架构,攻克智能硬件加速难题

  • 晶存科技与妙存科技分获2025世界半导体大会双项荣誉

  • 专访得一微董事长吴大畏:当存力芯片长出“AI大脑”

  • 北京大学第四期芯观点•青年学术沙龙成功举办

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
集小微

微信:

邮箱:


5373文章总数
9742.5w总浏览量
最近发布
  • 地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

    1小时前

  • 鹏鼎控股拟投资80亿元扩产 深化AI全产业链布局

    16小时前

  • 莱特光电上半年净利润1.26亿元,同比增长36.74%

    16小时前

  • 天承科技上半年净利润3673.36万元 同比增长0.2%

    17小时前

  • 芯碁微装直写光刻设备批量导入国内多家封测龙头

    17小时前

最新资讯
  • 9月深圳,30万㎡ 超大规模展会,与“集成电路+光电子”企业面对面

    15分钟前

  • 英伟达计划自研HBM内存Base Die,2027下半年试产以补短板

    21分钟前

  • “政治抢劫”,特朗普政府拟入股四大芯片巨头

    23分钟前

  • 深蓝汽车与斯达半导体合资工厂正式投产下线

    33分钟前

  • 兴福电子上半年营收净利双增长,湿电子化学品龙头地位持续巩固。

    59分钟前

  • 地平线具身智能算法H-RDT斩获CVPR 2025 RoboTwin真机赛冠军

    1小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号