• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2025第九届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

中山大学新型光学神经网络芯片,使快速训练成为可能

作者: 集小微 2024-11-14
相关舆情 AI解读 生成海报
来源:中山大学电子与信息工程学院 #光学芯片# #AI算力# #中山大学#
1.6w

人工智能(AI)正以惊人的速度发展,其所消耗的计算资源每3~4个月翻一番,计算芯片的性能提升速度已难以跟上算力需求的增长速度。在此背景下,多种框架结构的张量核心应运而生,其中光学神经网络芯片可以填补传统微电子计算芯片在速度、延迟和能效等关键指标上的短板,被认为是提升AI算力的重要发展方向。

光学神经网络芯片主要用于执行占据人工神经网络90%算力的张量运算。光学神经网络芯片以光波作为载体进行计算,传输过程就是计算过程,其在计算速度和能效方面有着无可比拟的优势。光学神经网络芯片在计算过程中不会产生焦耳热,因此没有散热问题的困扰。光波的振幅、波长、偏振态和相位都可以携带信息进行计算,并且光路在交叉传输时互不干扰,相比于电子,光子更擅长于张量运算。近年,虽然光学神经网络芯片领域不断有新的技术被突破,但是由于光损耗、单元器件密度、波长通道数等因素的限制,人们对光学神经网络芯片能否高效地处理大型数据、以及能否在模型训练方面具有优势一直持怀疑态度。

针对以上问题,中山大学研究团队与不列颠哥伦比亚大学、女王大学、拉瓦尔大学、加拿大国家研究院、清华大学团队携手,基于铌酸锂薄膜光电集成技术,创新性地把光的波动性和电子的粒子性结合起来,在光学神经网络芯片领域取得了新的进展。他们提出了一种新的简洁的光学神经网络芯片框架结构——实现了一整层的神经网络,计算速度达到120 GOPS,同时输入和输出的数量能够被灵活地调整以应对多种人工智能任务。该光学神经网络芯片还支持快速原位训练,权重的刷新速度达到60 GHz。研究人员首次在光上实现了负数与负数的乘法,为聚类AI任务的训练提供了新的方案。另外,基于上述光学神经网络芯片,该工作还提出了首个端到端、纳秒级延迟、无需数字处理器辅助的超大型光学神经网络架构(见图1)。

相关结果以“120 GOPS Photonic tensor core in thin-film lithium niobate for inference and in situ training”为题在Nature Communications上发表。论文的第一作者为中山大学林忠劲副教授,通讯作者为中山大学蔡鑫伦教授和不列颠哥伦比亚大学Lukas Chrostowski教授。

图1 超大型光学神经网络架构概念图

工作原理与概念

如图2所示,与其他光学神经网络芯片复杂的结构不同,该工作提出的光学神经网络芯片只由1个激光器、2个铌酸锂薄膜电光调制器、1个平衡光探测器和1个光生载流子积分器构成。虽然结构如此简单,但却可以单独执行人工神经网络中的层与层之间的全连接计算。两个铌酸锂薄膜电光调制器分别负责把输入和权重转换为光信号,光依次穿过两个调制器后,输入和权重就完成了乘法操作并映射在光强上,然后利用积分器对不同时间的光强进行积分,就完成了加权总和操作。通过改变积分时间,可以随意改变输入的维度,因此所提的光学神经网络芯片可以执行超大维度输入的加权总和操作(见图2c)。

图2 所提的光学神经网络芯片工作原理与概念

a 所提的光学神经网络芯片的结构示意图;b 基于波分复用的光学神经网络芯片的结构示意图;c 不同类型光学神经网络芯片在工作原理、尺寸、计算速度和加权总和的输入维度方面的性能对比;TDM:时分复用。

光学神经网络芯片全集成

该工作突破了铌酸锂薄膜光芯片的光子引线键合封装工艺,实现了铌酸锂薄膜光芯片和激光器的混合集成(见图3)。激光器和铌酸锂薄膜光芯片之间通过聚合物三维光波导连接。由于光探测器不能直接在铌酸锂薄膜材料平台上制备,因此通过倒装焊的方式实现铌酸锂薄膜光芯片和光探测器之间的连接。

图3 所提的光学神经网络芯片全集成

a 光学神经网络芯片整体照片;b-d 分别为光学神经网络芯片的光探测器、调制区域、激光器部位的显微镜图;e 光学神经网络芯片的侧视图以供理解光探测器、激光器和铌酸锂薄膜光芯片之间位置关系。

识别AI任务执行

为了评估所提的光学神经网络芯片在执行监督型机器学习任务方面的性能,如图4a所示,该工作用光学神经网络芯片构建了多层感知神经网络,并对112×112像素的数字图像进行识别。图4b展示的是基于所提的光学神经网络芯片进行原位模型训练的工作流程:输入和权重从中心处理器传送到光学神经网络芯片,光学神经网络芯片完成加权总和运算并把结果传回中心处理器。图4c表明所提的光学神经网络芯片的精度足以完成原位模型训练任务。另外,在图像识别方面,光学神经网络芯片的性能可以媲美全中心处理器(见图4d和4e)。

图4 利用所提光学神经网络芯片执行图像识别任务

a 多层感知神经网络结构示意图;b 原位模型训练的工作流程‘c 光学神经网络芯片进行训练的迭代曲线’d 和 e 分别为全中心处理器和所提光学神经网络芯片进行图像识别的结果。

聚类AI任务执行

与图像识别任务不同,图像聚类任务是无监督机器学习任务,其训练的过程涉及到负数与负数之间的乘法运算,然而在之前的光计算方案中,这一操作无法完成。针对这一问题,该工作提出了首个能够执行负数与负数相乘的方案(见图5a)。图5b表明所提的光学神经网络芯片可以实现与全中心处理器的结果。图5c和5d展示的是利用所提的光学神经网络芯片实现的图像聚类结果。对于这个任务,光学神经网络芯片的处理速度是正常的中心处理器(Intel i9-9900 @ 3.10 GHz)的5倍。

图5 利用所提光学神经网络芯片执行图像聚类任务

a 负数与负数乘法运算的原理;b 光学神经网络芯片进行训练的迭代曲线;c 和 d为所提光学神经网络芯片进行图像聚类任务的结果。

超大型光学神经网络结构

在上述光学神经网络芯片的工作基础上,综合分析时分复用和波分复用的光学神经网络的优点,该工作提出了新的超大型光学神经网络(见图6)。在理论上,该光学神经网络可以实现500 TOPS的计算速度,并且能够在纳秒级别完成高维度数据的处理。

图6 超大型光学神经网络结构示意图

总结与展望

利用该光学神经网络芯片,研究人员实现了AI系统性能的提升,以原位模型训练的方式,实现了112×112像素的数字图像识别(监督学习)和聚类(无监督学习)AI任务。该研究工作不仅推动了光学神经网络芯片的发展,还为未来构建超大型光学神经网络奠定了基础。

责编: 集小微
来源:中山大学电子与信息工程学院 #光学芯片# #AI算力# #中山大学#
分享至:
THE END
相关推荐
  • 英诺赛科革新AI算力基建:1.2kW 48V GaN方案突破数据中心PUE局限

  • 中山大学谢曦教授团队在Nature Communications上发表深度学习增强声学传感人机交互领域新成果

  • 中山大学 王玺钧副教授等在6G图像语义通信领域取得系列成果

  • 中山大学许适溥副教授团队在Small发表基于二维电导的压力传感器研究

  • 中山大学人工智能研究院揭牌

  • 中山大学实验室陈伟津教授课题组在铁电多位存储器研究方面取得新进展

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
集小微

微信:

邮箱:


4120文章总数
6220.2w总浏览量
最近发布
  • 90天豁免期后,中国企业如何应对关税战?

    13小时前

  • 全球首个《人形机器人智能化分级》标准亮相,为行业商业化按下“加速键”

    14小时前

  • 印度施压监控设备商:海康、小米、摩托罗拉等须提交源码

    14小时前

  • 中国商务部宣讲稀土管制政策,或放松对欧芯片企业出口

    14小时前

  • 机构:2024年中国半导体设备支出达495.5亿美元

    14小时前

最新资讯
  • 西门子EDA断供中国将如何冲击国内芯片产业?

    3小时前

  • 概伦电子:国产替代趋势会促进国内客户支持国产EDA工具

    23分钟前

  • 飞凯材料拟将显示材料升华提纯项目剩余资金用于购买JNC专利

    35分钟前

  • 中创新航拟与邯郸国资成立合资公司,将出资24亿元持股60%

    48分钟前

  • 朗特智能:预计ODM项目落地后,子公司营收将会提升

    1小时前

  • 三星印度高管寻求撤销8100万美元的逃税罚款

    1小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号