NOEIC硅光类脑计算加速器成果发表于Optica
发布时间:2024-04-28 15:12:23 热度:578
4/28/2024,光纤在线讯,近年来,人工智能大模型的迅猛发展催生对绿色智能计算的巨大需求。硅基光电子技术,凭借其高能耗效率、低延迟、大带宽、高并行度及与CMOS兼容等多重优势,已经成为智能计算硬件领域极具发展潜力的解决方案。
近日,国家信息光电子创新中心肖希博士团队,联合光通信技术和网络全国重点实验室、鹏城实验室,提出一种基于相干光学频率梳与硅光集成链路的新型类脑计算架构。该架构具有高集成性与可扩展,采用自主研发的集成相干收发芯片ICTROSA(Integrated Coherent Transmit-Receive Optical Sub-Assemblies),并完成概念验证。实验结果显示,单个计算单元的卷积计算算力超过1TOPS(Tera Operations Per Second),且实现了全连接神经网络、卷积神经网络,其推理精度与电子数字计算硬件相当。该工作为硅基光电计算迈向超POPS(Peta Operations Per Second)级别算力、以及支撑更加复杂的超算和智算应用奠定了坚实基础。
硅光类脑计算加速器架构
图1:硅光类脑计算加速器架构概念图. (a) 硅光集成. (b)硅光类脑计算加速阵列. (c) 硅光类脑计算单元.
图源:Optica
该硅光类脑计算加速器的核心理念来自于卷积定理,即在频域的卷积操作等同于时域的点乘运算。因此,可利用相干接收结构对信号实施点乘操作,从而完成对输入信号频域上的数值卷积(图1)。硅基光电子器件因其具备大带宽和低能耗等特性,能够有效地在频域上加载并处理大量的数据,因此该架构可获得极大的卷积算力。数据的加载环节在电域上进行,可根据实际所需的计算数据规模、处理速率及精度要求,灵活配置系统的工作频率,以实现最优性能。此外,值得注意的是,该架构的卷积算力随计算单元数量的增长而呈现平方级提升,展现出良好的可扩展性。
硅光类脑计算加速器实验系统和应用
基于自主研发的集成相干收发芯片(图2),搭建了硅光类脑计算加速器的原型验证系统(图3)。
图2:硅光IC-TROSA. (a) 硅光IC-TROSA,内部集成有硅光相干收发芯片,驱动芯片,跨阻放大芯片. (b) 硅光收发芯片. (c) 硅光收发芯片结构. (d) Tx EO S21 频率响应. (e) Rx OE S21 频率响应.
图源:Optica
图3:实验系统图
图源:Optica
如图2(d),(e)所示,该自研芯片具备超40GHz的工作带宽,因此,即便在现有实验条件下,系统因信号串扰导致部分频带无法利用,整个系统仍可实现达1.024TOPS的卷积算力(图4)。研究团队还在该系统上部署了全连接神经网络和卷积神经网络模型,并在对手写数字的识别任务中取得了96.67%的推理精度,这一性能与相同结构网络在电子数字计算硬件上的实现效果相当。
图4:不同长度的随机向量卷积结果,n代表被卷积向量长度,横坐标为归一后理论输出结果,纵坐标为归一后的实验测试输出结果,可以看到虽然随着n的增加,输出结果逐渐偏离了y=x,但是n=128,实验测试结果仍保持较好的准确度,此时卷积算力为1.024TOPS。
图源:Optica
此外,该工作对系统的能耗效率进行了深入探讨。基于最新技术,该架构有望实现低于10pJ/MAC能耗效率。同时,作者还讨论了器件线性范围、系统的功率预算,以及噪声因素对计算精度的影响,并对硅光计算器件的设计和优化提出了明确要求。
总结与展望
综上所述,硅光类脑计算加速器具备计算速度和能耗效率的双重优势,该工作也是对后摩尔时代光电子AI深度融合关键技术的一次积极探索。随着硅基光电子技术日益成熟,有理由期待其在智算领域发挥更加重要的作用。
论文信息
Ying Zhu, Ming Luo, Xin Hua, Lu Xu, Ming Lei, Min Liu, Jia Liu, Ye Liu, Qiansheng Wang, Chao Yang, Daigao Chen, Lei Wang, and Xi Xiao, "Silicon photonic neuromorphic accelerator using integrated coherent transmit-receive optical sub-assemblies," Optica 11, 583-594 (2024)
https://doi.org/10.1364/OPTICA.514341
[color=purple][b]第一作者简介
朱盈,2013年本科毕业于华中科技大学,2016年和2021年获得德国慕尼黑工业大学硕士和博士学位,现任职于国家信息光电子创新中心,长期从事硅基光电子智能计算芯片和系统、软硬件协同设计优化方法研究。以第一作者及通信作者在计算机领域顶级会议ICCAD (IEEE/ACM International Conference on Computer Aided Design),DATE(Design, Automation & Test in Europe Conference & Exhibition),ASP-DAC(Asia and South Pacific Design Automation Conference)和期刊TCAD(IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems),光学领域顶级国际会议OFC(Optical Fiber Communications Conference and Exhibition)和期刊Optica上发表论文近10篇,申请发明专利10余项,2023年评选为“3551光谷人才计划”优秀青年人才。
来源:国家信息光电子创新中心
近日,国家信息光电子创新中心肖希博士团队,联合光通信技术和网络全国重点实验室、鹏城实验室,提出一种基于相干光学频率梳与硅光集成链路的新型类脑计算架构。该架构具有高集成性与可扩展,采用自主研发的集成相干收发芯片ICTROSA(Integrated Coherent Transmit-Receive Optical Sub-Assemblies),并完成概念验证。实验结果显示,单个计算单元的卷积计算算力超过1TOPS(Tera Operations Per Second),且实现了全连接神经网络、卷积神经网络,其推理精度与电子数字计算硬件相当。该工作为硅基光电计算迈向超POPS(Peta Operations Per Second)级别算力、以及支撑更加复杂的超算和智算应用奠定了坚实基础。
硅光类脑计算加速器架构
图1:硅光类脑计算加速器架构概念图. (a) 硅光集成. (b)硅光类脑计算加速阵列. (c) 硅光类脑计算单元.
图源:Optica
该硅光类脑计算加速器的核心理念来自于卷积定理,即在频域的卷积操作等同于时域的点乘运算。因此,可利用相干接收结构对信号实施点乘操作,从而完成对输入信号频域上的数值卷积(图1)。硅基光电子器件因其具备大带宽和低能耗等特性,能够有效地在频域上加载并处理大量的数据,因此该架构可获得极大的卷积算力。数据的加载环节在电域上进行,可根据实际所需的计算数据规模、处理速率及精度要求,灵活配置系统的工作频率,以实现最优性能。此外,值得注意的是,该架构的卷积算力随计算单元数量的增长而呈现平方级提升,展现出良好的可扩展性。
硅光类脑计算加速器实验系统和应用
基于自主研发的集成相干收发芯片(图2),搭建了硅光类脑计算加速器的原型验证系统(图3)。
图2:硅光IC-TROSA. (a) 硅光IC-TROSA,内部集成有硅光相干收发芯片,驱动芯片,跨阻放大芯片. (b) 硅光收发芯片. (c) 硅光收发芯片结构. (d) Tx EO S21 频率响应. (e) Rx OE S21 频率响应.
图源:Optica
图3:实验系统图
图源:Optica
如图2(d),(e)所示,该自研芯片具备超40GHz的工作带宽,因此,即便在现有实验条件下,系统因信号串扰导致部分频带无法利用,整个系统仍可实现达1.024TOPS的卷积算力(图4)。研究团队还在该系统上部署了全连接神经网络和卷积神经网络模型,并在对手写数字的识别任务中取得了96.67%的推理精度,这一性能与相同结构网络在电子数字计算硬件上的实现效果相当。
图4:不同长度的随机向量卷积结果,n代表被卷积向量长度,横坐标为归一后理论输出结果,纵坐标为归一后的实验测试输出结果,可以看到虽然随着n的增加,输出结果逐渐偏离了y=x,但是n=128,实验测试结果仍保持较好的准确度,此时卷积算力为1.024TOPS。
图源:Optica
此外,该工作对系统的能耗效率进行了深入探讨。基于最新技术,该架构有望实现低于10pJ/MAC能耗效率。同时,作者还讨论了器件线性范围、系统的功率预算,以及噪声因素对计算精度的影响,并对硅光计算器件的设计和优化提出了明确要求。
总结与展望
综上所述,硅光类脑计算加速器具备计算速度和能耗效率的双重优势,该工作也是对后摩尔时代光电子AI深度融合关键技术的一次积极探索。随着硅基光电子技术日益成熟,有理由期待其在智算领域发挥更加重要的作用。
论文信息
Ying Zhu, Ming Luo, Xin Hua, Lu Xu, Ming Lei, Min Liu, Jia Liu, Ye Liu, Qiansheng Wang, Chao Yang, Daigao Chen, Lei Wang, and Xi Xiao, "Silicon photonic neuromorphic accelerator using integrated coherent transmit-receive optical sub-assemblies," Optica 11, 583-594 (2024)
https://doi.org/10.1364/OPTICA.514341
[color=purple][b]第一作者简介
朱盈,2013年本科毕业于华中科技大学,2016年和2021年获得德国慕尼黑工业大学硕士和博士学位,现任职于国家信息光电子创新中心,长期从事硅基光电子智能计算芯片和系统、软硬件协同设计优化方法研究。以第一作者及通信作者在计算机领域顶级会议ICCAD (IEEE/ACM International Conference on Computer Aided Design),DATE(Design, Automation & Test in Europe Conference & Exhibition),ASP-DAC(Asia and South Pacific Design Automation Conference)和期刊TCAD(IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems),光学领域顶级国际会议OFC(Optical Fiber Communications Conference and Exhibition)和期刊Optica上发表论文近10篇,申请发明专利10余项,2023年评选为“3551光谷人才计划”优秀青年人才。
来源:国家信息光电子创新中心