6/20/2024,光纤在线讯,简介:随着数据中心不断发展,以支持更强大的人工智能、高性能计算和云计算应用,对更快、更高效的数据通信解决方案的需求与日俱增。传统的铜缆电气互连在带宽、延迟、能效和覆盖范围方面都面临着限制。硅基光电子技术利用半导体制造技术在硅芯片上实现了光学组件,为光互连应对这些挑战开辟了新的可能性。
然而,一般人常常混淆两种关键的光互连技术—光电共封装(CPO)和封装内光I/O(In-Package Optics)。虽然两者都利用了硅基光电子技术,但它们是针对不同应用的不同解决方案。本文将阐明之间的区别、主要特点以及各自在未来数据中心架构中的作用。
硅基光电子基础知识
硅基光电子技术可以创建光电芯片(PIC),利用光来传输和处理数据,克服了电气互连的许多局限性。PIC将调制器、波导和检测器等光学组件与电子电路结合在同一硅芯片上。
与传统光电组件相比,硅基光电子技术利用标准半导体制造工艺,能以低成本大批量生产 PIC。半导体规模经济为光互连带来了新的机遇,不仅可用于长距离网络,还可用于数据中心内的芯片到芯片、电路板到电路板以及机架到机架的通信。
光电共封装(CPO)
目前,连接数据中心交换机、路由器和服务器的主流技术是可插拔光收发器。这些模块将 PIC 与其他电子芯片和光电器件集成在一个包装中,大小与一包口香糖差不多。通过将光缆直接插入模块的面板,可插拔式模块可提供方便的板对板和机架对机架的光连接。
然而,随着数据速率和带宽需求的增加,可插拔收发器将在成本、功耗、带宽密度、占地面积和延迟方面面临挑战。光电共封装器件(CPO)已成为一种不断发展的替代方案。
在 CPO 实施过程中,电子驱动芯片和可插拔模块中的 PIC 被组合到一个封装模块中。与插拔式模块相比,它的占地面积更小,带宽密度更高。CPO 模块可以放置在更靠近计算或交换芯片的位置,从而降低了功率和电气连接的延迟。
图 1 展示了 CPO 与其他互连解决方案的带宽密度和能效对比。虽然 CPO 的效率不如封装内光 I/O(In-Package Optics I/O,OIO),但 CPO 在封装级的密度、效率和覆盖范围均优于插拔式光连接。
图 1. 各种互连解决方案的岸线带宽密度和能效与传输距离的乘积。岸线带宽密度和能效与芯片、电路板或封装如何有效利用其边缘接口连接的有限空间有关。不同的接口也具有不同的到达能力。由 Ayar Lab提供。
CPO 适用于数据中心内的网络应用,可将大规模并行插拔式收发器市场发展到更高密度,但仍能保持插拔式收发器的模块化和定制数据传输速率。光电共封装协作组织(Co-Packaged Optics Collaboration)和光网络论坛(Optical Internetworking Forum)等主要行业组织都在关注 CPO 实施的标准和规范。
封装内光 I/O, OIO
CPO 是可插拔收发器的演变,而封装内光 I/O 则是一种革命性的新解决方案。将光互连与用于 CPU、GPU、ASIC 或 FPGA 等计算功能的芯片置于同一物理封装中。
具体来说,利用 2.5D 或 3D 集成等先进封装技术,将可将电信号转换为光信号的光 I/O 芯片与计算芯片集成到单个多芯片封装中。这种光芯片组可在封装内实现芯片到芯片的直接光学通信,并可与同一电路板上的其他封装、电路板之间、跨机架以及整个数据中心基础设施进行通信。
图 2 展示了封装内光 I/O 集成的概念。光链路取代了封装级的电气路径,使光通信在整个分布式计算系统中具有极高的带宽、低延迟、高效率和对到达不敏感等特点。
图 2. 封装内光 I/O 将光互连集成到与用于计算功能的芯片相同的封装内。这种方法实现了基于光而非电的芯片间连接,并有可能提高分布式计算系统的效率。由 Ayar 实验室提供。
封装内光 I/O 的设计目的是在计算芯片之间建立直接的高性能连接,从而实现新的数据中心架构,如分解内存池和人工智能 "横向扩展 "结构。例如,英伟达(NVIDIA)正在扩展其 NVLink 互连,从连接单个服务器中的 8 个 GPU 到以光学方式连接多达 256 个 GPU 作为一个巨大的分布式加速器。
这些新兴架构要求以最小的延迟开销和最大的带宽密度连接大量芯片--这是传统电气互连难以解决的新问题,但光 I/O 可以无缝处理。
封装内光 I/O 的内部结构
封装内光 I/O 芯片利用先进的硅基光电子技术,将波导、调制器和检测器等光学组件与用于驱动器、放大器、均衡和控制的电子电路密集集成在一起。
关键创新是使用微环谐振器在光纤上实现波分复用(WDM),如图 3 所示。这些结构极为紧凑的微环器件可在每根光纤上选择性地调制和解调多个波长,从而实现大规模并行高带宽数据传输。
图 3. 微环谐振器允许每根光纤有多个波长,每个芯片有多个光纤。由 Ayar 实验室提供。
例如,当前一代光 I/O 芯片使用 8 个光端口/光纤上的 64 个波长,实现了 4096 Gbps 的双向带宽。这种密度和并行性实现了高能效-通过在每根光纤上使用更多波长来扩展带宽,而不是提高激光功率或电子信号传输速率。
硅基光电子组件采用标准 CMOS 工艺制造,并与电子控制电路集成到一个多芯片封装中。目前正在采用通用芯片互连 Express(UCIe)和 NVLink 等关键行业标准,以确保交叉兼容性。
通过将光 I/O 电路与计算芯片封装在一起,可以避免电气 I/O 的能耗和延迟开销,同时还能在芯片之间、封装之间、电路板之间实现直接光连接,并在整个分布式系统中进行扩展。
CPO 与封装内光I/O器件 - 性能比较
为了更好地了解 CPO 和封装内光I/O 的不同应用,比较一下主要性能指标很有帮助:
- 岸线带宽密度:对于给定的封装边缘长度,封装内光学 I/O 的带宽密度比 CPO 高 10 倍以上,如图 4 所示。这种极高的边缘密度可使互连带宽与未来的计算芯片密度同步扩展。
-区域带宽密度:图 4 显示了每平方毫米封装面积的带宽密度,这对于面积受限的高性能计算封装来说很重要。光 I/O 与 UCIe 等先进的电气接口相匹配,而 CPO 则落在后面。
-能源效率:通过利用波分复用并行性,光 I/O 芯片在带宽高达每秒太比特时的能效优于 1 pJ/bit。CPO 模块的单位比特能耗仍然要高出 10-100 倍。
-延迟:光 I/O 的延迟时间为个位数纳秒,与板载铜缆类似,而可插拔/CPO 解决方案的前向纠错编码延迟时间超过 100ns。
-成本效益:光 I/O 的紧密集成和扩展曲线预计将超过 10 Gbps/美元。CPO 预计将遵循可插拔成本趋势,限制在小于 1 Gbps/美元。
图 4. 各种互连解决方案的区域带宽密度和能效与覆盖范围的乘积。由 Ayar Labs提供。
这些指标凸显了不同的价值主张-CPO 为数据中心网络提供了革命性的密度和能效提升,而光 I/O 则通过在封装内提供太比特的光带宽和个位数纳秒的延迟,实现了革命性的分布式计算架构。
CPO 的目标是改进当前服务器之间的传统网络、交换和 I/O。封装内光 I/O 针对需要紧密耦合计算芯片的新兴 AI/HPC/disaggregated 架构进行了优化。
未来展望
CPO和封装内光 I/O都是数据中心采用硅基光电子互连的重要里程碑。未来可看到两种技术并存:CPO 将通过发展当今的可插拔收发器市场,帮助满足更高带宽模块间连接的短期需求。同时,封装内光 I/O 正在为未来的分布式计算系统奠定基础,在这些系统中,CPU/GPU/内存机架可紧密耦合为一个巨大的人工智能加速器结构。
参考资料
[1]https://www.photonics.com/Articles/Understanding_In-Package_Optical_I_O_Versus/a69701
来源:逍遥科技