华为《数据中心 2030》详解CPO/OIO/光交叉及1.6T /3.2T时代光方案
发布时间:2024-10-21 17:20:25 热度:1822
10/21/2024,光纤在线讯,近日,华为发布《数据中心 2030》2024版报告,报告指出:数据中心是新型数字基础设施的算力底座,也是加速数字经济发展的“发动机”。未来十年,数据中心既要实现百倍算力提升,以满足快速增长的智能化业务需求,还要实现百倍能效提升,以满足绿色低碳可持续发展的长期目标。
华为指出:单比特成本和功耗的降低是高速光接口技术发展的持续追求。过去十几年,交换机的容量提升了 80 倍,整体功耗下降 4 倍,其中 ASIC 功耗下降 10 倍,光接口的功耗降低了 3 倍。 虽然光接口的单比特成本和功耗在不断下降,但是下降的速率远落后于交换机ASIC 部分的功耗降低。
究其根本原因,光接口依赖于 SerDes 技术,SerDes 为数模混合的技术,其能效演进低于 ASIC 部分。为了进一步降低功耗,必须要通过缩短 SerDes的距离或者减少 SerDes 的数量来降低功耗,因此在光接口的系统结构上出现了很多新型技术如 OBO、CPO 等,芯片直接出光的CPO 技术已经成为业界热点。
一、芯片出光技术
(1) 面向数据中心交换机的芯片出光技术——CPO 技术
目前主要的技术路径有两条,分别是基于硅光的技术路线和基于 VCSEL 的技术路线。
硅光技术因其集成度高、CMOS 工艺兼容有望实现低成本的特性成为多通道集成收发机的主要路径。针对硅光平台 CPO 技术光源部分主要有两种思路,一种是可插拔光源池模块技术,考虑到光源部分失效率较高,方便后续更换,将多通道、大功率的激光器芯片封装后组装成可插拔模块置于面板侧,通过保偏光纤与交换芯片的四周的光引擎芯片连接,提供连续的激光源,这也是业界普遍认可的一种光源形态。另一方面,少数厂家具备较强的 III-V/Si 异质集成能力,能够直接在硅光引擎上实现光源的集成,通过采用2:1 备份的方式改善光源的良率,该方式成为第二条光源技术路径。
针对硅光平台的高速调制器部分,当前主要有三种技术路径:第一种是相对成熟的 MZ 调制器技术,由于MZ 尺寸较大(百 um 量级),多通道集成后,光引擎尺寸较大,功耗相对偏高;第二种是微环调制器技术,微环具备小尺寸(几十 um 量级)、低功耗(驱压小)的特点,但是微环调制器需要非常稳定的工作波长跟踪系统;第三种是基于 Ge 材料的 EA 调制器,调制器尺寸也在几十 um 左右,通过法兰兹 -卡尔迪西 (Franz-Keldysh) 效应实现对光的吸收。
业界部分厂商也在推动基于 VCSEL 的 CPO技术,主要原因在于 VCSEL 具有优异的功耗特性(< 5Pj/bit),基本可满足 100m 以内的互联需求,后续通过器件进一步升级为少模或单模的 VCSEL,也有望能够实现 km 级互联长度。当前,VCSEL 较为成熟的器件为25GBd 量级,后续 50GBd 有望在近几年成熟商用,虽然带宽发展趋势上略慢于硅光技术,但 VCSEL 技术可以通过外置合分波器实现波分复用以提高单纤容量,也可以通过阵列化的 VCSEL 器件 /PD 器件配合多芯光纤(~40um 芯间距)实现大容量传输。
(2)面向高性能计算的芯片出光技术——光 I/O 技术
高性能计算集群是由高速通信网络连接的强算力平台,高速互联网络的通信能力已经成为 xPU 集群的重要支撑,如何进一步提升互联带宽成为业界关注的重点,光 I/O 技术开始步入大家的视野,该技术通过将光学收发芯片放进计算芯片封装内,因此也被称为封装内光学连接技术(In-packaged Opitcs)。通过采用该技术可以大幅改善芯片扇出带宽,降低光互联功耗,实现可媲美板内 / 框内电互联的带宽密度 / 功耗水平,同时,又能提供电互联无法达到的互联距离(~km 级),为集群系统互联提供了一种低功耗,大容量的新技术路线。光 I/O 技术的具体实现技术路径以硅光技术为主,具体为采用低调制速率(30-60Gbps)的微环总线型波分技术。一方面,在该调制速率区间,具有相对最优的端到端功耗水平(~5pJ/bit),另一方面,利用微环本身的窄带工作特性,实现多路合一的波分型总线,可以大幅扩展边缘互联带宽密度,很容易达到百Gbps/mm,甚至 Tbps/mm 互联密度。当前,该领域主要研究热点聚焦于密集波分微环调制器的实现,多通道微环调制器的控制,多波长外置光源技术以及先进封装技术等多个技术方向。
二、高速光接口(1.6T/3.2T)
随着单路速度提升,100/200Gbps 以上的高速串行通信带来功耗、串扰和散热挑战,传统光电转换接口将无法满足算力增长需要,芯片出光在数据中心连接中的占比将持续提升,相比传统方案芯片出光端到端能耗有望降低至 1/3,成为未来突破带宽瓶颈,实现数据中心绿色发展的关键技术。
数据中心设备之间连接由高速光接口提供,并且根据连接距离不同分为 SR、 FR、LR 等规格,不同传输距离采用的技术方案也会有所不同。高速光接口的速率发展与数据中心的交换机容量以及 SerDes 技术的发展息息相关。交换机容量每 2 年增长翻一番,预计2030年会出现200Tbps/400Tbps交换容量,单端口速率需要增长到1.6Tbps/3.2Tbps。
光连接技术根据接收技术不同可以分为直检检测技术和相干检测技术。直检检测技术由于成本低、功耗低,在 800GE 之前,为数据中心高速光接口的主要技术。随着速率的提升,直检检测技术受到色散,四波混频等问题的影响,传输距离下降,使得相干技术下沉到数据中心存在了可能。在 800G 时代, IEEE 802.3dJ 针对 10km 场景将会定义相干和直检两条技术路径。但相干技术面临功耗高以及成本高的挑战。未来 1.6T/3.2T 时代,直检技术和相干技术将同时存在。
直检检测技术在 1.6T /3.2T 时代仍是主力技术路径之一,并沿着 Scale Up 和 Scale Out 同时发展,在单 lane 速率持续提升的同时,通过增加光纤或者波分复用技术增加并行路数也将持续发展。800GE 时代延续单 lane 100G 技术并发展了单 lane 200G 的技术。1.6T/3.2T 时代将会依托单 lane 100G, 单lane 200G 技术进行多路复用,或会发展单lane 400G 的技术。如 IEEE 802.3dJ 已立项16*100G 的 1.6TSR 的技术方案。也有公司陆续表达了对 8x200G 构建 1.6T 技术方案的预期,由于其采用 8 波复用的技术方案,将会面临着色散,四波混频等挑战,需要研究新的波长分配方案,色散管理技术,低功耗均衡技术等。对于单 lane 400G 技术,可采用高带宽器件,高阶调制格式,以及偏振复用等技术。
相干技术传统是长距光传输采用的技术方案。由于直检技术面临色散,四波混频等挑战,传输距离不断缩小。业界出现了相干技术下沉到数据中心互联的发展趋势。 相干技术传输性能好,且可以灵活的采用 oDSP进行色散的补偿,但是成本和功耗较高。为了降低成本和功耗,许多高校及企业提出了Coherent-Lite 的概念。例如,利用 DFB 灰光光源,量子点光源等低成本光源代替长途相干使用的 DBR 光源,进一步通过光源池共享光源来降低光源的成本及功耗。通过光域偏振跟踪方案来降低数字信号处理的复杂度,使用分段硅光调制器避免发端 DAC 等技术。
三、光交叉连接
近年来,业界和学术界广泛研究新型的光交叉(OXC)连接技术,通过利用光交换在带宽、端口、低功耗和时延等方面的优势,解决数据中心网络规模和流量带宽两个关键系统需求。OXC主要技术方向分为波长级交叉连接和光纤级端口交叉连接,面向2030,在数据中心场景的重点研究方向是MEMS OXC以及亚?s快速光交叉技术。
(1)MEMS OXC
MEMS OXC(Micro-Electro-Mechanical Systems Optical Cross-Connect)是一种基于微机电系统技术的光交叉系统设备,由一对光学准直器组成阵列作为输入和输出(I/
O)端口和一对MEMS微镜阵列芯片来控制光束,以便任何输入端口都可以连接到任意输出端口,具有高集成度、高速率、低功耗的特点。
(2)片上集成光开关
基于片上集成快速光开关使用的关键技术可将片上集成光开关分为五类:热光效应(thermo-optic effect);硅基载流子效应(free carrier effect);泡克耳斯效应(Pockels effect);克尔效应(Kerr effect);波导型MEMS技术(Si-MEMS)。
热光效应,即利用材料晶格结构对温度敏感的特性,实现对材料折射率的调控。制成的光开关可实现100μm量级的超紧凑尺寸、10mW级开关功耗、亚微秒(sub-?s)量级切换时延;载流子效应是基于硅材料的一种特殊效应,光开关长度在300 ?m-mm量级,开关时延为ns级;泡克耳斯效应和克尔效应均属于非线光学效应,非线性光学效应光开关电光响应时间在ps-fs量级,且不产生额外损耗,但是需要更高的驱动电压或更长的器件尺寸;硅波导微型MEMS系统(Si MEMS)依靠静电力对悬空波导结构的吸引/ 排斥行为直接改变波导物物理间距从而改变光路径,光开关切换速度为亚?s量级。
相比其他技术,Si-MEMS可提供更高的隔离度和更低的损耗,并且允许结构尺寸更加紧凑,但Si-MEMS依靠移动波导或金属电极结构,限制了开关可靠性和耐久性。
四、新光纤介质
下一代数据中心互联的发展趋势是高速率、高密度、低时延、低成本和易运维,新型光纤的应用将对数据中心光互联产生革命性的影响。其中空芯光纤和多芯光纤,由于其特殊和优异的光纤特性,将进一步推动数据中心实现更低时延、更高密度、更低成本的光互联。
(1)空芯光纤
空芯光纤突破了传统石英光纤的局限,其基于反谐振机理,通过特定的包层结构设计,可将光限制在空气纤芯中进行传输,改变了光在光纤中的传输介质,从根本上避免了因材料本征限制而带来的问题。相比实芯光纤,空芯光纤具有低时延、低色散和低非线性等优点。首先,光在空气纤芯中的传输速度是光速,是在玻璃介质中传输速度的1.5倍,可大幅缩短AI数据中心内各个服务器以及GPU之间的通讯时延;其次,由于空芯光纤的传输介质是空气,材料色散低,有助于扩展数据中心内高速光模块的传输距离,降低光互联成本;第三,与低材料色散类似,空气相对于二氧化硅等玻璃材料,其非线性折射率系数小,具有更低的非线性效应,极大程度地抑制了数据中心内光互联产生的信号畸变,保证更好的通信和网络质量。
(2)多芯光纤
多芯光纤是多个纤芯共享一个包层,其中每个纤芯都是单模,且纤芯之间的串扰很小,这将使密度比传统单模光纤提高数倍。在多芯光纤中,多路光信号可分别在多个纤芯中同时传输,信号之间串扰小,极大地提高了通信容量,其应用将对数据中心光互联产生革命性的影响。单模代替多模、多芯代替单芯、COBO/CPO代替热可插拔将是数据中心未来的布线趋势。多芯光纤有潜力成为未来超800G的互联方案,可大幅提升光传输容量和频谱效率,节约布线成本和管道资源、降低能耗,且具有多个平行的物理通道,在下一代数据中心布线中更具应用潜力。
本文仅截取有关光通信部分,报告同时分析了未来新型数据中心将具备的特征及需求,如有需要,可关注【光纤在线】公众号,回复【数据中心2030】,即可获取PDF版本全文。
华为指出:单比特成本和功耗的降低是高速光接口技术发展的持续追求。过去十几年,交换机的容量提升了 80 倍,整体功耗下降 4 倍,其中 ASIC 功耗下降 10 倍,光接口的功耗降低了 3 倍。 虽然光接口的单比特成本和功耗在不断下降,但是下降的速率远落后于交换机ASIC 部分的功耗降低。
究其根本原因,光接口依赖于 SerDes 技术,SerDes 为数模混合的技术,其能效演进低于 ASIC 部分。为了进一步降低功耗,必须要通过缩短 SerDes的距离或者减少 SerDes 的数量来降低功耗,因此在光接口的系统结构上出现了很多新型技术如 OBO、CPO 等,芯片直接出光的CPO 技术已经成为业界热点。
一、芯片出光技术
(1) 面向数据中心交换机的芯片出光技术——CPO 技术
目前主要的技术路径有两条,分别是基于硅光的技术路线和基于 VCSEL 的技术路线。
硅光技术因其集成度高、CMOS 工艺兼容有望实现低成本的特性成为多通道集成收发机的主要路径。针对硅光平台 CPO 技术光源部分主要有两种思路,一种是可插拔光源池模块技术,考虑到光源部分失效率较高,方便后续更换,将多通道、大功率的激光器芯片封装后组装成可插拔模块置于面板侧,通过保偏光纤与交换芯片的四周的光引擎芯片连接,提供连续的激光源,这也是业界普遍认可的一种光源形态。另一方面,少数厂家具备较强的 III-V/Si 异质集成能力,能够直接在硅光引擎上实现光源的集成,通过采用2:1 备份的方式改善光源的良率,该方式成为第二条光源技术路径。
针对硅光平台的高速调制器部分,当前主要有三种技术路径:第一种是相对成熟的 MZ 调制器技术,由于MZ 尺寸较大(百 um 量级),多通道集成后,光引擎尺寸较大,功耗相对偏高;第二种是微环调制器技术,微环具备小尺寸(几十 um 量级)、低功耗(驱压小)的特点,但是微环调制器需要非常稳定的工作波长跟踪系统;第三种是基于 Ge 材料的 EA 调制器,调制器尺寸也在几十 um 左右,通过法兰兹 -卡尔迪西 (Franz-Keldysh) 效应实现对光的吸收。
业界部分厂商也在推动基于 VCSEL 的 CPO技术,主要原因在于 VCSEL 具有优异的功耗特性(< 5Pj/bit),基本可满足 100m 以内的互联需求,后续通过器件进一步升级为少模或单模的 VCSEL,也有望能够实现 km 级互联长度。当前,VCSEL 较为成熟的器件为25GBd 量级,后续 50GBd 有望在近几年成熟商用,虽然带宽发展趋势上略慢于硅光技术,但 VCSEL 技术可以通过外置合分波器实现波分复用以提高单纤容量,也可以通过阵列化的 VCSEL 器件 /PD 器件配合多芯光纤(~40um 芯间距)实现大容量传输。
(2)面向高性能计算的芯片出光技术——光 I/O 技术
高性能计算集群是由高速通信网络连接的强算力平台,高速互联网络的通信能力已经成为 xPU 集群的重要支撑,如何进一步提升互联带宽成为业界关注的重点,光 I/O 技术开始步入大家的视野,该技术通过将光学收发芯片放进计算芯片封装内,因此也被称为封装内光学连接技术(In-packaged Opitcs)。通过采用该技术可以大幅改善芯片扇出带宽,降低光互联功耗,实现可媲美板内 / 框内电互联的带宽密度 / 功耗水平,同时,又能提供电互联无法达到的互联距离(~km 级),为集群系统互联提供了一种低功耗,大容量的新技术路线。光 I/O 技术的具体实现技术路径以硅光技术为主,具体为采用低调制速率(30-60Gbps)的微环总线型波分技术。一方面,在该调制速率区间,具有相对最优的端到端功耗水平(~5pJ/bit),另一方面,利用微环本身的窄带工作特性,实现多路合一的波分型总线,可以大幅扩展边缘互联带宽密度,很容易达到百Gbps/mm,甚至 Tbps/mm 互联密度。当前,该领域主要研究热点聚焦于密集波分微环调制器的实现,多通道微环调制器的控制,多波长外置光源技术以及先进封装技术等多个技术方向。
二、高速光接口(1.6T/3.2T)
随着单路速度提升,100/200Gbps 以上的高速串行通信带来功耗、串扰和散热挑战,传统光电转换接口将无法满足算力增长需要,芯片出光在数据中心连接中的占比将持续提升,相比传统方案芯片出光端到端能耗有望降低至 1/3,成为未来突破带宽瓶颈,实现数据中心绿色发展的关键技术。
数据中心设备之间连接由高速光接口提供,并且根据连接距离不同分为 SR、 FR、LR 等规格,不同传输距离采用的技术方案也会有所不同。高速光接口的速率发展与数据中心的交换机容量以及 SerDes 技术的发展息息相关。交换机容量每 2 年增长翻一番,预计2030年会出现200Tbps/400Tbps交换容量,单端口速率需要增长到1.6Tbps/3.2Tbps。
光连接技术根据接收技术不同可以分为直检检测技术和相干检测技术。直检检测技术由于成本低、功耗低,在 800GE 之前,为数据中心高速光接口的主要技术。随着速率的提升,直检检测技术受到色散,四波混频等问题的影响,传输距离下降,使得相干技术下沉到数据中心存在了可能。在 800G 时代, IEEE 802.3dJ 针对 10km 场景将会定义相干和直检两条技术路径。但相干技术面临功耗高以及成本高的挑战。未来 1.6T/3.2T 时代,直检技术和相干技术将同时存在。
直检检测技术在 1.6T /3.2T 时代仍是主力技术路径之一,并沿着 Scale Up 和 Scale Out 同时发展,在单 lane 速率持续提升的同时,通过增加光纤或者波分复用技术增加并行路数也将持续发展。800GE 时代延续单 lane 100G 技术并发展了单 lane 200G 的技术。1.6T/3.2T 时代将会依托单 lane 100G, 单lane 200G 技术进行多路复用,或会发展单lane 400G 的技术。如 IEEE 802.3dJ 已立项16*100G 的 1.6TSR 的技术方案。也有公司陆续表达了对 8x200G 构建 1.6T 技术方案的预期,由于其采用 8 波复用的技术方案,将会面临着色散,四波混频等挑战,需要研究新的波长分配方案,色散管理技术,低功耗均衡技术等。对于单 lane 400G 技术,可采用高带宽器件,高阶调制格式,以及偏振复用等技术。
相干技术传统是长距光传输采用的技术方案。由于直检技术面临色散,四波混频等挑战,传输距离不断缩小。业界出现了相干技术下沉到数据中心互联的发展趋势。 相干技术传输性能好,且可以灵活的采用 oDSP进行色散的补偿,但是成本和功耗较高。为了降低成本和功耗,许多高校及企业提出了Coherent-Lite 的概念。例如,利用 DFB 灰光光源,量子点光源等低成本光源代替长途相干使用的 DBR 光源,进一步通过光源池共享光源来降低光源的成本及功耗。通过光域偏振跟踪方案来降低数字信号处理的复杂度,使用分段硅光调制器避免发端 DAC 等技术。
三、光交叉连接
近年来,业界和学术界广泛研究新型的光交叉(OXC)连接技术,通过利用光交换在带宽、端口、低功耗和时延等方面的优势,解决数据中心网络规模和流量带宽两个关键系统需求。OXC主要技术方向分为波长级交叉连接和光纤级端口交叉连接,面向2030,在数据中心场景的重点研究方向是MEMS OXC以及亚?s快速光交叉技术。
(1)MEMS OXC
MEMS OXC(Micro-Electro-Mechanical Systems Optical Cross-Connect)是一种基于微机电系统技术的光交叉系统设备,由一对光学准直器组成阵列作为输入和输出(I/
O)端口和一对MEMS微镜阵列芯片来控制光束,以便任何输入端口都可以连接到任意输出端口,具有高集成度、高速率、低功耗的特点。
(2)片上集成光开关
基于片上集成快速光开关使用的关键技术可将片上集成光开关分为五类:热光效应(thermo-optic effect);硅基载流子效应(free carrier effect);泡克耳斯效应(Pockels effect);克尔效应(Kerr effect);波导型MEMS技术(Si-MEMS)。
热光效应,即利用材料晶格结构对温度敏感的特性,实现对材料折射率的调控。制成的光开关可实现100μm量级的超紧凑尺寸、10mW级开关功耗、亚微秒(sub-?s)量级切换时延;载流子效应是基于硅材料的一种特殊效应,光开关长度在300 ?m-mm量级,开关时延为ns级;泡克耳斯效应和克尔效应均属于非线光学效应,非线性光学效应光开关电光响应时间在ps-fs量级,且不产生额外损耗,但是需要更高的驱动电压或更长的器件尺寸;硅波导微型MEMS系统(Si MEMS)依靠静电力对悬空波导结构的吸引/ 排斥行为直接改变波导物物理间距从而改变光路径,光开关切换速度为亚?s量级。
相比其他技术,Si-MEMS可提供更高的隔离度和更低的损耗,并且允许结构尺寸更加紧凑,但Si-MEMS依靠移动波导或金属电极结构,限制了开关可靠性和耐久性。
四、新光纤介质
下一代数据中心互联的发展趋势是高速率、高密度、低时延、低成本和易运维,新型光纤的应用将对数据中心光互联产生革命性的影响。其中空芯光纤和多芯光纤,由于其特殊和优异的光纤特性,将进一步推动数据中心实现更低时延、更高密度、更低成本的光互联。
(1)空芯光纤
空芯光纤突破了传统石英光纤的局限,其基于反谐振机理,通过特定的包层结构设计,可将光限制在空气纤芯中进行传输,改变了光在光纤中的传输介质,从根本上避免了因材料本征限制而带来的问题。相比实芯光纤,空芯光纤具有低时延、低色散和低非线性等优点。首先,光在空气纤芯中的传输速度是光速,是在玻璃介质中传输速度的1.5倍,可大幅缩短AI数据中心内各个服务器以及GPU之间的通讯时延;其次,由于空芯光纤的传输介质是空气,材料色散低,有助于扩展数据中心内高速光模块的传输距离,降低光互联成本;第三,与低材料色散类似,空气相对于二氧化硅等玻璃材料,其非线性折射率系数小,具有更低的非线性效应,极大程度地抑制了数据中心内光互联产生的信号畸变,保证更好的通信和网络质量。
(2)多芯光纤
多芯光纤是多个纤芯共享一个包层,其中每个纤芯都是单模,且纤芯之间的串扰很小,这将使密度比传统单模光纤提高数倍。在多芯光纤中,多路光信号可分别在多个纤芯中同时传输,信号之间串扰小,极大地提高了通信容量,其应用将对数据中心光互联产生革命性的影响。单模代替多模、多芯代替单芯、COBO/CPO代替热可插拔将是数据中心未来的布线趋势。多芯光纤有潜力成为未来超800G的互联方案,可大幅提升光传输容量和频谱效率,节约布线成本和管道资源、降低能耗,且具有多个平行的物理通道,在下一代数据中心布线中更具应用潜力。
本文仅截取有关光通信部分,报告同时分析了未来新型数据中心将具备的特征及需求,如有需要,可关注【光纤在线】公众号,回复【数据中心2030】,即可获取PDF版本全文。