导读:东吴证券的分析师指出,AEC作为 AI 计算时代Scale Up需求放大后的新兴技术方向,与Scale Out光互联并非“零和游戏”,未来有望在柜间、柜内、ToR层互联中进一步渗透。这引发了我们对 Scale Out 和 AEC 等相关技术的深入探究。
2/11/2025,光纤在线讯,在新的开端,众多行研机构积极发布行业报告,其中Scale Up、AEC等成为热门话题。东吴证券的分析师指出,AEC作为 AI 计算时代Scale Up需求放大后的新兴技术方向,与Scale Out光互联并非“零和游戏”,未来有望在柜间、柜内、ToR层互联中进一步渗透。这引发了我们对 Scale Out 和 AEC 等相关技术的深入探究。
Scale Out 通常被译为 “横向扩展”,在计算机领域,特别是云计算、数据存储和服务器架构等方面,它是一个极为重要的概念。其实现方式是增加更多的节点,如服务器、存储设备等,到系统中,以此提高系统的处理能力和容量。这些节点一般是低成本、标准化的设备,它们通过网络连接在一起,协同工作以处理更多的任务和数据,区别于依靠提升单个设备性能的 Scale Up(纵向扩展)。在 AI 算力场景下,Scale Out 网络实现集群内(如万卡、十万卡集群)所有 GPU 卡互联,亮点在于网络内连接 GPU 数量大,和传统数据中心网络类似;而 Scale Up 网络实现超节点内(如 NVL 72)所有 GPU 卡互联,亮点是网络内单卡通信带宽高,这是为应对 AI 算力场景下并行计算、内存墙等瓶颈而催生出的新兴需求。
在2024年,AEC、DAC、AOC 频繁出现,去年光博会上也有不少公司展出相关产品。DAC、AEC 都是铜连接,其中DAC无源,没有信号处理芯片,缺乏时延噪声消除、信号恢复等功能,直接通过铜缆传输信息;AEC有源,有信号处理芯片,Retimer芯片会将时延噪声消除、信号恢复,再通过铜缆传输信息。AOC则是有源光连接,其中DSP、Driver、Tia芯片将时延噪声消除、信号恢复,再利用 VCSEL 等光芯片将电信号调制为光信号后通过光缆传输信息。
从具体构造来看,DAC(Direct Attach Cable)采用铜线将两端的连接器端口组装起来,不包含任何主动组件;AEC(Active Electrical Cable)含铜缆、连接器、Retimer芯片、PCB等,Retimer芯片可消除噪声并非线性放大信号,从而延长铜缆连接距离;AOC(Active Optical Cable)由两端光模块和光纤集成,通过光缆传输高速信号。这三者因信号传输的核心部件与原理不同,导致功耗、距离、成本呈现出成倍递增的特点。以400G 速率为例,功耗方面,DAC、AEC、AOC 中有源芯片复杂度逐渐增加,功耗也逐级提升,分别为0.1、5、10W;传输距离上,对信号处理能力逐渐提升,有效距离也逐渐提升,分别为 2、7、100 米;成本上,有源芯片复杂度逐渐增加,成本也逐级提升,AEC、AOC 的成本分别为DAC的3倍、9倍。
东吴证券的报告指出,和光进铜退逻辑类似,由于距离、尺寸等差距,出现了铜缆内部有源(AEC)进无源(DAC)退的现象。因为 AEC 多出Retimer(广义上也算DSP),所以与 DAC 相比有效距离更远。例如,根据Marvell 的数据,单通道200G(一般对应1.6T)DAC最远为1m,单通道100G(一般对应1.6T)DAC最远2m,而Marvell/Credo的1.6T AEC 最远分别为3m/2.75m,800G AEC最远分别为5m/7m。同时,铜缆中的介质层可减少双绞线内两根铜缆的电磁干扰,当速率提升时,干扰增大,为减少干扰需要增大介质层体积。DAC没有 Retimer,就需要将介质层做得更大,所以线缆更粗,如单通道 100G、200G DAC 线径一般需为26 AWG(对应 0.4mm,AWG 为线径标准,值越小代表线缆越粗),而 AEC 可以做到 32AWG(对应 0.2mm),线缆越粗,做高密度连接的弯折、排线就越难。
目前,AEC 主要应用在Scale Up的柜间连接,比如亚马逊 Trn2-Ultra64 使用 AEC 柜间互联,ASIC 芯片与 AEC 配比为 1:1。需要注意的是,AEC 与 ASIC 两者的兴起有相关性而非因果性,其底层逻辑是计算与通信的再解耦,当云厂使用ASIC或英伟达 HGX 等,而非英伟达DGX方案时,完全来自英伟达的计算+通信方案也随之解耦,云厂便可以自主选择使用AEC。而且,AEC还有望向柜内与ToR层渗透。假设英伟达GB200 NVL72/8 柜内换用AEC,一枚B200对应4.5 支等效1.6T AEC;假如亚马逊Trn2 Ultra64 柜内换用AEC,一枚Trainium2 对应约3支800G AEC,决定配比的关键因素仍为单卡带宽及交换机层数;若AEC参与 ToR 层连接,和算力卡配比为 1:1。此外,与 DAC 产业链中连接器品牌方是最核心环节不同,Retimer 芯片供应商 + 品牌方成为 AEC 产业链中的主导方。
在 AI 计算时代,Scale Up、AEC 等技术和连接方案不断演进,它们相互关联又各自发展,在提升算力、优化通信等方面发挥着关键作用,未来也将持续影响行业的发展走向。
光纤在线公众号
更多猛料!欢迎扫描左方二维码关注光纤在线官方微信