11/07/2024,光纤在线讯,AI的广泛应用推动着数据中心网络架构和光互联技术正经历着一场革命性的变革。AI浪潮驱动海量数据处理需求快速增长,算力需求的提升除了依靠GPU卡等核心硬件的性能提升,还需要更高的系统通信和网络通信能力作为支撑。
“AI集群的低利用率问题日益凸显,而光互联网络延迟和带宽不足不仅影响AI训练的效率,还影响故障恢复的时间。SerDes凭借高数据传输速率和低功耗特性,成为数据中心内部连接和外部通信的首选方案。”Credo销售副总裁杨学贤介绍说。
Credo自2008年成立以来,凭借其核心的SerDes IP技术,已成功提供一系列光互联解决方案,包括Line Card PHYs、光DSP、HiWire AEC、SerDes IP授权、2.5D/MCM Chiplets及P3(Pluggable Patch Panel),覆盖从芯片间(Die-to-Die、Chip-to-Chip)到机架间(Rack-to-Rack、Module-to-Module)的各个节点,满足了不同层级的数据传输需求,为数据中心的高效运作提供了强有力的支持。
AEC为AI高速高密度连接而生
AEC是Credo于2018年推出的创新性产品,当时许多人并没有意识到,这是一个很有价值的产品。在经过四、五年的发展之后,AEC改变了行业的一些规则。如今,AEC凭借其低功耗、轻便、高可靠性、标准化及兼容性,在数据中心高速光模块市场中占据了独特的竞争优势。AEC系列产品也成为Credo业绩重要来源之一。
AEC是一种高性能铜缆解决方案,其独特之处在于两端均集成了基于Credo专有铜DSP技术的Retimer,负责实现端到端的信号传输。使用AEC时,系统仅需将信号传输至线缆的一端,大大简化了信号处理流程。客户对于端到端信号质量的保障一直有着高度关注。
与传统无源DAC乃至某些场景中的AOC相比,AEC的优势显著:
1. 低功耗特性:采用Credo业界低功耗著称的DSP技术,400G AEC的单端功耗约为5瓦,相较于400G光模块,功耗降低了约50%。
2. 轻便与灵活性:相较于笨重的无源DAC,AEC更轻巧、更细,便于弯曲和卷盘。在机架部署中,AEC的轻便特性使得布线更为简便,且不会阻碍机架内空气流通,影响散热,从而提高了机架的管理和使用效率。
3. 独特的功能优势:AEC在线缆端头内置Credo低功耗DSP芯片,可实现传输速率的转换。如AEC能够将一端的单通道50G信号转换为另一端的单通道100G传输速率。
4. 长寿命与高可靠性:由于AEC不含光学组件,其使用寿命长,可靠性极高,甚至可达无源DAC的100倍。AEC的有源设计使其不含易碎部件,更加坚固耐用,无论是在安装时的弯曲、盘卷,还是在日常使用中的踩踏,都能保持性能稳定。
5. 标准化与兼容性:AEC符合IEEE标准,具有广泛的应用兼容性,可以无缝接入任何交换机和系统。
过去,AEC线缆产品已经在一些北美互联网大厂的AI应用中得到了使用。如今,国内互联网企业看到了AEC在AI应用中的价值,他们开始关注怎么把AEC用到国内数据中心中。在中国市场,许多大型数据中心运营商正在寻找能够支持128x400G端口的交换机以及2X200G NIC卡的连接方案,Credo推出HiWire SHIFT AEC以满足其需求。
“我们今年专门针对中国市场AI/ML网络连接需求,根据其数据中心的速率、场景差异性和限制,开发了专门针对国内需求的、适用于400G Q112网络接口的HiWire SHIFT AEC(有源电缆Active Electrical Cables)新系列产品。包括400G QSFP-112、200G QSFP-56和200G QSFP-112等多种速率产品,以支持低功耗和高可靠性的需求,满足AI服务器与交换机之间的高速互连。”杨学贤介绍说。
Credo的营销副总裁Chris Collins详细介绍了HiWire SHIFT AEC产品系列,该系列产品支持从100G到1.6T的广泛速率范围。他强调,与AOC产品相比,AEC在成本和功耗方面具有显著优势,这主要得益于其集成了Credo自主研发的、采用先进DSP技术的retimer芯片的有源电缆设计。
在AI和机器学习(ML)领域,AEC因其比光缆高出一个或两个数量级的连接可靠性而受到互联网巨头的青睐。这种高可靠性的连接解决方案帮助客户显著提升了算力集群的利用率,从而在数据中心的高性能计算和大数据处理中发挥了关键作用。
Chris Collins还指出,AEC的这些优势不仅降低了客户的总体投入成本,还提高了数据中心的能效和可持续性,助力客户构建更加高效、可靠的数据中心网络,以支持他们日益增长的计算需求。
最全DSP系列,满足多种AI场景需求
作为一家专注于多标准SerDes IP及Chiplet解决方案的公司,Credo已成功开发出单波通道50G~100G的DSP芯片,以满足AI时代400G/800G光模块需求。
Seagull系列是单通道50G DSP,采用第四代完全DSP架构,集成VCSEL驱动器,针对大规模生产进行成本优化,可满足于100G/ 200G/ 400G高速光模块用于服务间、交换机间的连接。
Dove系列为单通道100G DSP,可提从集成VCSEL/ 硅光SiPh和EML驱动器,应用于800G单多模光模块及AOCs有源光缆。
Dove850是世界上第一款针对 LRO 应用优化的 DSP产品。在收端移除了DSP,但在发射端保留,可以节省一半的 DSP 功耗,且保持了非常好的网络性能。800G光模块,LRO的功耗可低于10 瓦,相比完整 DSP的 800G光模电块(14 ~ 15 瓦),可节省 40% ~ 50%的功耗,且符合IEEE标准,易于大规模部署。
Dove480是一款可以实现不同时期网络连接的多功能DSP,支持正向和反向两种工作模式,以适应当前数据中心架构的多样性。在许多应用场景中,客户需要在同一系统中同时支持单通道50G NIC连接到单通道100G交换机端口。以中国市场为例,许多客户使用的是51.2 T交换机,该交换机拥有128个400G端口;而服务器网络端口可能是8 x 50G。尽管两者的端口速率都是400G,但它们不能直接相连。可采用Dove480的反向模式创建一个具有4 x 100G电端口和8 x 50G光端口的收发器。接着,通过使用标准的400G SR收发器,可以将这些端口与8 x 50G的服务器连接起来。Dove480的这种灵活性使其能够实现不同代设备之间的互联。因此,随着数据中心在不同时间对网络的不同部分进行升级和操作,Dove480因其能够适应多种连接需求而在行业中变得越来越重要。它不仅提高了设备的兼容性,还为客户提供了更多的灵活性和便利,以支持他们不断演进的网络架构。
“高速SerDes芯片的设计是一个复杂的过程,它不仅需要跨领域的专家团队紧密合作,还需要强大的资金作为后盾。Credo在这方面具备显著优势,拥有充裕的资金来推动其下一代产品的研发和创新。2022年1月,Credo成功在纳斯达克上市,通过首次公开募股(IPO)筹集了2.20亿美元的资金。去年12月,公司通过增发股票再次筹集了1.75亿美元。这一系列的资金注入为Credo在下一代224G DSP芯片的开发上提供了坚实的财务基础。Credo有望在下一代产品的开发上取得更多突破,进一步巩固其在行业中的领导地位。”展望未来,杨学贤补充说。
16年的SerDes IP技术打磨 Credo的相信
在讲到Credo的品牌故事时,杨学贤介绍说:Credo在英文、意大利语和拉丁语里面是believe,所以Credo相信员工、团队,通过日积月累地打磨非常有竞争力的、适合客户需要的、能够给客户带来很多创新和价值的产品。相信带领Credo一直往前走的领导团队,由经验资深、IEEE荣誉技术专家组成的核心的技术团队,带领Credo不断创新。一方面,在设计时平衡好性能、功耗和尺寸,以及实现大规模生产制造等关键指标。依托其特色的创新设计,从28nm到16nm、12nm不断提升和优化,今天已经采用先进的7nm、5nm工艺的DSP,未来还将推出基于3nm工艺的DSP新品。另一方面则不断地打破可量产产品的插损极限,从20dB提升到35dB,再到40dB和45dB,今天40dB SerDes已经够量产了。
回顾Credo的发展历程发现,Credo在过去的15年里做了很多的产品,所有的产品都是基于其独有的低功耗、高性能、小尺寸的SerDes IP,开发出包括线卡PHY、光DSP、有源电缆(AEC),以及IP授权和小芯片(chiplet)等等。以下是Credo发展历程中的关键年份和重要事件回顾:
Credo在2008年创立时,目标是完成56G PAM4的SerDes,彼时业界更多关注于NRZ,因此Credo的坚持和投入是一个相当漫长的过程。
2015年,Credo推出其首款产品,并且被第一家客户使用,这是一款PHY Retimer产品。到目前为款,PHY Retimer芯片系列依然是Credo非常稳定增长的产品线,并为未来更广泛的产品系列打下了坚实的基础。
2018年,Credo的Chiplet产品已经量产,并广泛应用于数据中心交换机,甚至人工智能的超算集群。
2019年,Credo开启了光系列产品—DSP系列,从此Credo的新品推进计划加速,每年推出新一代的DSP产品。截止目前,Credo已经完成了五代光DSP产品,距离全球最先进的友商越来越近,并坚持创新形成自身的特色工艺,帮助客户实现更佳的性能。
2020年,基于Credo的Retimer / DSP芯片产品, Credo再次推出了业界创新的AEC的产品,应用于400G、800G和1.6T及以上的高速光连接,相比于DAC和AOC产品,AEC拥有着轻便、高速率、可持续迭代等诸多优势。今天,越来越多的用户看到了AEC电缆在AI应用中独特的价值,继北美互联网公司之后,国内互联网企业也开始关注如何把AEC用到国内数据中心中。因此,在今年,Credo专门针对国内数据中心市场,推出了适用于400G Q112网络接口的HiWire SHIFT AEC新系列产品。
2023年,Credo再次发布创新的Pluggable Patch Panel产品,用于不同速率、不同端口的光模块的连接,以解决整个系统级互联的问题。
2024年,为了进一步解决AI集群在扩大规模和提升速率的同时,保持更好的能耗问题,Credo推出了线性接收光路(LRO)的解决方案。
在不久的将来,Credo仍在努力推新,预计2025年将发布支持1.6T光模块的单波200G DSP产品。