应用分享丨光交换在云计算和HPC基础设施解耦应用

光纤在线编辑部  2024-10-08 12:19:58  文章来源:原文转载  

导读:随着人工智能等应用进入商业主流,云计算和高性能计算(HPC)服务提供商面临巨大压力,需扩展计算平台以满足不断增长的性能需求。同时,在环境压力和电力需求激增的双重挑战下,这些供应商需探索控制资本支出(CAPEX)和降低能耗的策略。大语言模型训练、医学图像处理等应用推动了对高性能云计算网络的新要求,进而促使GPU等加速器在集群中广泛应用。

10/08/2024,光纤在线讯,随着技术的演进,传统的服务器结构正逐步被解耦计算平台所取代。这些平台按需将资源以特定比例捆绑成“裸金属”硬件主机,实现灵活配置。这一过程可视为“硬件虚拟化”,允许多个物理主机在需要时动态组合,通过专门的编排功能控制,共享底层资源池。这些平台支持单一或多租户使用,通过“软件虚拟化”或云技术提供虚拟机(VM)服务。

关键构建块包括CPU、内存、存储及加速硬件如GPU和FPGA,用于支持高性能或通用云计算应用。在上图中,"Composed Machine #1" 是基于四个CPU单元构建的,这些CPU单元来自资源池中的"Server #1"和"Server #2",以及四个RAM单元,只从"Server #1"获取。在"Server #1"中,有两个GPU资源单元,如果在非分解平台上,这些资源将会被浪费和未使用,但在这种情况下,它们被用来提供"Composed Machine #2" 所需的一半GPU资源,另一半来自"Server #2"。



解耦实现的效率和性能优化取决于可以访问和消耗资源块的粒度。在最细粒度下,每个资源块都具备板载硬件以实现高速、低延迟的连接。这虽需新的硬件设计,但提供了最大灵活性。同时,也存在较粗粒度的解耦形式,与当前硬件更兼容,可作为向完全解耦平台过渡的桥梁。

在解耦计算平台中,选择合适的互连网络技术对系统性能和能耗至关重要。常见的互连形式有分组交换和线路交换。线路交换提供确定性、电路交换和固定带宽的数据路径,特别适用于那些原本在服务器主板上低级直接连接的硬件资源,或通过特定总线技术(如PCI Express)连接的硬件资源。

光互连网络技术的核心优势

使用光电路交换技术构建的全光互连网络,也称为全光交换,能够满足确定性和高容量端到端数据路径的需求。光互连网络的优势包括:
1、降低功耗:与电互连相比,光互连结构的功耗显著降低。
2、降低时延:光传输路径的时延更低。
3、易于扩展和升级:光互连网络物理扩展和升级能力更强。
4、透明性和兼容性:对解耦资源间的串行数据流量格式和线路速率具有固有透明性,支持未来平滑升级。

在光链路通过交换网络时,最小化或消除前向纠错(FEC)对于减少端到端延迟至关重要。这要求光交换技术具有尽可能低的损耗,以确保最佳的误码率性能。



光电路交换技术的可扩展性源于可以使用低损耗的光路交换机构建多级交换网络,从而支持大量终端。例如,POLATIS DirectLightTM交换机允许构建四个或更多级别的交换网络,而不会超出典型收发器的光学损耗预算。这使得光交换结构可以按需增长,在初期采用少量OCS进行架构设计和构建,用户可以根据实际需求逐步扩展OCS规模,降低初期投入成本。


POLATIS 384x384 with LC connectors


实践探索:dReDBox项目与解耦计算的概念验证

从2016年至2019年,HUBER+SUHNER Polatis作为成员单位,参与了由工业界和学术界合作伙伴组成的联合项目dReDBox。该项目由欧洲委员会资助,旨在探索智算中心的计算资源解耦。项目期间成功展示了硬件原型、编排软件和用户应用程序。



上图项目硬件原型展示了单块板卡可容纳多达16个细粒度资源块(称为“砖块”)。每个“砖块”配备了高容量、多通道、基于硅光的板载光学收发器阵列,使得这些砖块资源可以通过一个可扩展、低损耗的光路交换机进行互联共享,参考下图。



解耦计算带来的显著益处

通过使用专用的交换结构灵活地互连资源,解耦计算带来了多种显著的益处:
1、即时组合硬件计算平台:可以根据需求即时组合不同硬件资源。
2、灵活扩展计算平台:可根据工作负载的特性,灵活地扩展计算平台的规模和资源配置。
3、动态调整计算平台大小:在运行特定工作负载的过程中,可以根据需要调整计算平台的大小。
4、节省运营成本(OPEX):可以关闭不需要的资源,节省运营成本。

运营商的优势包括:
1、选择最佳硬件:可以选择不同供应商提供的最优质硬件。
2、按需升级:可以按需升级不同类型和/或资源块。

这些优势带来了显著的资本支出(CAPEX)节省,并减少了在硬件更换计划期间的服务停机时间。最近,一家超大规模互联网企业发表多篇论文,介绍了在数据中心内部基于数据分组的交换结构中混合采用OCS光路交换技术,获得了类似的收益。

因此,解耦平台在服务云计算和高性能计算(HPC)提供商中更为适用,能够更有效地应对各种需求。硬件组件可以独立升级,而编排软件完全由运营商控制,解耦可以被视为从硬件定义的基础设施(HDI)向更加灵活的软件定义的基础设施(SDI)过渡的关键推动者。

随着商业产品的开发,以光路交换为核心的云计算/HPC平台解耦已经逐渐成熟。通过概念验证和众多模拟预期系统性能特征和运营成本的学术研究,可以清楚地看到运营此类基础设施的益处。

技术亮点:POLATIS®专有光纤交换技术的独特优势

POLATIS®在解耦方面相较于其他全光(OOO)切换解决方案具有显著优势,包括:

最低的光损耗和卓越的稳定性。
最广泛的对称(NxN)交换机系列:矩阵规模从16x16到576x576端口,支持网络解耦不断发展的需求,同时模块化扩展性可连接数千个光纤端点。
高密度交换矩阵:占用极少的机架空间。
协议和数据速率无关:可切换任何类型的信号。
单一连接的切换时间<50毫秒。
几乎零信号时延:实现最快资源传输。
真正的暗光纤切换:无需光线即可建立和保持连接,可预配未来路径。
完全软件控制:可与领先的编排解决方案无缝对接。
支持最广泛的SDN接口:包括NETCONF和RESTCONF。
高可靠性:适用于关键任务应用,配备双冗余、热插拔网络接口控制器和电源。
新款POLATIS 576x576交换机:具有双冗余控制器和可选的现场可寻址备用端口,增加了可靠性。
环保低功耗:可平衡解耦机架的高功率密度。



光纤在线

光纤在线公众号

更多猛料!欢迎扫描左方二维码关注光纤在线官方微信
微信扫描二维码
使用“扫一扫”即可将网页分享至朋友圈。