以色列DriveNets 和中国台湾Accton 推出采用博通 ASIC 的 AI 网络解决方案

光纤在线编辑部  2024-10-16 10:07:10  文章来源:翻译整理  版权所有,未经许可严禁转载.

导读:开放式以太网解决方案包括 DriveNets Network Cloud-AI 软件和 Accton 的新型开放式网络白盒,采用 Broadcom 的 Jericho-3-AI 和 Ramon-3 DDC 预定结构架构。

10/16/2024,光纤在线讯,据DriveNets昨日官网消息,创新网络解决方案的领导者 DriveNets 和超大规模数据中心、人工智能和边缘计算先进技术的领导者 Accton Technology 今天宣布成功测试并推出两款基于 Broadcom 的 Jericho-3-AI 和 Ramon-3 ASIC 的新型白盒。DriveNets 和 Accton 是首批将带有新 Broadcom ASIC 的白盒用于商业 AI 网络的公司。

      该解决方案结合了 DriveNets 久经考验的大规模软件和 Accton 的白盒,并支持具有多达 32K GPU 的 AI 和 ML 集群,这些 GPU 与 800Gbps 接口相连。白盒基于 OCP DDC(分布式分解机箱)计划交换矩阵架构,提供可扩展的解决方案,该解决方案易于部署,并且可以随着公司的需求而增长。此架构成功通过了第 1 层 AI 客户的 POC。该解决方案满足了构建大型 GPU 集群的超大规模企业以及构建具有数千个 GPU 的大型 AI 集群的企业日益增长的需求。

      DriveNets 首席运营官 (COO) Ryan Donnelly 表示:“构建大规模 AI 集群的公司对新型 Broadcom ASIC 的需求很高,这些集群希望在不影响性能的情况下实现硬件多样性。“我们的软件支持新的 Accton 白盒,并为我们的客户提供基于开放以太网的 AI 网络替代方案,以替代 InfiniBand,而不会影响性能。”

      “Accton 带来了多年的工程和设计专业知识,迄今为止已交付数百万台设备。我们最新的符合 OCP 标准的开放网络白盒交换机将在 2024 年 OCP 峰会上展出,展示了当今 AI 后端所需的性能和可靠性,“智邦产品管理主管 Mike Wong 说。“DriveNets 的操作系统解决方案允许使用分布式分解机箱 (DDC) 拓扑实现该网络的弹性增长,该拓扑与旧的专有 InfiniBand 解决方案的性能相匹配。我们共同为超大规模企业、企业和所有 AI 构建者提供传统封闭硬件的高性能、开放标准替代方案。

经过验证的解决方案
新的 Accton 白盒包括:

·   NCP-5 (Accton ASA926-18XKE),基于 Broadcom 的 Jericho-3-AI ASIC,支持 18 个 800Gbps 网络端口和 20 个 800Gbps 结构端口

·   NCF-2 (Accton AS9936-128D),基于 Broadcom 的 Ramon-3 ASIC,支持 128 个 800Gbps 的交换矩阵端口

      在发布之前,白盒在智邦位于台湾的实验室中经过了严格的测试,使用了NCP-5s、NCF-2s、思博伦AI工作负载仿真解决方案和Intel Gaudi服务器,这些服务器在一个集群中运行BERT和ResNet模型,配备了32个GPU。测试结果显示,与以太网 Clos 架构相比,作业完成时间 (JCT) 性能提高了 30% 以上。此测试突出了 DDC 计划结构的架构优于其他以太网解决方案,与 InfiniBand 相当。

      思博伦提供的业界首个AI工作负载仿真解决方案,利用RoCEv2传输和集成的集体通信库(CCL)支持,大规模生成真实的AI流量模式,以识别可能导致网络拥塞、更高延迟和更低吞吐量的问题。该解决方案通过提供可重复的测试和可操作指标(如作业完成时间 (JCT)、尾部延迟、算法和总线带宽)来降低验证 AI 基础设施的复杂性和工作量,从而直观地诊断性能和效率问题,与构建真正的 xPU 系统相比,成本只是其中的一小部分。

      DriveNets 和 Accton 将于 10 月 15 日至 17 日在加利福尼亚州圣何塞举行的2024 年 OCP 全球峰会上展示测试及其结果。

参考链接:drivenets.com
光纤在线

光纤在线公众号

更多猛料!欢迎扫描左方二维码关注光纤在线官方微信

相关产品

微信扫描二维码
使用“扫一扫”即可将网页分享至朋友圈。