Google 的阿波罗计划- 利用光路交换扩展数据中心网络
发布时间:2024-07-03 10:24:20 热度:603
7/03/2024,光纤在线讯,文章来源:逍遥科技
简介
过去几十年来,超大规模数据中心的兴起彻底改变了全球互联网服务,促进了网络搜索、电子商务、社交媒体和云计算等领域的创新。最近,机器学习工作负载进一步强调了大规模数据中心计算能力的重要性。数据中心网络是这一切的核心,提供了高效执行这些功能和服务所需的连接性和规模。
传统的数据中心网络架构
传统的数据中心网络采用基于数据包的 Clos 拓扑,也称为 ”脊叶架构”。在这种架构中,机架上的计算服务器连接到机架顶部(ToR)的叶子交换机,然后通过汇聚层连接到以太网分组交换机(EPS)的脊柱。虽然这已成为行业标准,但 EPS 设备耗电量很大。图 1a 展示了一个传统的数据中心网络,其中基于 EPS 的骨干块连接汇聚块 (AB),ToR 交换机使用并行光纤与 AB 相连。
引入光路交换
作为一种替代方案,研究人员探索将光路交换机(OCS)纳入数据中心网络。OCS 设备具有以下几个优点:
1. 数据速率和波长无关
2. 低功耗
3. 低延迟
基于 MEMS 的 OCS 系统使用倾斜镜阵列将光线从输入端口转向输出端口(图 4),在以合理的成本扩展到数据中心所需的高端口数方面前景最为广阔。
然而,数据中心的要求对 OCS 硬件提出了挑战:
- 更快的开关时间(商用 OCS 通常为 10-20 毫秒)
- 更低的插入损耗和回波损耗
- 宽波长范围操作
- 严格的非阻塞架构
- 更低的成本
图 1. 网络架构的演变
谷歌的阿波罗 OCS 平台
谷歌的 Apollo 代表了 OCS 在数据中心网络中的首次大规模部署。在近十年的生产过程中,Apollo 已成为谷歌数据中心的骨干网,支持所有使用案例。
Apollo 平台的关键组件包括:
- Palomar: 谷歌内部开发的 OCS
- 光环行器
- 支持双向链接的定制波分复用光学收发器
在 Apollo 的架构中,OCS 层取代了 EPS 主干块,通过配线架连接叶交换机(图 1b)。这种直接连接拓扑结构的功能是光交叉连接,而不是分组交换。
使用波分复用器和单模光纤环行器,可在每个 OCS 端口/光纤上实现全双工通信,与使用并行单模光纤相比,效率提高了一倍。OCS 层的布置为传统的静态 Clos 网络提供了灵活性。
谷歌阿波罗 OCS 的优势
谷歌通过创新克服了 OCS 的典型缺点:
1. 高昂的前期成本 - 数据中心需求的增加可以通过规模经济降低成本。
2. 插入损耗 - Apollo 的 136x136 OCS 无阻塞,功耗仅为 108W,而同等 136 端口的 EPS 功耗为 3000W。
3. 重新配置速度慢 - 交换速度更快,灵活性更高。
4. 缺乏插件支持 - Apollo 可向前和向后兼容谷歌数据中心的任何带宽或波长。
未来发展方向
为满足不断发展的数据中心网络需求,光互连技术发展的关键领域包括:
1. 端口数更多的 OCS,以提高扩展性和拓扑灵活性;
2. 速度更快、成本更低的 OCS,可应用于较低的网络层
3. 提高可靠性和可用性,适用于更大的故障域
4. 降低插入损耗和回波损耗,扩展光互连路线图
结论
谷歌的 Apollo 平台证明了在数据中心网络中大规模部署 OCS 的可行性和优势。通过在基于 MEMS 的交换、定制收发器和网络架构方面的创新,Apollo 提供了灵活、低功耗和高性价比的连接解决方案。随着数据中心带宽需求在 ML 和云计算的推动下不断增长,OCS 技术将在扩展和优化这些网络方面发挥越来越重要的作用。
参考来源
https://www.linkedin.com/pulse/mission-apollo-landing-optical-circuit-switching-scale-kumar-piyush-ogyqc/
简介
过去几十年来,超大规模数据中心的兴起彻底改变了全球互联网服务,促进了网络搜索、电子商务、社交媒体和云计算等领域的创新。最近,机器学习工作负载进一步强调了大规模数据中心计算能力的重要性。数据中心网络是这一切的核心,提供了高效执行这些功能和服务所需的连接性和规模。
传统的数据中心网络架构
传统的数据中心网络采用基于数据包的 Clos 拓扑,也称为 ”脊叶架构”。在这种架构中,机架上的计算服务器连接到机架顶部(ToR)的叶子交换机,然后通过汇聚层连接到以太网分组交换机(EPS)的脊柱。虽然这已成为行业标准,但 EPS 设备耗电量很大。图 1a 展示了一个传统的数据中心网络,其中基于 EPS 的骨干块连接汇聚块 (AB),ToR 交换机使用并行光纤与 AB 相连。
引入光路交换
作为一种替代方案,研究人员探索将光路交换机(OCS)纳入数据中心网络。OCS 设备具有以下几个优点:
1. 数据速率和波长无关
2. 低功耗
3. 低延迟
基于 MEMS 的 OCS 系统使用倾斜镜阵列将光线从输入端口转向输出端口(图 4),在以合理的成本扩展到数据中心所需的高端口数方面前景最为广阔。
然而,数据中心的要求对 OCS 硬件提出了挑战:
- 更快的开关时间(商用 OCS 通常为 10-20 毫秒)
- 更低的插入损耗和回波损耗
- 宽波长范围操作
- 严格的非阻塞架构
- 更低的成本
谷歌的阿波罗 OCS 平台
谷歌的 Apollo 代表了 OCS 在数据中心网络中的首次大规模部署。在近十年的生产过程中,Apollo 已成为谷歌数据中心的骨干网,支持所有使用案例。
Apollo 平台的关键组件包括:
- Palomar: 谷歌内部开发的 OCS
- 光环行器
- 支持双向链接的定制波分复用光学收发器
在 Apollo 的架构中,OCS 层取代了 EPS 主干块,通过配线架连接叶交换机(图 1b)。这种直接连接拓扑结构的功能是光交叉连接,而不是分组交换。
使用波分复用器和单模光纤环行器,可在每个 OCS 端口/光纤上实现全双工通信,与使用并行单模光纤相比,效率提高了一倍。OCS 层的布置为传统的静态 Clos 网络提供了灵活性。
谷歌阿波罗 OCS 的优势
谷歌通过创新克服了 OCS 的典型缺点:
1. 高昂的前期成本 - 数据中心需求的增加可以通过规模经济降低成本。
2. 插入损耗 - Apollo 的 136x136 OCS 无阻塞,功耗仅为 108W,而同等 136 端口的 EPS 功耗为 3000W。
3. 重新配置速度慢 - 交换速度更快,灵活性更高。
4. 缺乏插件支持 - Apollo 可向前和向后兼容谷歌数据中心的任何带宽或波长。
未来发展方向
为满足不断发展的数据中心网络需求,光互连技术发展的关键领域包括:
1. 端口数更多的 OCS,以提高扩展性和拓扑灵活性;
2. 速度更快、成本更低的 OCS,可应用于较低的网络层
3. 提高可靠性和可用性,适用于更大的故障域
4. 降低插入损耗和回波损耗,扩展光互连路线图
结论
谷歌的 Apollo 平台证明了在数据中心网络中大规模部署 OCS 的可行性和优势。通过在基于 MEMS 的交换、定制收发器和网络架构方面的创新,Apollo 提供了灵活、低功耗和高性价比的连接解决方案。随着数据中心带宽需求在 ML 和云计算的推动下不断增长,OCS 技术将在扩展和优化这些网络方面发挥越来越重要的作用。
参考来源
https://www.linkedin.com/pulse/mission-apollo-landing-optical-circuit-switching-scale-kumar-piyush-ogyqc/