阿里云披露了在其边缘位置运行网络的硬件设计,以及这些设备对英特尔Tofino ASIC的依赖.
这家中国云冠军在4月份举行的第21届USENIX网络系统设计与实现研讨会上披露了其技术,并在一篇题为《洛神:多租户多服务边缘云的超融合可编程网关》的论文[PDF]中披露了这一技术.
阿里巴巴云的材料将罗神描述为一台“服务器交换机”,并透露这些设备已经在“数百个边缘站点”投入生产两年.
这些盒子是2U的,这是一项重要的成就,因为中国云的边缘位置采用了42U的机架,而奥组委希望它能装满可以租用的服务器,而不是网络套件.
罗深盒子包含一个处理器、一个现场可编程门阵列(FPGA)和Tofino--Chipzilla建议用于提高网络性能的英特尔以太网ASIC,因为它是可编程的.
阿里巴巴的盒子托管着与其云中运行的相同的网络功能.
为了将它们都放在一个2U盒子中,这家云公司创建了一条它所说的依赖Tofino处理无状态云网络功能的新型管道.
状态处理由CPU处理,由FPGA加速.
所有流量都将通过Tofino流水线,然后由融合的底层设备转发到外部网络或分发到CPU/FPGA.
文章解释说,在洛神,Tofino的64×100G端口被分成不同的用途.
一些端口直接连接到服务器来接收VM流量,一些端口连接到[名为]BSW的交换结构用于互联网访问和跨区域通信,一些端口连接到本地IDC[互联网数据中心],一些端口连接到CPU和FPGA进行后备和有状态的流量处理.
Tofino是交通警察:它根据需要将流量发送到CPU和FPGA,在这些设备完成工作后,Intel ASIC进行进一步的处理,以确保数据包到达目的地.
罗深盒子有许多不同的流量要处理,由于阿里巴巴边缘的虚拟机可以与同一机架或虚拟私有云中的机器聊天,也可以与不同阿里云区域的虚拟机聊天,或者与互联网上的资源聊天.
因此,Tofino的可编程性是关键,因为这意味着阿里巴巴已经能够定制ASIC来实现其网络功能和将其打包到边缘设备中的要求.
此外,罗深还可以通过其他方式进行定制,因为FPGA当然是可编程的.
由于芯片是可插拔的,阿里云也对用其他设备取代它持开放态度.
然而,CPU可能不那么灵活.
这份白皮书指出,它是连接在网卡上的,这表明罗深使用了智能网卡/数据处理单元.
无论里面是什么,结果都令人印象深刻.
阿里巴巴云的报告称,罗深实现了1.
2Tbit/秒的吞吐量,与之前使用的在其边缘位置部署多个网络设备的“角色拆分架构”相比,其前期成本、部署规模和功耗分别降低了75%、87%和60%.®.