天蝎3.0是天蝎2.0的演进。天蝎2.0对电、热、管理等进行了池化,极大的提高了部署效率。在天蝎3.0中,计划对计算、存储和网络等核心功能做解耦,进行资源池化。这样不仅能更加灵活弹性得满足各种上层业务的发展,也对成本进行了有效缩减,满足未来的部署需求。
腾讯高级技术经理刘超对天蝎3.0的最新技术进展做了分享。
本次分享的主要是关于RBP的最新设计细节。RBP全称机柜背板(RackBackPlane),它是机柜管理系统的重要部分,是连接RMC、服务器节点和风扇的枢纽。在天蝎3.0中,RBP将承担更多的工作。
基于资源池化的考虑,天蝎3.0对RBP做了重新定位和设计。在降低风扇框高度(风扇高度不变)之后,RBP置于风扇墙上,每4U放置一块。每个RBP上配备了8个连接器,能满足覆盖4U高度、1U2节点的服务器连接要求。此外,RBP还可以选配了多个万兆BASE-T接口和多个HDMI接口,实现高速网络通信功能。
目前RBP上选用的是4*12的高速信号连接器模块,最高可以支持25G的网络接口。还可以通过增加光电转换模块、ShareNIC和PCIe等技术,实现更多更复杂的接口功能。
在RBP上增加了锁定结构。为放置误拆风扇框架造成整个连接中断,同时增强风扇框到整个机柜的锁紧力,最新设计增加了整个风扇机框上的锁紧结构。当RBP模组、RBP外壳压迫弹销,使其插入机柜。锁紧风扇模组,仅当RBP板拔出后,弹销回弹,此时才能抽出整个风扇模组。而更换单体风扇将会不受影响。
其他部分尽量采用已有设计,不仅对整个机柜结构改动小,也便于设备的更换和维护。“兼容天蝎2.0是我们需要重点考虑的问题”,刘超表示,“目前理线架有前置和后置两种方式,装在机柜后面可以满足后出线的方式,装在前面可以兼容现有的天蝎2.0”。
对于RBP的新设计,已经联合相关厂商进行了信号质量和散热等方面的仿真,目前来看效果还不错。英特尔高级技术经理龚海峰建议,考虑到后续计算能力的提升对网络带宽要求的不断提高,应该尽早对这种设计进行PCIe4.0的仿真。
RBP的重新设计是天蝎3.0的一个重要改变。“未来天蝎的发展方向,可能是尽量实现节点的统一,而在RBP上体现服务器的差异性”。