锐捷“零背板”创新故事

  在移动互联网、云计算、大数据等新技术推动下,国内数据中心产业飞速增长。在新一代数据中心建设的热潮中,各项新技术、新产品层出不穷。其中,一颗耀眼的新星近来频频获得大型企业及云数据中心提供商的青睐,这就是锐捷网络推出的新一代“牛顿”交换机——RG-N18018-X。该产品最大的特点,就是采用了“零背板”创新设计,实现了高密度、低损耗、绿色节能、平滑升级等一系列现代商业用户亟需的特性。
 
  “零背板”技术刚刚问世时,其特性便让不少用户抛来了橄榄枝。但是,说到将这项技术应用到100T的交换平台上,并实现普及化,业界此前却一直存在着争论,这是因为,“零背板”有着极高的制造工艺等技术门槛,因此被认为商业化量产的难度很大。
 
  那么,锐捷的研发人员又是如何迈过这个“高门槛”,打造出新一代的“牛顿”传奇呢?带着这个问题,我们采访了锐捷网络研究院的王兴国,解密了“零背板”诞生背后的故事。
 
  一颗脱落的铆钉
 
  “零背板”,顾名思义,就是无背板技术,在数据中心交换机设备里不再设计背板这个部件。表面上看,虽说只是去掉了交换机的一个部分,但由于背板在原有交换机架构中的核心位置,这对于网络设备厂商生绝对是一次全新的考验。首先就是在缺少背板支撑的情况下,如何确保机箱结构坚固,否则,在运输和安装过程中,都会对设备产生大幅振动,若强度不够,就会导致板卡断裂等严重故障。
 
  “振动测试是业内的通用标准,通常的做法是进行90分钟(X、Y、Z三个方向各30分钟)的振动实验,然后检测试验样品的包装,机械性能和电器性能。但由于没有了背板的支撑,我们特地用龙骨,加强筋等方法增加机箱强度。同时,在测试样品时,故意将时间延长到168小时,而就是在这多出来的166.5个小时里,我们发现有1颗铆钉断了。” 王兴国回顾了“零背板”新“牛顿”交换机在当初测试研发时的情况。那么,在几百颗铆钉中,为什么偏偏是这颗铆钉会被振断呢?
 
  为此,锐捷网络研究院的工程师们搭建了极为复杂的机箱模型,对内外的所有铆钉进行应力仿真测试,又通过了无数个小时的调整优化、数以亿次的迭代计算,终于找到问题的根源。他们通过引入新型材料,并改良应力结构,使得应力可以均匀分摊,最终彻底地解决了该问题。改良后的机箱经过高出业界百倍时间的震动测试,整机无掉件、零件脱落、异响等情况,大大提升了系统的可靠性。
 
  5厘米走线省下“一台大功率空调用电
 
  RG-N18018-X的单板支持36个100G接口,实现了单板3.6T的交换容量,整机最大提供576个100G端口或2304个25G端口,超过了同等尺寸设备接口密度的20%。如此高的性能,可以为用户业务提供更加轻松灵活的选择和应用支撑,不过同时也带来了新的技术挑战。
 
  王兴国表示:“通常这种超高速信号设计,都要增加物理层芯片(PHY)进行信号加强。但这种常规设计会导致整机要增加1728W的功率,相当于1个大功率空调。而我们新一代“牛顿”交换价,主打的特性之一,就是绿色节能。为了把这一目标实现并落地,我们必须要为客户省掉这1728W的功耗!“
 
  “通过反复模拟实验,我们发现必须让信号多走5厘米才能去掉这个耗能的物理层芯片。虽然5厘米是个看似很短的距离,但在超高速信号设计领域中确是很大的难关。”为了给用户交付一个绿色节能、性价比最高的产品,锐捷的工程师对几十种部件反复实验,最终选定了最佳的部件,并组合出一条特殊走线,赢得了这宝贵的5厘米,实现无PHY设计,节省了1728W的耗电量。
 
  0.035毫米与5级定位
 
  “CPU针脚弯了怎么办?”这是百度上非常常见的PC终端硬件技术问题,实际上,这一问题在交换机安装时也会存在。因为高性能需要更密的芯片针脚,而在“零背板”情况下,由于没有背板协助定位,这就对RG-N18018-X提出了前所未有的设计精度要求。否则,用户在安装设备和板卡升级时非常容易造成针脚变形,导致安装不到位、损坏甚至烧毁设备的故障。
 
  为此,锐捷针对这款“零背板”交换机特别设计出了5级定位系统,但是机箱生产完成后,是否能满足高要求的设计指标呢?“由于板长将近1米,常规适用该长度的测量工具只能达到0.5毫米精度,远不能满足我们的精度要求。新‘牛顿’采用了精度高达0.035mm的3D扫描技术,彻底排除设计隐患“。王兴国介绍到,“另外,考虑到用户升级或安装时的一些误差,锐捷工程师还特意找到100名非专业人员参与测试,结果表明,只要在外壳对准之后,针面的角度可以保证连接器偏差2°范围内自动导入连接匹配状态,未受过专业训练的用户都能保障在无损的情况下完成安装。”
 
  名牌大学生和“野蛮装卸员”
 
  通过介绍可以看到,要具备“零背板”优势,成为新一代的“牛顿”,需要经历诸多考验。而类似的故事还有许许多多,除了殚精竭虑的思考,其中很多更需要“身体力行”。
 
  “为了解决设备跌落可能导致的芯片焊球断裂的问题,同事们不但用软件仿真分析出了芯片的受力区域,摸清了跌落的重灾区,还需要进行大量的跌落实验。”王兴国说,很多人会经常看到一个小哥在锐捷研究院里面在摔包裹,举起来又扔下去,不断重复,常让路过的人以为是一个在野蛮装卸员在发泄心中不满,而实际上,他却是一位名牌大学毕业的优秀工程师。
 
  新“牛顿”的诞生需要这种锤炼和摔打,企业的创新发展之路同样如是。正是这种“工匠精神“下的高标准、高要求,让锐捷的工程师们迈过了高门槛,造就了零背板技术,保障了产品品质。