7月12日,浪潮在北京发布了面向智慧计算,聚焦云计算、大数据、深度学习(简称CBD)应用场景的新一代服务器M5系列,涵盖通用、应用优化、关键业务和融合架构4个系列,共计35款产品。
发布会上,浪潮提出了“场景化极致设计”的概念,场景化设计就是从部署环境和应用环境的具体需求出发,在密度、能耗等物理设计上,以及计算、存储和I/O配比等逻辑设计上,进行极致化的产品定义和产品实现。这是在服务器产业第一次提出的设计概念。
面向CBD应用的浪潮M5新一代服务器全新发布
均衡式设计——硬件与应用的松耦合
传统互联网以及更早的时代,服务器都是采用均衡的设计原则:即计算、存储、I/O等三类资源要均衡;性能与可用性之间要平衡;能耗与能效之间要平衡。这种中庸之道的设计原则,其实更应该称之为通用设计原则,这种原则设计的服务器就叫通用服务器。
通用是过去几十年保证软硬件产业发展的基本规律之一。一方面,自上世纪五六十年代实现了软硬件分离以来,软件和硬件的标准化和分离程度越来越高,最后形成了两个独立性很高的产业,除了接口标准外,相互之间几乎没有影响。
另一方面,从计算机产业开始到现在一直是通用时代,所有的企业都在追求一款产品满足万千用户需求,只有这样才能最大程度上取得规模效应。在这样的规则下,计算机硬件则普遍采用了通用设计原则,尽量用少数几款产品去承载所有类型的应用,至于数据中心的部署需求更是很少考虑。
智慧计算下的数据丰富型应用挑战
通用时代的结束的标志是云计算、大数据等新一代信息技术出现,技术时代的更替使得通用设计原则不再适合时代的需求。
云计算、大数据以及AI等新一代信息技术的发展和普及,使得人类社会从信息化向智能化升级,社会计算的形态发生深刻变革。除了传统的计算丰富型应用之外,大数据、深度学习等数据丰富型应用发展更快,这些计算形态与云计算进行融合,形成新的计算形态——智慧计算。
智慧计算是未来计算发展的最主要形式
在移动终端、5G、物联网的推动下,联网服务和设备快速增长,数据无处不在、无孔不入,指数增长的数据金矿在不断加速数据丰富型应用的发展,让数据丰富型应用成为与计算丰富型应用规模相当的应用形式。
数据丰富型应用的发展打破了软硬件松耦合式的发展模式。数据丰富型应用,如深度学习、大数据等,对于计算力的需求是无限的,而且需要的是同构、低精度的规模化计算力,传统的以CPU为计算中心的服务器已经不能满足。以深度学习为例,训练数据集的规模不断膨胀,模型参数也在不断膨胀,几十亿参数、几百层的神经网络模型已经出现。
但是数据丰富型计算和应用,仍然处于发展和应用的初期,大数据技术可以仅仅能够完成数据存储、管理和基本的查询,利用程度很低,深度学习可以帮助人类海量数据中获得知识,获得深层洞察力,但是目前的应用场景仍然有限。从数据利用率看,人类产生数据仅有不到1%得到了利用。随着数据处理规模和数据处理深度的增加,以及数据处理方法的创新,数据丰富型应用会逐步显示出发展的潜力。
数据丰富型计算对于服务器设计思想的冲击是显而易见的,目前,普遍的观点认为,大数据和深度学习的发展,需要“异构加速”计算方案,仍然将GPU、MIC、FPGA等计算技术看作是CPU通用计算的补充技术。而在深度学习中,CPU仅负责的逻辑计算,承担了很小比例的负载,而GPU等负责机械计算,承担了最大的负载。可以设想,随着数据丰富型应用的发展,GPU等计算技术有望摆脱补充地位,成为与CPU并列的计算平台技术。
场景化的设计——云计算发展的必然结果
另一方面,通用服务器的挑战源于云计算的发展。云计算应用的发展使得社会计算空前集中,大量自建自用的私有数据中心被大规模、超大规模数据中心所替代。根据Synergy Research Group的最新数据,截止2016年12月,全球可部署10000个标准机架的超大型数据中心已超过300个,可容纳的服务器数量远远超过了2016年全球服务器总出货量。与此同时,运营商背负着巨大的资本和成本压力,2016年亚马逊、微软以及谷歌去年在资本支出和资本租赁上的总花费为 315.4 亿美元,同比增长 22%,大部分用于数据中心方面的支出。
运营商要降低成本和实际业务压力,具体到服务器层面,就是提高密度,简化运维,提高灵活性,降低能耗,降低整体成本。所以,近年来,运营商采购的服务器形态从传统的机架式到超密度、刀片、整机柜等新形态快速演进,部署性有了根本性改变,密度不断提高,整体能耗快速下降,单位数据中心面积占用的维护人力成本不断减少。
浪潮整机柜服务器
在追求能效、密度、可维护性的道路上,云数据中心对服务器的设计要求是极致化的,因为巨大的部署规模,很多细微的创新或者变动,都会带来巨大的成本节省。浪潮服务器的电源工程师曾说过一句话“一瓦100块钱”,也就是服务器能耗每降低1瓦,整个生命周期节省的电费超过100块人民币,一个容纳10万服务器的数据中心因此可以降低1000万以上的电费支出。
“应用+物理”两个方向的极致化
可以看出,极致化的设计本质是最大程度上满足两类需求——部署需求和应用需求。面向应用提供最贴合的系统平台,是浪潮设计服务器的第一原则,满足应用需求的情况下,然后考虑如何实现最优化的能效、密度等物理表现,所以,极致化的设计就是在一定扩展性、可用性等逻辑约束内,追求最大的性能、密度、能效等物理设计的过程。
浪潮M5新一代服务器家族全景图
浪潮M5新一代服务器4个系列很好的体现了极致化的设计原则。通用和关键业务是“历史传承”系列,针对传统的企业应用,这两个系列在空间占用方面也有了明显的提升,八路服务器天梭 TS860M5高度为4U,四路服务器NF8260M4高度为2U,仅有上一代产品的一半。
应用优化和融合架构都是针对云计算、智慧计算等新兴应用的系列,密度、能效和易维护性等物理属性十分突出,适合云数据中心部署,可提供极致优化的整体成本。
而且,针对大数据、深度学习等新兴的数据丰富型应用的产品,在存储、异构扩展性等方面突破技术平台的限制,提供远超于一般产品的物理存储容量和异构计算能力。例如,深度学习专用服务器NF5288M5在2U空间内可支持8块GPU,具有极致的性能空间比,是全球最高计算密度、最高性能的AI服务器。
浪潮NF5288M5是全球最高计算密度、最高性能的AI服务器
融合架构产品线,是下一代数据中心模块化解决方案,包含多子星、刀片和整机柜等多种形态,适合于传统数据中心改造、新建的云数据中心部署等多种场景。其中整机柜产品能够将数据中心部署速度提高10倍以上,大大提高了数据中心的灵活性。
不断接近物理限制的极限
极致化的设计更多是对应用技术需求的研究和把握,但是在研发工程师看来,极致设计是在特定空间内,放置更多的电子元器件,是对供电、散热、结构等物理限制的不断突破。浪潮M5新一代服务器能够在密度、能效等方面不断突破,是源于高强度分仓结构、高精度风流控制和高效高功率主板供电等一系列领先的底层技术。
例如,存储服务器NF5486M5高度为4U,最大支持100块3.5寸硬盘,可提供1PB存储空间,是目前业界存储容量最大、存储密度最高的产品之一。在这款产品的研发过程中,浪潮工程师创新设计了分仓强化结构、共振抑制结构、高精度气流调配技术等,解决了散热、共振和形变等一系列难题。
浪潮M5新一代服务器采用极致化设计
例如散热问题,NF5486M5采用了多排硬盘设计,前排硬盘会为后排硬盘产生2°C升温,出风位置的硬盘只能得到层层加温的风流,在环境温度达到35度时,就会接近临界温度,而采用高精度气流调配技术后,散热风流可以直接达到每排硬盘,从而解决了出风位置硬盘的散热问题,确保在35度的环境中也可以正常工作。
推动智慧计算发展
极致化设计的服务器更多针对大规模数据中心和前沿应用,也主要被数据中心创新的先行者——互联网运营商所采购。在过去的几年中,浪潮一直蝉联互联网行业市场份额第一、天蝎整机柜服务器市场份额第一,很大程度上应该归因于浪潮在设计思路上的创新。
数据中心的互联网化已经是不可逆的趋势,数据中心创新技术从互联网运营商向其他用户的扩散比预计的更快。比如,近年来大量采购浪潮天蝎整机柜服务器的,不仅有百度、阿里巴巴,还有中国移动等电信和政府的行业用户。
云计算、大数据、深度学习发展速度不断加快,彼此之间的融合也在加快,智慧计算的时代已经来临。2017年,聚焦智慧计算业务,围绕智慧计算三要素,浪潮将为计算提供软硬件产品,为数据提供存储处理和分析平台,为算法提供面向应用、深度优化的集成工具。
目前,浪潮已构建以“计算+”为核心的生态体系,依托完善的软硬件产品线,形成了包括可重构的硬件、云数据中心操作系统、大数据处理平台、智能算法平台的软硬件产品布局。随着M5新一代服务器发布,将加速企业智能化转型,推动智慧计算进一步发展。