IT号外之数据中心:时刻从应用出发

我们上一篇IT号外文章“五大环节望闻问切”(敬请附加上一篇文章发布后的链接),探讨的只是数据中心用户在服务器采购环节需要注意的事项,其实,采购新的服务器设备只是这些用户工作的起始点,如何用好它们才是用户在数据中心日常维护中需要花费更多精力去考虑的问题。在本文中,我们就将尝试介绍和分析应用阶段中用户应该遵循的原则及应用的技巧。

让我们先来谈谈原则。想必人们不难发现,那些在事业上较为成功的人,在工作中其实都是很有原则的,虽然他们不同个体间的原则存在很多差异,但其中共同的特点就是对工作始终保持着一种“敬畏”的态度。这种敬畏可不是一句空话,对它深有体会的人,对工作总有一种他人所不能及的认真劲儿,就像敬业的会计师们总想着如何精确处理账单上小数点、出色的设计师们也总是在考虑应该如何修饰那并不明显的色差,而优秀程序员则甘愿为去掉更多的多余代码而加班加点……与他们相比,那些拥有了最新的计算设备平台,并有充足的人员配置的数据中心管理者们应该对自己的工作更加敬畏,因为数据中心在运维中总是会出现层出不穷且彼此关联的问题,在解决它们的过程中,可是容不得有半点懈怠和粗心大意的。

对自己的工作、对数据中心保持一种敬畏,接下来,就涉及到具体的应用的知识和技巧了。对此,我们主要总结出了以下四条:

1、内外结合,挑战能效极限

提升数据中心能效应该是个有计划有步骤的过程。为此,我们应当首先分清楚可以利用的内部资源和外部资源。例如现有的计算设备已能支持最新的节能技术且尚未被充分利用的话,就应当首先照顾这部分资源。

众所周知,今年数据中心面临的最大挑战就是功耗过高,而数据中心服务器消耗电能最多的就是处理器。不过值得欣慰的是,你如果选择了英特尔至强5500系列服务器处理器,那么你在控制CPU的功耗上就拥有了无可比拟的先天优势——这个平台本身的节能技术就很强大,比如它内置的智能节能技术和自动低功耗状态可自动将处理器和内存置入最低功耗状态,从而在不影响性能的情况下满足当前工作负载的运行需求,使该平台的电源管理能力提高了五倍,限制功耗降低了五倍。

要让至强5500平台发挥这种功效,你首先要做的,就是将它们这些功能全部开启,比如英特尔睿频加速技术和智能节能技术,它们都可实现基于政策的控制,让处理器以最佳频率和电源状态运行以达到节能的目的,但是要保证的是——这些功能都处于激活状态,同时管理员要在BIOS中指定需要以高频处理的应用和应以低频执行的应用,比如管理员需要在支持数据库应用、Web应用的服务器中设定“高频处理”的状态。

接下来,我们需要做的就是走出处理器和服务器的范畴,转换到管理端——英特尔在百度数据中心的经验中总结出一个新的技术,名叫“节点管理器”(Datacenter Manage,简称DCM),它可以动态控制每台服务器最高功耗。也就是说,当一台机柜上的服务器最高功耗达不到最高的时候,这项技术可以通过控制处理器的主频、控制电源等方式将机器的总功耗控制在某一个值之下。

通常,在大家谈及数据中心能效问题时,往往习惯将数据中心的能效分为高性能与低功耗两部分,DCM就可以帮助客户以更灵活的方式动态地或者是通过定制策略、定制脚本的方式来管理每一台服务器,让每个机架甚至每个服务器的功耗都能用到实处,尽可能避免浪费。

2、恰当使用虚拟化技术,挖掘处理器的每一分性能潜力

消耗同样的电量,我们总是能够在服务器上获得最大的性能回报,对此,采用虚拟化解决方案就是不可或缺的手段。

不过,在部署虚拟化解决方案的过程中,用户首先要考虑清楚他们到底需要实现哪种功能(虚拟机管理迁移、负载平衡、灾难恢复、快照支持备份或者补丁管理等等),然后对这些所需功能进行比较,同时需要询问硬件层面的是:它支持哪些虚拟机管理器?支持虚拟机迁移特性吗?除了服务器整合能力以外是否还有降低功耗或散热的内置特性?因为,为服务器选择适当的虚拟化硬件,与选择虚拟化软件本身一样重要,它可是决定了一个虚拟化解决方案最终能否真正发挥出全部潜力的关键因素。

幸运的是,英特尔至强5500系列服务器平台本身集成了针对处理器(VT-x)、芯片组(VT-d)和I/O(VT-c)的多项虚拟化技术。这一系列的处理器可借助更高的I/O带宽进一步提高虚拟化性能,并通过支持多代虚拟机迁移,在虚拟化环境中实现更好灵活性。借助英特尔处理器、芯片组和网卡中内建的硬件增强技术,新一代英特尔虚拟化技术使本机虚拟化性能提高达2.1倍,并使往返虚拟化延迟降低达 40%。

3、软硬互动,重视应用调优

每当数据中心进驻一批新的机器时,虚拟化策略的调整、资源的调用固然重要,但在其实际运行过程中,用户更需要关注的,还是应用本身的变化和调优。

作为英特尔最新的双路服务器处理器,至强5500增添了很多新的技术和特性,就像我们在上文中提及的睿频加速技术,此外还有超线程技术和快速通道互联技术,如果数据中心用户只是根据自己的应用需求对它们的配置进行了调整,而没有针对它们对应用软件进行调优的话,那么它们的威力也是无法全面发挥出来的。

因此,数据中心用户,特别是一些自行开发应用的用户应该在针对应用调整硬件配置时,也针对硬件的新特性及功能对应用进行调优。这应该是一个相辅相成、互动推进的过程,它们的目标,都是为了提高数据中心的运行效率与投资回报。

4、制订PUE目标,实现可持续发展

数据中心是一个动态的资源池,它的“容量”随时都可能应用户的业务发展变化而变化,这就需要IT运维人员提前预计数据中心升级的规模以及能耗范围,以及如何最快收回投资回报。对此,我们建议用户要确定一个清晰的PUE(电源使用效率,Power Usage Effectiveness)目标,用来指导数据中心的长期建设和升级工作。
从概念上来看,PUE=数据中心总设备能耗/IT设备能耗,这个比例的基准是2,越接近1,就表明数据中心的能效水平越高。目前的一些非常顶级的数据中心,如谷歌数据中心的PUE已达到了1.1左右,这个成绩已是非常理想。

有了PUE这个立足长远和全局角度,并且更加科学的比值作为参考或限定,数据中心运维人员就可以针对未来三到五年之内的数据中心升级计划做出预估,并在未来的具体升级行动中做出正确判断。例如用户制订的PUE值越接近1,他们在未来数据中心升级时就越要选择能效较高的IT设备,例如配备了高端处理器的服务器,因为这种产品可以更少的部署量(同时也就意味着数据中心采用更少的网络设备)来达到某一个性能目标值,这样一来,数据中心里的IT设备消耗的能源就可以大大减少。

结语

以上四个应用技巧,其实还没有涉及太过细节的方面,不过对于数据中心用户来说,它们已足以解决那些最主要的应用需求和问题,而且它们体现出的一切从应用出发的思想也是用户在解决其他问题时所必须坚持的,因为不论是在数据中心硬件配置上进行更多、更深入的调整,还是针对不同类型应用软件进行更为细致的调优,其目标都是要让数据中心在实际应用中获得更好的表现,以更高的投资回报率为用户的业务发展带来更强的支撑。

当然,要达到这一目标,既需要用户下足功夫、认真研究,也离不开IT厂商通过产品技术创新为他们提供的强有力支持。我们在下一篇IT号外文章中,就将重点介绍英特尔公司未来几年内将要发布的、可进一步推动新一代数据中心技术进步与应用革新的产品和技术,敬请关注。