透过数字看节能重要性 高性能计算能耗状况分析

服务器在线4月30日报道 工业革命以来的几百年中,人类对能源的需求爆发性增长,不仅使得能源越来越稀缺,更带来了严重的环境危机。我国是能源大国,却也是能耗大国,每年浪费的电力能源惊人。

为实现能源和环境的可持续性发展,国家已经将降低能源消耗、减少单位GDP能耗作为提高中国经济增长质量的一项重要指标,并且明确提出节能减排是当前宏观调控的重点工作。温家宝总理在十届全国人大五次会议上作的《政府工作报告》中郑重提出确保国家"十一五"节能减排目标的实现,促进国民经济又好又快发展。

IT行业作为国家新兴高科技支柱行业,同样面临着巨大的节能降耗压力。IT能耗问题已经成为影响全球能源和环境的重要因素之一。预计2007年,中国PC的社会保有量将超过1亿台,服务器超过200万台,还有数目众多的路由器、交换机等其他IT设备,这些总量惊人的IT设备大约会消耗300亿~500亿度电能,等同于向大气中排放上千万吨的温室气体。

计算机硬件的价格遵循着摩尔定律在不断下降,但是功耗方面的支出正随着通货膨胀和油价上涨而不断地攀升。如果一个服务器的功耗为300瓦,持续运行1年,以每度电0.64元计算(工业用电),每年的电费为1659元。当前数据中心所需要的计算能力正在大幅增加,同时随着机架服务器、刀片式服务器的采用,设备密度极大增加,导致了功耗的增加。

以100个插满机架式服务器的服务器机架为例,机架服务器耗电50千瓦,而散热所需的冷却耗电量几乎等同于计算机硬件自身的耗电量,因此冷却设备还需另耗电50千瓦。以每度电0.64元计算,一年无故障运营100台机架服务器将花费大约55万元电费。据统计,数据中心的电力消耗以每年15%~20%的速度在增长,而与此同时能源的价格也在飞涨。

数据中心每年所支付的电费,已经超出了IT硬件支出,或者说数据中心总拥有成本的四分之一要花在冷却方面。Google公司的单项最大支出就是它那庞大服务器群的电费。正因为以上原因,Google不得不把自己的处理中心部署在水电站附近,因为那里有充足的电能,据报道,它还准备建立自己的电厂。

高性能计算机能耗的增加主要体现在如下几个方面:首先是CPU功耗的增加,几十年来,CPU的发展基本是遵循着摩尔定律,其制造工艺不断提升,从芯片制造工艺来看,业界在1965年推出的10微米(μm)处理器后,经历了6微米、3微米、1微米、0.5微米、0.35微米、0.25微米、0.18微米、0.13微米、0.09微米、0.065微米,而0.045微米的制造工艺是目前CPU的最高工艺。

CPU晶体管越来越小,频率越来越高,随着CPU处理能力的飞速提升,其功耗同样增长惊人,现在Intel的高功耗CPU已经达到130W的功率;其次是内存及其功耗的增加,自从冯.诺伊曼架构诞生以来,内存就成了计算机中必不可少的部件,随着制造工艺的改进,内存容量越来越大,速度越来越快,价格越来越低,与CPU一起推动了计算能力的快速增长,而与此同时,我们却要为之付出更多的电费,现在主流的DDR2和FBD内存均已达到10W这个量级,以至于我们不得不为内存的散热感到头痛;再次是芯片组和外围设备,由于CPU和内存频率不断提高,这就要求和它们配合的芯片组,总线和外围设备都需要工作在更高的频率,才能充分发挥其性能,而更高的频率意味着更多的电能消耗。

第四方面是机房制冷和供电设备的能耗,由于服务器对高温非常敏感,因此机房必须配置大量的制冷设备,而且机房供电设备在把电压转换为220V时,会损失部分电能。以曙光4000A为例,曙光4000A采用2560颗AMD CPU,2TB的内存,系统功率达到370千瓦,加上制冷费用,全天运转下来将花费达到近万元的电费,每年运行电费高达500万。

即将推出的百万亿次超级计算机-曙光5000,采用近4000颗四核处理器构建,总内存容量达64TB,存储容量达500TB,总体功耗预期将达到700千瓦。到2010年我国将研发浮点计算性能达千万亿次的超级计算机,其功耗将高达20兆瓦左右,中国只有少数几个超算中心能满足这样的要求,假设目前每度电需要花费0.64元,即使电价不变,一台20兆瓦的超级计算机系统一年仅在电费上就要花去至少1亿元,与目前的成本比较,这是一个数量级的飞跃。液冷可以使系统变得更加紧凑,从而节省空间,但是并不能从根本上解决功耗问题。更为严峻的是,大量的电能消耗还带来散热方面的难题。
我国正处在经济快速增长时期,服务器作为重要的生产资料,数量急剧增长,功耗更为惊人。

以中石油的计算处理中心为例,从2002年到2007年CPU从340颗增长到13308,增长了40倍。运算能力当初是亿次,原为189亿次/秒,现在高达139万亿次,增长了3354倍,短短的五年间处理能力获得了质的飞跃。正是因为有了强大的计算能力,处理中心在冀东南堡油田的发现过程中发挥了至关重要的的作用,为油井位置的选择提供了重要的依据。(注:南堡油田是四十年来我国发现的最大油田,储量超过十亿吨)

据统计,处理中心1000个CPU软硬件及空调PTU需要成本3千万元,电费每年96万元左右,每天电费是2630元,1万个CPU每年电费是1750万。近三年耗电统计,2005年1500个CPU,电费是334万元。2006年的时候CPU增长到2300颗,电费达到492万元,2007年前六个月达到4900颗CPU,到9月份电费为554万元,2008年电费至少需要1500-1700万元。

随着经济和社会的发展,在可预见的时期内,中国总服务器持有量还会继续快速增加,功耗同样会快速增长。在胡锦涛总书记的十七大报告中明确指出,"加强能源资源节约和生态环境保护,增强可持续发展能力",为了建设新型节约型社会,高性能计算机节能刻不容缓。