成为绿色IDC标杆,中国移动南方基地数据中心液/气双通道精准高效致冷系统迈出重要一步

位于广州的中国移动南方基地是中国移动两大综合基地之一,承担着中国移动集中化、云计算和IDC的运维。南方基地数据中心的PUE值为2.2,这与国内大多数数据中心水平相当,而与当前国际领先绿色数据中心低至1.2的PUE值相比,还存在着不小的差距。

由南方基地总经理林湧双首先提出的“数据中心液/气双通道精准高效致冷系统”,成功地解决了高密度IDC冷却的世界性难题,并在2016年顺利通过工信部科技成果鉴定。同时,改造后的方案应用有望推广到中国移动其他数据中心乃至整合其他行业数据中心,成为业界的标杆。

image002中国移动南方基地外景

揭破世界难题的苹果,为何落在了林湧双的头上?

我怀着好奇的心情向林湧双询问了这一问题。

2010年,林湧双来到南方基地,发现仅一年的电费就超过亿元,数据中心如何节能成为他一直思考的问题。

一次偶然的机会,林湧双碰到同获广东省科技进步一等奖的老朋友,交流中对方谈到“山有多高,水就有多长,热管散热是效果最快的方法。”

高密度IDC冷却是世界性的难题。不仅是数据中心,雷达、高铁等行业都有高密度散热问题。

过去,数据中心行业的人对热力学不够了解,降低PUE值的常用方法有:一、管理气流,即数据中心设计尽量减少热空气和冷空气混合;二、优化电源布局,通过减少电流转换来减少分布式电源带来的电能损耗;三、提升制冷效率,利用水冷提高散热效率。

跨界,让破解难题的苹果砸到了有准备的人头上。

南方基地很快确定了“去空调”、“去UPS”的改进方向,并打算从致冷节能技术进行突破,降低PUE值。

image004中国移动南方基地数据中心液/气双通道精准高效致冷系统

前期调研,选择“芯片级”热管水冷方案

目前IDC致冷节能技术已经历四代演变:从传统的“机房级”致冷、“模块级”和“机架级”致冷,再到“芯片级”致冷。

前三种为非接触式致冷,散热系统需低温空气作为散热媒介,系统热阻较高;最后一种为接触式致冷,散热系统无需空气作为介质,系统热阻可大大降低。

“芯片级”致冷技术可在确保安全工作的前提下,进行高效散热,南方基地决定采用全新的“芯片级”致冷方案。

三雄逐鹿,花落浪潮

问题也随之而来了:芯片级致冷方案虽好,但必须对服务器进行定制。

南方基地邀请了浪潮和另外两家服务器厂商同时对芯片级致冷方案进行研发。南方基地提出了热管水冷的方案,这与浪潮提出的解决方案不谋而合,而另外两家服务器厂商则分别提出了浸泡式和直接水冷方案。

热管水冷方案拥有可靠性高、维护便利、低成本、工艺复杂度低等优势,理论上在满足PUE值降低至小于等于1.2这个主要目标的同时,产品化的概率更高。而另外两家服务器厂商的水冷方案虽然理论上也能满足降低PUE值的目标,但要么实现成本太高,要么后期维护复杂,要么工艺复杂度高,均不具备向市场大规模推广的条件。

基于以上优势,热管水冷方案是更适合南方基地改造的方案。南方基地对三种方案进行了长达2年的测试,用夏天最极端的高温天气测试获得的PUE值为参考,对方案进行了评估,经过综合衡量,最终确定,热管水冷的方案是可行的。

协调资源,整体交付

在本次项目中,南方基地除了对方案有非常严谨的要求,对服务器厂商也提出了很高的要求:必须具备丰富的行业经验,充分了解客户需求,具备完善的方案解决能力,并在行业内拥有很大影响力。

最终,南方基地选择了浪潮作为项目的总集成,整合各方资源,最终将完整的服务器液冷方案进行交付验收。(其中申菱负责外部制冷、新创意负责CPU热管、华南理工负责科研理论配合、盈嘉软件负责系统监控。)

三大技术挑战

在方案实现过程中,面临着三个主要的技术挑战。

首先是对服务器的改造,浪潮对传统双路服务器浪潮NF5280M4进行了设计调整,以热管液冷模块代替传统的散热翅片模块,通过自然热传导带走CPU等高发热密度芯片的热量。即使使用温度高达45℃的水流,也可对CPU进行高效散热,使其工作温度保持在正常范围内。

改造过程中遇到了许多问题,例如,液冷方案改变了服务器的整体散热策略,改造影响了风扇的正常运转,经常导致服务器死机,浪潮研发人员经过多次尝试,把服务器风扇数量减少到3个或2个,成功解决了这一问题。在设计热管时,热管的形状和排布也会影响到实际的散热效果,浪潮联合新创意的研发人员经过配合并多次优化,最终找到了散热效率最高的方式。

其次是致冷系统的改造,由冷却塔、板式换热器、双循环水路代替传统精密空调,采用双通道设计:“接触式”致冷通道,排走高功耗高密度元器件的热量;“非接触式”致冷通道,排走低功耗低密度元器件热量。为了保证服务器的运行安全,浪潮和申菱共同承担起方案优化,即将水流进行分区,外循环封闭于致冷设备间,同时在服务器接口部分设计了防漏接头,内循环采用无腐蚀绝缘冷媒,以负压方式驱动水流,经反复测试发现,这种方式即便出现水路漏点也不会对服务器造成影响。

最后是对供电系统的改造,采用市电直供,供电效率接近100%,使用高压直流作为热备份,确保市电失压时无缝切换。

在项目中标后2个多月的时间里,浪潮与南方基地项目组积极合作整合多方资源,将想法变为了现实,将基础架构成功落地,PUE降低至了1.2以下。

成为PUE1.2以下国家绿色节能标杆

与传统数据中心相比,这种新型数据中心节能效果突出,能效指标PUE值可由平均2.2下降到1.2以下。省电节能高达45%,在同等业务能力下减少机房建筑面积70%以上,配套投资下降10%以上,并可广泛应用于高温高湿地区,能有效推动我国数据中心的绿色发展。

这种芯片级节能绿色数据中心建设方案可有效降低能耗,目前,该科技成果已获得发明专利16项、实用新型专利35项,并成功入选了国家2015年工业转型升级资金绿色制造项目名单,关键技术成果被工信部鉴定为“国际领先水平”。

image006“数据中心液/气双通道精准高效致冷系统”示意图

点评:

从此次项目的采访中,笔者深深地感到:

首先,新方案的形成与跨界的突破点,机遇需要有准备的人。

其次,原理上有了突破,接下来就是工艺改造的问题,这需要有看准结果,勇于投入的魄力。

为什么是浪潮而不是另外两家厂商?据悉,服务器重构,一块主板的成本要数千万元以上。

南方基地的第一批实验性的采购中,只有70台服务器,由于量太少,多数厂商不愿意进行工艺改变,如果是七万台的量,大家削尖脑袋也要进来。

但是,就是在那一刻,浪潮慧眼识宝,认准了南方基地的想法在未来一定能够成为主流技术,所以可以不考虑短期效益,对创新勇于投入。

南方基地除了承担业务重任,还肩负着对IT支撑架构进行创新研究和运维探索的重任。南方基地对数据中心的改造,目标是将PUE值降低至1.2的国际数据中心领先水平,节省大量电力成本,实现绿色节能,这对目前业务量极具增加的中国移动更是意义非凡。

同时可以预期,改造后的方案应用还可以推广到中国移动其他数据中心乃至整合其他行业数据中心,成为业界的标杆。目前,工信部、国家超算中心领导,以及美国IDC行业的同行都对“数据中心液/气双通道精准高效致冷系统”表示了认可。

祝愿“数据中心液/气双通道精准高效致冷系统”早日量化,造福行业、造福社会!