在IDCC 2020年度盛典零距离接触阿里云浸没式液冷

近年来,液冷技术一直是数据中心的热门话题。从数据中心的设计、建设、验证和运营的全生命周期成本来看,液冷技术有相当大的潜在优势,可满足许多新兴IT设备的冷却需求。近十年来,液冷在不断推动数据中心绿色革命,浸没式液冷是其中最为降本增效的解决方案。2018年以来的三届双十一,阿里云液冷服务集群承载了海量的计算服务,可靠性符合预期。浸没式液冷如何“给服务器泡澡”,在IDCC 2020产业大典的展台上,记者终于一见真容并与负责阿里云智能基础设施的技术专家们展开了交流。

阿里云展台-液冷解决方案模块

服务器被浸泡在绝缘冷却液中,与传统风冷技术不同,散热无需风扇、空调、制冷设施,节能效果卓越。阿里云实现了全球第一个全浸没液冷的云计算数据中心,加之完备的运营监控管理系统,截止目前是全球唯一大规模部署的商用液冷集群。据数据估算,阿里巴巴浙江云计算仁和数据中心相比传统风冷数据中心每年可节省3000万度电。

(从左至右)阿里云智能基础设施服务研发高级技术专家钟杨帆、阿里云智能基础设施资深专家郭懿群、阿里云智能基础设施IDC研发高级技术专家任华华 接受媒体采访

深耕浸没式液冷技术,构筑绿色超级数据中心

浸没式液冷用于云计算数据中心,最大的挑战还是意识,或者说共识,国家对基础设施的投入在突飞猛进地增长,大型、超大型数据中心在这两年里会如雨后春笋般地建设起来。2018年7月,阿里云就在张北冬奥云数据中心开始部署液冷服务器集群,到今年9月,浙江云计算数据中心有了更大规模地部署。实际运营数据显示,年均PUE值约为1.09。全浸没式液冷数据中心的优势,首先是高可靠,其次是可实现更高密度的服务器部署,为未来可能出现的大计算做好技术储备,第三是高可用,也就是具有普适性,适配包括计算、网络、存储在内的所有相关产品,并可在全球任一气象区实现极低PUE,第四是低噪声,最后就是服务器性能的提升,CPU及相关部分的性能指标在液冷场景下更优。  

全浸没式液冷应用于数据中心当然也有难点,阿里云专家表示:第一,数据中心整体架构设计发生了非常大的变化。尤其是已建成的风冷数据中心改建成液冷时,某些指标不适配;其次,风冷服务器不能直接应用,需要去除风扇和电源改造。

对于绿色超级云计算数据中心的选址,阿里云首先要看用户的业务需求,其次会考虑电力资源、网络带宽、当地政策和气象条件,也会考虑整体TCO和可靠性。那么如何快速交付浸没式液冷数据中心?阿里云浸没式液冷技术的研发进展是什么样的?就这个问题,阿里云智能基础设施IDC研发高级技术专家任华华给出了回答。

第一关于已建成的风冷IDC怎样适配液冷解决方案,首先需要关注建筑承重,如果结构荷载原来是按照一吨每平米来设计,那么大概率是不需要做加固改造即可适配液冷;其次是电气系统,与风冷数据中心相比,只有末端机柜配电略有差异;最重要的是冷却系统的快速搭建,阿里云液冷数据中心解决方案在设计之初就遵循了产品化和模块化的思路,整套液冷系统像积木一样易于快速现场组装。

阿里云智能基础设施资深专家郭懿群表示, 阿里云液冷数据中心解决方案从一开始的探索、到小规模实验室、再到现在的大规模部署,技术在不断迭代优化,这离不开最重要的几个维度,一是高密度机柜的支撑能力,比如单机柜可支撑30千瓦到100千瓦;其次是快速的部署能力,必须做到产品化设计与模块化交付,第三是实际应用场景的运维体验,提高运维的便利性与效率,阿里云在液冷技术的迭代过程中积累了从规划设计到建设交付到便利运维的全链路实践经验。

大型云计算数据中心离不开智能化运营管理,阿里云数据中心的智能化运营管理分为两方面,第一是软件系统,IDC最基础层的管理系统分为冷却监控系统和电力监控系统,冷却系统本质上是一个惰性系统,冷却监控系统的智能化目标除了做到不间断供冷还需要实现“按需供冷”,方法是在冷却监控系统上层架设AI系统,通过运营大数据分析来实现供冷优化,并同时做到“风险可预测,故障可分析”。阿里云液冷数据中心的智能化运营系统,全面接入冷却系统、电气系统、以及IT系统的运营数据,通过数据分析与AI算法帮助数据中心运营整体调优;第二就是工具层面,阿里云液冷数据中心引入智能机器人帮助运维工程师实现更换服务器与硬盘,部分巡检工作也可由机器人代为执行,智能化工具的应用大幅度提高了数据中心的运营效率。

携手生态伙伴,引领数据中心市场变革

2020年1月,阿里巴巴联合开放数据中心委员会ODCC向整个行业开源《浸没式液冷数据中心技术规范》,自规范开源以来,用户规模在不断扩大。

阿里云研发了全浸没式液冷数据中心的创新解决方案,不仅在政策层面满足了国家对于绿色数据中心建设的节能要求,同时携手服务器、IDC、网络设备等相关合作伙伴,共同建设了液冷生态圈。

阿里云表示,从云计算应用场景与发展趋势来分析,大规模通用计算的集约化部署非常适合浸没式液冷数据中心的解决方案,传统风冷数据中心将逐步向浸没液冷数据中心过渡,液冷的比例会逐步扩大,未来将进入风&液冷并存的崭新时代,这一切也依赖于行业共识、生态圈的逐步建立与产业链的不断完善,阿里云相信,浸没式液冷数据中心解决方案即将打开正向循环,规模扩大与全生命周期成本优化必然互相促进,为绿色云计算数据中心建设添砖加瓦。