国内首个温水水冷超算集群到底有多大能量?

日前,记者在联想Tech World济南峰会上见证了国内首个高校温水水冷超算平台的交付,这意味着我国首个超大规模温水水冷超算集群诞生了。凭借在高性能计算领域30多年的技术积累,联想再攀高峰。

那么,这套温水水冷超算集群为何有过人的性能?

去年6月,联想数据中心业务集团成立,同时推出一款直接水冷系统,并与英国伯明翰大学共同开发数据中心水冷技术(WCT),该技术大大降低服务器运行能耗,通过45°C水直接制冷,节省设备成本,热水排除可循环利用,解决CPU与内存散热问题,节能效果显著,LINPACK效率为92.6%,PUE值更是降到1.1,符合北大充分利用高性能计算能力的需求,该技术处于国内领先水平。进一步验证,水冷技术很好地规避了传统空气制冷的弊端,提效减排,效果更佳。

新型的IT基础架构ThinkSystem和ThinkAgile是联想在其软件定义数据中心领域的开拓,联想研发水冷技术的主要因素在于功耗上的考量。实际上,水冷最大的好处在于降低PUE值,联想在此前规模更为庞大的项目中将PUE降到1.04,令业界惊叹。

使用液体来取代换热系数较差的空气,形成新的导热媒介,这是水冷比较风冷技术的优势,联想数据中心有三大特点,首先在采用水冷技术后,无需风扇运载,大大降低噪音困扰,可将负荷运转的服务器所产生的噪音降至50分贝以下;第二,联想提高了客户的使用率,在降热效率上,联想第一代水冷能到80%,第二代为88%左右;在软件方面,联想有自主开发的智能管理系统,有如Windows操作系统,直观看到每个节点的效率,可以随意分成很多计算流,并承担诸多功能。

联想数据中心业务集团中国区企业级营销产品营销总监李炜表示:“PUE值是我们在单位能耗下产生的,理论上讲只能无限接近于1.0。风冷技术由于先天技术瓶颈,导致其理论极限为1.4,但真正绝大部分的实际事实值是1.6左右。水冷的极限值接近1.0,PUE值取决于计算集群的规模大小。我们在德国国家中心的项目做到了1.03,而北大属于超大规模计算领域里规模相对较小的。PUE值越低,越节能提效,将CPU的潜力充分发挥出来,同时减少噪音。”

据了解,北大项目采用联想深腾X8800超级计算机系统建设,共有227个节点,搭配联想GSS24存储系统,2784.8TB容量,Omni-path架构计算网络,联想LiCO集群监控管理套件。系统理论计算峰值411万亿次/秒,其中计算节点理论峰值261万亿次/秒,实测计算能力达到242万亿次/秒,存储I/O带宽持续写性能38GB/s,持续读性能50GB/s。

在算法方面,联想可提供基于AI平台的人工智能算法,以及针对不同行业应用场景的算法。

“例如联想的智慧交通解决方案,我们主要讲地面交通,AI的应用在交通领域是相对来说比较见效的,因为环境比较可控。所以联想在过去几年,除了在交通方面做了很多线路优化、以及AI研发之外,去年也投资了一家深圳的智能交通研究院。如果去深圳,就会体验到每当有重大活动或节假日时,深圳市政府都会去征求他们有关交通疏导的建议和意见,”联想数据中心业务集团企业级业务技术总监单奖定继续说道。

通过联想的数据中心,能够帮助用户拓展基础平台,把数据中心的性能做得更敏捷、性价比更高。

从结构上看,联想数据中心分为三层:第一层为基础,即软件、硬件和实施能力。上面第二层则是根据不同的负载类型(如联想的云、HPC和AI),整合软硬件提供合适的架构,第三层就是具体的业务场景,如智慧交通、智慧医院等,智慧交通会用到AI,也会用到HPC,这些不同的解决方案放到不同的应用场景里,就会孵化出越来越多的环境,这就是数据中心要做的。加之联想前端的移动,以及激增的智能设备,形成数字化端到端的结构,所有的后端都要有规模庞大的数据中心来辅助前端的AI、AR功能。联想ThinkSystem解决方案涵盖服务器、存储与网络系统,可实现端到端的客户体验,而ThinkAgile解决方案则是基于ThinkSystem平台,为混合云、超融合基础设施、软件定义存储及软件定义的基础设施而设计的,将基础设施与应用无缝集成。

目前,在HPC领域,联想在国内排名第一,全球第二,并在世界范围内拥有十余个研发中心,超2000名工程师持续自主研发,全球190多可靠性、高效、性价比都有不错的市场反馈,提供软硬件一站式服务。

正如,联想集团高级副总裁童夫尧所说的那样,未来的联想将不断发挥其在大数据、计算力和算法等方面的优势技术,不仅在PC业务上持续创新,还将长期为消费用户和商业用户提供更智能的“设备+云”,为企业和行业提供智能的“基础设施+云”, 不断推动未来智能设备的技术升级。