空气动力学、空间技术的开发;长期气候预测、高精度天气预报、海洋环流计算、空气与水污染的模拟分析、洪水与地震等灾害的预报;发动机设计、模具设计、生物新药设计、风洞试验仿真、石油地质勘探及新材料研究……所有这些与HPC(High Performance Computing,高性能计算)都紧密相关。
发展速度极快、应用愈发广泛,这就是HPC当前的现状。之所以会呈现这样的态势,主要是出于两方面的原因。一是需求促使,当下是数据社会,数据量越来越大、再加上人们对数据分析效率的追求越来越高,需要更强大的计算力做支撑;二是技术进步,信息技术这些年发展很快,HPC资源的获取之前需要大量的人力、物力投入,而现在以比较小的代价就能享受其强大的能力。
二者相互交织、促进,使得越来越多的行业开始使用HPC,感受HPC带来的变革。这其中,高等教育行业绝对是一个典型。粗略统计了一下今年6月发布的全球高性能计算机(HPC)TOP500榜单,其中有41套归属于大学,占比超过8%,分量可想而知。
为什么高教行业对HPC的需求那么强烈?与HPC快速普及的原因一脉相承,但高教的特点更突出。
拿汽车制造业来说,汽车生产企业会利用HPC进行车辆设计,而高校也会有相应的课程,也会用到HPC,二者都有需求。所不同的是汽车制造商只利用HPC干汽车制造这一件事,而高校还会有物理、化学、生物等其它学科需要HPC的能力。也就是说,相比企业,高校在HPC领域的应用范畴更广。到此,也就不难理解为什么HPC能在高教行业发展如此之快了。
EPFL出难题
为了更进一步探讨高教对HPC的使用情况,这里举一个实际案例,瑞士洛桑联邦理工学院(EPFL) 。
EPFL,世界顶级高校,QS世界大学排名第12,工程技术领域和自然科学领域享有极高的声望,拥有来自全球120个国家和地区的学生、教授和职员。为了保持业界领先的科研水平,EPFL一直在加强HPC系统的建设,早在2008年就建设了第一套HPC系统服务于全校师生。
着眼于未来的竞争力提升,从去年开始EPFL就计划对其HPC系统进行升级扩容。升级的理由很简单,资源不够用了。在EPFL给出的需求表中,最显眼的一栏是应用需求,HPC benchmark、HPL、HPCG等基准测试要满足;科学、工程、生物、医疗等各种应用,其中既有EPFL自行开发的也包括开源的都要能运行。
除此之外,还有很多硬性条件,比如理论计算能力≥475TFlops,共享存储≥340TB,读写带宽40G/s,整个系统不能超过8个机柜,单机柜功耗不能高于25kw;系统要开放、易管理、易扩展,而且合作伙伴要有足够的技术前瞻性,能为EPFL未来5年建设5PF HPC集群的总目标提供足够的支撑力。
华为见招拆招
单独看某一方面的需求可能还比较好满足,但如果把所有需求都集中在一起,会发现这块骨头并不好啃。没有压力也就没有动力,华为和当地系统集成商Transtec迎难而上,经过多次详细分析,最终给出了现在的方案,拓扑图如下:
其中,计算节点采用408个FusionServer XH620,每个节点是两路至强E5-2690 v4处理器,理论计算峰值475.2TFlops,网络采用2层Fat-Tree组网,Infiniband高速网络,存储系统是6套OceanStor 5800+GPFS并行文件系统,容量计350TB。
在这套方案中,华为采用了很多领先的产品和技术,带来的效果也十分显著。比如华为X6800高密度服务器的应用,使得单机柜计算能力提升70%的同时,机柜的部署数量也节省了40%。因为X6800在4U空间内能最高容纳8个计算节点、16路处理器,而采用普通的1U双路服务器则需要8U空间。这样一来,408个计算节点只需要6个机柜就能满足,而不是10个。
再比如,X6800中采用的散热工程设计,再加上DEMT动态节能技术,使得能耗比传统机架服务器降低10%-20%。
更多特性不再一一列举。凭借高效、高性能、高可扩展性、易管理等特性,华为的这套方案受到认可并得以部署。而从现在的实际应用情况看,这套方案完全满足用户需求,402TFLOPS的实测数据,计算效率达到89.3%。
今年6月,EPFL与华为共同宣布其科学IT和应用支持(SCITAS)部的Fidis HPC集群成功上线。
EPFL SCITAS执行董事VittoriaRezzonico女士在接受采访时对华为给予高度评价。她说:“Transtec和华为紧密合作,为EPFL提供了一个顶级高质量的系统,很好地满足了我们在高性能计算学术领域的需求。华为技术工程师为我们介绍的出色的硬件解决方案以及Transtec专业的规划、安装和配置服务,让我们印象非常深刻。”
目前,华为的产品和解决方案已经应用于170多个国家和地区,服务全球1/3的人口。在全球财富500强中有172家,全球财富100强中有43家领先企业选择了华为作为数字化转型的伙伴。