当HPC遇到云计算:高性能计算的三重门

今年个人电脑迎来了30周岁的生日,个人电脑的强大兄弟超级计算机,则已走过70年的风风雨雨。比起现在的电脑来,初期的超级计算机运算非常缓慢;仅在过去25年,计算机的速度和运算能力就提升了一百万倍。

超级计算机已经被使用到各个领域,能源探索、气象服务、物理实验、图像渲染……几乎你能想到的领域,都可以有高性能计算的参与。而每年两度的全球高性能计算TOP500强榜单,也让各国计算机精英为之折腰。

2011年6月,最新TOP500高性能计算机榜单上,前三甲分别是:K电脑,8.2千万亿次/每秒,日本;天河-1A,2.57千万亿次/每秒,中国;Jaguar,1.76千万亿次/每秒,美国。K的运算速度甚至比排名第二至第六的计算机运算速度总和还要快。各国角遂超级计算机排名的背后,折射出超级计算机之热。

在中国,从2009年以后,高性能计算迎来了一个新的历史发展时期。这与不停建设中的城市高性能计算中心分不开,也与一度夺得全球TOP500 榜首的天河一号分不开。但最实质的原因是,随着中国经济的飞速发展,对科研的投入越来越大,高性能计算作为推动学科发展的有力杠杆的地位得到共识。

高校作为科研创新前沿阵地,显然拥有极大需求。而且,从国外的经验来看,许多高校的高性能计算在世界上拥有很高的声誉。比如,美国伊利诺伊大学,德国斯图加特大学,日本的东京工业大学等。我国的天河一号也产自国防科技大学。高性能计算在高校发展很快,主要原因在于高校有更多的用户,许多学科,无论是化学、物理、生物、地球、航空、海洋等,都给高性能计算提供了用武之地。从这个趋势来看,未来高校对高性能计算中心的重视只会加强,不会减弱。

从这个角度上,也就不难理解何以从2009年开始,高校的高性能计算中心风生水起,进入一个新的发展时期了。

当高性能计算遇到云

2010年起,随着云概念的深入,一些高校开始构建基于云的平台。与此同时,高性能计算中心的规划也正在进行主要命题是:高性能计算中心作为一个公共的服务平台,在新的形势下,是否要融入到学校的整体信息化结构中来?还是让其孤独地独立成篇?

以上海交通大学为例,其正在做一个面向全校师生进行网络服务的云平台,将Web服务、邮件服务、论坛等通通纳入云服务平台中。那么,高性能计算平台呢?是否也纳入到总体的云平台上?

对于此,是有争议的。一方面,云计算采用的关键技术是虚拟化,这样可以使资源按需调度,但也势必导致牺牲一部分速度。而高性能计算则追求“高速”,两者看似矛盾。另外一方面,人们又期望以云计算的灵活的弹性应用模式来解决公共高性能计算平台的系统管理问题。中国工程院院士李国杰认为,“云计算的易用性会影响传统的HPC计算模式,按需的云计算给HPC提供了更易交互的计算模式。如同几年前用大众化的PC服务器搭建集群以及最近用GPU加速科学计算一样,云计算对于HPC也是一次模式转变。”那么,HPC到底可不可以采用云计算的架构?

针对此, 上海交通大学做了初步的尝试,他们提出了一种融合高性能计算、网格计算和云计算的新型计算框架高性能弹性计算(HPEC),可以跨域管理和调度多个云计算资源,支持GPU和众核异构计算环境,用户可以自主灵活地申请和管理计算、存储和网络资源,这些资源可以是虚拟化的或者是直接的物理资源,支持 HighPerformanceComputingPlatformasaService(HPCPaaS)多节点集群及上层软件的快速部署,同时支持计算密集(MPI)和数据密集(Map/Reduce)应用等。

而北京工业大学的高性能计算平台采用的也是云的架构“我们觉得可以采用云架构,原因在于我们是一个公共的平台,并非针对一个领域,所以资源的调度也很重要。”北京工业大学邸瑞华教授表示。

在当前看来,用云计算的思路去实施高性能计算,可能更多的是一种取舍,当你需要的是不惜一切追求高速时,显然,采用了云计算就与你最初的理想相背离了。反之亦然。