对那些认为高性能计算拥有革命性的访问和可用性的人来说–尤其是那些非技术性的研究人员,对于HPC是否适合公共云计算确实存在着很大的问题。大多数这种讨论总会由于性能出现的时候而到来,让我们面对它,对研究人员来说,大型的公共云计算比如Amazon的 EC2并没有多少让人觉得很好的功能来满足一些的需求。当然按需使用性能是很好的,但是如果价格超过性能很多就不是很理想的事情了。
如果这就是我们在讨论的大型公共云计算,一个大多被用于科学计算和大型企业计算的形式,大概就类似于Amazon的EC2。当然,还有其他的一些公共云计算供应商,为了论证期间,亚马逊的弹性云计算所提供的往往是第一选择。从启动云供应商巨头,Amazon象征着每个人都进入云的可能性,它固有的问题集中体现在云概念中,尤其涉及到高性能计算时。
很难促进公共云向着某个特定的方向发展,因为现在标准的资源和应用已经足够成熟,而改变是要付出代价的。
一个德国的杂志《Computer Woche》的工作人员Dr.Dieter建议说,只有有权限的用户才能够使用公共云中的HPC。"有效利用云计算的方式取决于应用。云计算可以在线性过程时被充分应用,因为独立处理数据量较小。而对于更大的存储需求和紧密耦合以及高I/O并行应用时,云往往无用。"
早在2008年就有人研究这个问题,有关公共云中的性能差距,这当然被归结为MPI和互连问题,这个问题至今仍然没有解决。另外,虚拟化使得云几乎没有很多用于高性能计算的集群,换句话说,没有单纯的行为。
这种性能差距还体现在对分布式你存并行程序的MPI性能上,在单一计算节点OpenMP这种共享内存并行程序上也有表现,为什么EC2要改变风格以适应用户科学计算的需要呢?毕竟有其它的公司正取得高性能计算的一些进展,更好地调整方法来让研究人员使用自己的云,无论是什么形式,已经有所设计了。
现在,有越来越多云供应商的选择,消除虚拟化带来的性能差距已经造成用户对高性能计算驱动的需要。
IBM、微软、SGI等公司并不和他们的客户进行直接的在云中的交流,他们在其中也只是一部分作用,只能帮助传统的HPC用户进入到EC2中。他们意识到这个环境需定制,另外,性能是最关键的因素以吸引更多的回报。而且最重要的是,公共云打破了集群的能力,他们是租用专门为高性能计算用户设计的专门的集群。
很多HPC的用户发现,一些公司正在设计高性能计算云的概念,使之吸引HPC用户消除虚拟化的隐患,并提供定制的服务器。这种虚拟化层使用了一些并发的技术,这种技术可以避免投资失败,提高成本效益。
由于许多用户发现,大型公共云,比如说最典型的EC2并不提供服务水平,他们依赖的对象是合理的预测, NERSC的总监 Kathy Yelick最近在接受采访时也表示过,现在肯定有一些HPC应用是适合云计算的,但是这并不是HPC的结束,一些串行的科学计算很适合云计算,但这绝对不是HPC的传统舞台。
有一些云供应商也可以很好的i调整自己的方案以满足高性能计算应用程序对HPC明显的需求,显然对于HPC来说,云计算并非遥不可及。