这周的调研报告是从前沿的科学中心,著名刊物和相关会议记录中精心挑选出来的。另外还有一些不同的项目,包括至强Phi对比其他四种架构在稀疏矩阵乘法方面的性能评估;关于高性能计算能效的调查;使用弱扩展原理对OpenMP,MPI和混合科学应用的性能建模;随时随地的集群监控探索;数据密集型云存储架构。
对英特尔至强Phi进行稀疏矩阵乘法内核的评估
英特尔至强Phi在SC12全球大学生超级计算机竞赛上名噪一时,计算机科学家们都迫切希望对协处理器进行一些测试。这里就有一组来自俄亥俄州立大学的研究人员,他们刚完成了一篇论文,论述了他们在英特尔至强Phi上进行评估稀疏矩阵乘法内核的工作。
根据该小组的批注,Phi有61个核心,每个核心带有512位宽的SIMD寄存器,支持4个硬件线程,理论峰值性能为1万亿次的双精度浮点运算。
他们论文的目的是介绍Phi架构,并利用稀疏矩阵作为测试程序分析其峰值性能。测试Phi的能力是个不错的选择,因为它是很多大规模应用的代表,还因为这对于协处理器架构来说是个难题。
该小组写道:“许多科学应用涉及大型稀疏矩阵的运算,如线性求解程序,特征求解器,图挖掘算法。大多数这类应用的核心都涉及到有稠密向量的大型稀疏矩阵乘法(SpMV)。”
他们还提到:“稀疏矩阵乘法类的内核的不规则性和稀疏性会对这些架构(比如加速器/协处理器)产生很多问题。”
研究人员将至强Phi的稀疏矩阵乘法性能与其他四种架构做了对比:两个双英特尔处理器,X5680 (Westmere) 和 E5-2670 (Sandy Bridge),以及两个NVIDIA Tesla GPU C2050 和 K20。实验结果表明Phi所提供的性能更加优越。
他们写道,“虽然至强Phi核心的设计和其他那些现代的处理器核心没有太大区别,但其数量庞大的核心和超线程能力可以让许多应用程序尽享可用的内存带宽,这对于许多尖端的处理器来说根本不是问题。然而,我们的性能研究表明,这种架构下,并非内存的带宽,而是内存延迟会对稀疏矩阵乘法造成瓶颈。最后,我们的实验表明,至强Phi的稀疏内核性能是非常有前途的,甚至比那些尖端的通用处理器和GPU都好。”
高性能计算中的节能意识:一项调查
印度马哈拉施特拉邦桑迦利市的沃尔钱德工程学院的一组研究人员发表了一篇论文,应对高性能计算中最紧迫的一个问题:能效。
该小组设定的是认识到日益提高的技能意识和高性能计算中与电源管理有关的开销。他们写道,“在有效率地运营现代高端的计算基础设施,如服务器,集群,数据中心和网络等问题上,电源控制是一个关键挑战”,虽然本文的范围主要涉及集群系统。
研究人员认为,开发节能高效的计算机设计是高性能计算的下一个主要目标。该论文介绍了集群计算的节能技术的概况和分类。研究概括了硬件和其中与之有关的变量和子类的软件。本文提出一个重要观点是,性能本身不能成为一个次要目标,但是可以理解,电力对于提高性能是一种制约。
混合MPI/OpenMP应用程序中的性能建模
德州农机大学计算机科学家Xingfu Wu和Valerie Taylor正在探求一种基于内存带宽争用时间和参数化通信模式的性能建模构架。他们共同撰写了一篇论文,内容为在大规模多核心超计算机上使用弱扩展原理对OpenMP, MPI和混合科学应用程序性能的建模和预测。
这个研究小组采用STREAM内存基准测试来确定MPI和OpenMP应用程序的初始性能和模型验证。他们还在磁约束聚变中使用混合的大型科学应用程序Gyrokinetic Toroidal Code来验证性能模型。
实验采用三种不同的超级计算机:IBM Power4,POWER5+ 和 BlueGene/P。研究结果表明,在这些多达512个核心的多核系统上,预测混合MPI/OpenMP GTC的性能的误差率不到7.77%。
随时随地的集群监控
一组来自中国山东济南的山东大学的计算机科学家正在探索随时随地进行集群监控的可行性。更具体地说,他们正在设计和实现一种基于安卓的集群监控系统。
该小组的观点是,高技能计算已经开始大众化,高性能计算已经成为许多科学领域的重要资源,包括图形学,生物学,物理学,气候研究,等等。然而,由于当地资金的现实问题,使用这种机器是相当勉强的。鉴于此,监控就成了有效利用和管理有限资源的一项重要任务。然而,研究人员发现,传统的集群监控系统移动性较差,从而阻碍了适当的管理。
作者试图提高监测系统的灵活性并改善管理员之间的通信。他们断言,论文中所概述的移动集群监控系统“将让随时随地监控整个集群成为可能,让管理员更加准确及时地对集群问题进行管理,诊断和解决。”
他们开发的系统基于谷歌的安卓平台,并以开源监视工具Gaglia 和 Nagios为基础。该设计采用一种客户端-服务器模式,服务器通过监视工具探测数据,并生成数据的全局视图。移动客户端通过Socket获取监视封包。随后,集群的状态显示在安卓应用上。
他们的作品发表在了这本书的其中一章,《普适计算和网络世界》。
云存储架构
英国计算机科学家Victor Chang, Robert John Walters 和 Gary Wills探讨了私有云部署下的云存储和生物信息学这个话题。他们写了一篇论文,为有数据密集型计算需求,并对分析云模式的好处感兴趣的其他研究人员提供了一些经验。
云模式的诸多好处包括节约成本的潜力,灵活性,效率,资源整合,商业机会和节约能源。虽然有这些固有的吸引力,但仍有一些障碍需要客服,其中之一,据作者所称就是对于管理运营和IT服务的一种标准或架构的需求。
他们写道,“这种架构需要提供必要的结构,以保证满足工业和学术界的业务需求,包括适应不同领域和平台的最佳做法的建议。”
他们的研究检查了私有云部署的服务可移植性。存储,备份和数据迁移和数据恢复都得以解决。本文介绍了一个详细的案例研究,既云计算采用框架下开发云存储和生物信息服务。为了说明云计算采用框架的好处,作者还提供了很多生物信息学的例子,包括肿瘤建模,脑成像,胰岛素分子,和用于医学培训的模拟仿真系统。他们认为,他们提出的解决方案降低了成本,节省时间,而且方便用户使用。