IBM Platform HPC应用及组件解析

基于开源软件的集群和Linux操作系统统治着高性能计算(HPC)系统,主要原因正是其成本效益以及灵活性,还有丰富的开源应用可以使用。

IBM Platform HPC在单一产品中提供完整的高性能计算(HPC)管理解决方案,它包含丰富的即取即用功能集,通过减少HPC环境的复杂性和加速解决问题,赋予高性能技术计算用户强大的能力。

IBM Platform HPC(PHPC)在单一产品中提供了基于Linux集群的一整套技术和高性能计算管理功能,通过自动部署操作系统和软件组件,系统管理员可以使用Platform HPC将复杂的集群作为单一系统进行管理。Platform HPC提供了配置和维护能力,它还包括集中化的监控,带有警报和可定制的警报措施。

具体而言,Platform HPC包括以下功能:

<<集群管理(内嵌的xCAT作为配置引擎)

<<工作负载管理(基于IBM Platform LSF Express)

<<工作负载监控和报告

<<系统监控和报告

<<强健的商业MPA Library(基于IBM Platform MPI标准版)

<<应用支持(集成应用脚本/模板)

<<加速器支持,包括GPU和英特尔至强Phi处理器调度、管理和监控

<

<<统一的Web门户

Platform HPC的应用

通过一个易于使用的Web界面,IBM Platform HPC允许制造、石油、天然气、生命科学以及高等教育等行业的技术型计算用户配置、管理和使用他们的HPC集群,这为用户最大限度减少了设置和管理集群所花费的时间,让他们把精力集中于应用运行,而不是管理基础设施上。

IBM Platform HPC具有完整的针对ANSYS Mechanical、ANSYS Fluent、ANSYS CFX、LS-DYNA、MSC Nastran、Schlumberger ECLIPSES、Simulia、Abaqus、NCBI Blast、NWChem、ClustalW以及HMMER的任务提交模板。

通过配置这些基于环境的应用设置模板,可以从一开始使用集群就不需要编写脚本。那些配置自主或者开源应用的集群用户可以使用Platform HPC脚本指导方针。这些界面可以最大程度上减少任务提交错误,并且是自我记录的,让用户能够创建自己的任务提交模板。

Platform Application Center(PAC)集成:Platform HPC中并不包含Platform LSF插件,用户必须单独下载并安装这个插件。Platform HPC包括PAC的一些功能,如任务提交、任务管理以及应用模板。

如果一个用户购买了PAC标准版,同时会收到授权,可以通过这个授权,在现有的Platform HPC上启用其他功能,如远程2D和3D可视化。不过,PAC双体中包含PAC标准版的其他功能,因此,如果用户需要这些功能,比如Role Based Access Control,必须单独安装PAC。

组件模型

Platform HPC软件组件支持各种运行于集群上的计算密集型应用,为了支持这种应用,图2-1中显示的Platform HPC软件组件,并可以提供多项服务。

IBM Platform HPC应用及组件解析图2-1 Platform HPC软件组件图表

在开始任何软件应用之前,所有节点都要安装操作系统和应用软件,这个功能是通过配置引擎提供的。在这里,用户创建或者使用一个预先设定的配置模板,这个模板描述了计算节点软件需要的特性。这个配置引擎通过一个选定的网络接收启动请求,给系统安装相应的操作系统和应用软件,安装完成之后,就可以运行系统和目标应用了。

尽管计算图像可以运行应用软件,但是对这些图像的访问通常是被任务调度器(Platform LFS)控制的,它作为一个工作负载管理器运行。这个调度器的功能是确保在计算节点上的计算资源不被序列化的访问过度消耗。

这个调度器的属性通常是在安装过程中定义的,可以配置这个调度器,将不同工作负载分配提交给任务代理之一(Platform LSF代理),这个任务代理在接收到任务调度器的请求时开始特定的工作负载,系统中有多个任务代理,每个操作系统图像上有一个。

这个监控和资源代理向配置代理和任务调度器返回每个操作系统图像的系统状态报告,并提供一个机制,在发生故障的时候发出警报,确保任务只在可用且有资源的操作系统图像上进行调度。

网络门户则为管理员提供了一个易于使用的机制,来控制和监控整个集群,同时对于用户来说,它提供了对系统易于使用的访问,以进行任务提交、管理和报告。