美国时间11月18日,浪潮在美国新奥尔良全球超算顶级盛会SC14上正式发布高性能应用特征监控分析系统-浪潮天眼。这是目前全球超算设备厂商开发的唯一超算系统分析软件。
该产品面向超算开发者和使用者,浪潮天眼可以智能化的定量分析系统应用运行特征,并建立可视化的应用模型,从而帮助开发者针对应用特点对超算或应用本身进行调优;浪潮天眼同时具备很强的管理与监控能力,对提升HPC的应用性打通了关键环节。
浪潮天眼高性能应用特征监控分析系统(Teye),主要用于提取高性能应用程序在大规模集群上运行时对系统资源占用的情况,并实时反映应用程序的运营特征,从而帮助用户最大限度的在现有平台挖掘应用的计算潜力,进而为系统的优化、应用程序的优化以及应用算法的调整改进提供科学的数据支撑。
浪潮“天眼”超算分析器通过量化超算软件特征、提取和记录应用软件在高性能计算机运行过程中实时产生的CPU,内存,磁盘,网络等系统信息和微架构信息,可以及时帮助使用者找到系统瓶颈,并能准确地分析出程序开发者的应用软件特征,帮助用户合理的划分集群使用资源、提高使用效率,是一款专为超级计算机定制的系统诊断工具。
天眼各项指标提取图示
“HPC Matters”是本届SC14的主题,核心强调HPC应用的广泛性与重要性。HPC开始走出科研等传统领域,在制造、商业、制药、互联网等各类经济与社会领域、人类生活领域取得深入应用。当HPC作为生产工具进入社会生活各领域,其开发者与使用者必然开始关注投出产出比,即HPC的应用效率问题。
但长期以来,业内一直缺乏全面检测集群各项运行特征值的有效手段。如同人们需要借助各种医疗检测设备进行健康体检,帮助人们了解身体的各项指标状况,超级计算机也需要特定的监测工具来智能分析系统及时、准确的判定系统的各项状况,进而智能化灵活管理HPC结构和计算资源。
浪潮“天眼”具有以下三个方面的关键特征。
> 首先是全面细致,细化出包括实时内存读取带宽在内的40余项应用特征指标,实现了对软件应用的特征更为精确的量化刻画和分析。
> 其次是适用性强,目前最多可以同时监控4096个CPU 核心,适用于绝大多数的用户环境。
> 同时简单易用,充分考虑软件的人性化和易用性,摒弃了单调的、令人望而生畏的命令行操作模式,采用了可视化图形界面。通过一个界面,使用简单的菜单和鼠标即可操作,一目了然。这使得大多数用户,不需要复杂的培训也可以轻松上手应用。
值得关注的是,本届SC提出的主题是“HPC Matters”,这与浪潮超算的主张“HPC PLUS”高度契合。HPC Matters强调“HPC担当重任”, 强调HPC对人类经济、生活的深远影响与推动。而浪潮主张的“HPC PLUS”更直指应用,强调未来HPC的强大性不再取决于它的核心数与峰值计算能力,而是取决于实际运营中每个具体应用的真实计算能力,亦即“应用定义HPC”。天眼的面市,是浪潮HPC PLUS,强调应用的产品技术落地。
另悉,美国时间18日浪潮还将在SC14大会上举行ASC15巡讲会。ASC是与SC、ISC比肩的全球三大超算盛事之一,其影响力已经远远不限于亚洲,欧美超算研发与应用机构纷纷慕名而来。19日,浪潮将举办题为“HPC在生物和化学领域中应用的发展”的HPC Connection Workshop。来自全球三大领域的专家,天河2号主任设计师卢宇彤教授、阿贡实验室(美国能源部下属最大的实验室)应用计算科学主席Ray Bair、全球最大的化工企业陶氏化学HPC负责人Dee Dickerson,分别从各自角度阐述对主题的理解和相关经验,这是一场探讨HPC尖端前沿应用的尖峰对话。