著名的华裔科学家丁肇中在谈到高能物理研究的时候,曾经这样形象地比喻:他发现陶粒子的工作量,就如同在北京的一场牛毛细雨中,寻找那唯一的一颗红色雨滴。在西欧高能物理中心,一台高能粒子对撞机每年所产生的数据,用100万台个人电脑的硬盘都装不下。因此,对于高能物理高性能计算系统应用而言,高性能存储的重要性将日益突出。山东大学高能物理研究在国内物理界享有盛名,其涵盖了加速器高能物理与高能宇宙线物理这两个核心研究领域。在这一领域,山东大学高能物理系承担着美、欧知名实验室和研究中心的多个项目。同时山东大学也参加了北京正负电子对撞机(BEPC)/北京谱仪(BES)合作组。在非加速器物理和粒子天体物理、高能宇宙线物理等领域,山东大学高能物理系还担负着多个计划。与其他的高性能计算系统不同的是,用于高能物理研究的计算系统不但要像其他领域的应用一样,需要强大的数据运算、处理能力和高数据吞吐量,同时也对整个计算系统中的存储系统提出了更高的要求。
因为在保证数据吞吐量和数据安全性的同时,高能物理研究需要对大量数据进行频繁调用,与其他存储系统中大部分数据在写入之后就很少调用的情况迥异。根据这些业务特点,有关技术人员制定了相应的高性能计算系统解决方案。据记者了解,该系统使用了浪潮公司的AS500存储系统,并与天梭10000高性能集群计算系统相配合,借助千兆以太网实现互联。其中,天梭10000高性能计算系统总节点数量24个,其中包括18个计算节点、2个登录节点、1台管理节点、2台文件服务器、1台安腾2开发服务器。据技术人员介绍,目前该系统峰值的浮点运算能力达到268.8亿次。在这套系统中,还部署了Intel Vtune性能调优工具、MKL数学核心库、线程工具、C++、Fortran、JAVA编译环境、天梭管理软件、天梭监控软件、天梭集群部署软件。在此,技术人员特别提到了AS500存储系统。
AS500采用模块化的设计思路,控制器、电源等主要部件采用冗余热插拔设计,很大程度上消除了单点故障引起的系统宕机;而兼容FC和iSCSI两种主机接口的特性给用户提供了多种不同的配置选择,如FC SAN和IP SAN;在此次提供的方案中,客户选择了FC/iSCSI接口,其640MBps的传输速度,4TB的存储容量,可满足高能物理海量数据处理的要求。目前,这一系统配置了两套AS500存储设备。在实际应用中,两套AS500各司其职,分别为登录用户提供数据以及为计算项目保存运算结果,从而进一步提升了计算系统的整体性能,为整个系统的运行提供了更高的可靠性、可用性和可管理性。据了解,目前山东大学高能物理系的这套高性能计算体系已经就位,并成为其高能物理研究的基础。
有关负责人表示:“高能物理系上下特别是研究人员对这套系统的表现满意。其性能表现、稳定性和可靠性可与国外实验室同等的系统相媲美。”