六招破解我国高性能计算发展瓶颈

高性能计算(HPC)在应对能源短缺、环境污染、全球气候变化等方面;在精准医学方面;在航空工业、高速铁路、重大装备制造、高能物理材料高通量计算等领域发挥着重大作用,对于传统产业升级、提升人民生活水平和进行重要基础科学研究具有重要意义。

PP

高性能计算对我国信息产业有极大的促进作用:相关技术促进了国产服务器产业的发展,同时为国产高性能计算软件发展奠定了基础,第三则是催生了我国的计算服务业。

AAA863专家组成员、中科院计算机网络中心副主任兼超级计算机中心主任迟学斌。

“发展高性能计算尤其是百亿亿次量级(E级)高性能计算,已经成为国家发展的重大挑战性问题。”863专家组成员、中科院计算机网络中心副主任兼超级计算机中心主任迟学斌告诉记者。

863计划在计算方向研究重点的几次转变

我国的高性能计算起步于1987年。

当时,受日本第五代机计划的影响,国家开始研究支持人工智能应用的计算机系统,1990年转向支持计算密集型应用的并行计算机,以体现了国内科研与工业的现实需求。1998年,受美国PACI计划以及网格技术的影响,我国高性能计算进入了高性能计算机与网格计算环境并重的状态,以便形成普遍使用的计算能力。1999年至2000年间,我国实施了863计划的“国家高性能计算环境”,建立了由分布在全国各地的5个高性能计算中心构成的国家高性能计算环境,支持了一系列示范应用的开发,成为后来建立的中国国家网格的雏形。

从2006年起开始,高性能向高效能方面转变,关注应用性能、可编程性、可移植性等。

据介绍,过去十多年来,国家先后推出了三个863 重大项目。

2002年启动的“高性能计算机及核心软件”项目强调资源共享与协同工作,以网格支持多领域应用,成功研发出了10万亿次量级计算机和中国国家网格实验床;该网格实验床重点关注新药发现、气象应用、地质调查、数字林业、航空应用、生物信息等若干网格应用,包含了分布在全国各地8 个节点、聚合计算能力达到18万亿次,在2005年资源能力居世界同类国家级网格的第二位。

2006年启动的“高效能个计算机与服务环境”项目,强调除了性能之外的开发的效率、程序可移植性、系统的鲁棒性等指标,着重解决了环境的服务形态。期间成功研发出了千万亿次量级计算机,分布在全国各地的14个节点,聚合计算能力达到了8000万亿次以上,存储能力超过15PB,部署了450多个软件和服务,通过网格应用社区等更好地支持应用,在2011年资源能力居世界同类环境前列。

2011年至今,在“高效能计算机及应用服务环境”项目支持下,依托国产高效能计算机和国家网格服务环境,形成了包含全国各地15个以上超算中心和高性能计算中心,建成了新药创制、工业产品创新设计、数字媒体和文化创意三个支撑领域应用的应用社区,在新药发现、气象集合预报、科学数据、铁路货运、航空工业等领域取得了较好效果,进一步提升了高性能应用服务环境的资源能力和服务水平,

从1993年的曙光一号(峰值6.4亿次每秒)到2003年的联想深腾6800(峰值5.32万亿次每秒),这10年间系统性能提升了8000多倍;2004年曙光4A峰值11.2万亿次/秒,2013年天河二号峰值5.4亿亿次。

“在过去的20年,863计划研制的计算机性能提升了8400万倍。”迟学斌总结了20年来国家高性能计算建设的主要经验有三,一是国家科技计划与地方、应用部门的发展计划相结合,二是产学研用的结合,三是机器、环境、应用三者均衡发展,相互促进。

高性能计算面临的问题与六大对策

TOP 500显示,近年来我国高性能计算发展速度在下降。

“未来能否维持过去20年来的发展速度?如何从国情出发,制定合理的发展目标?如何解决E级计算机所面临的功耗、性能、可编程性、可靠性等一系列重大技术挑战?如何驾驭大规模并行性?国家高性能计算环境如何在新的技术发展下提供更高质量、更好体验的服务?”

针对存在的上述种种问题,迟学斌对发展高性能计算存在的隐忧提出了相应的建议:

一是地方政府和应用部门配套研制计算机的道路能否持续,地方政府对E级机研制给予大量的配套资金有困难;

二是尚未在国家层面解决对国家高性能计算环境保持稳定,需要探索国家支持与有偿服务相结合的可持续发展机制;

三是基础器件(处理器、存储器等)、大规模并行算法与软件等高效能计算核心关键技术依赖国外,加强基础研究,使其适应系统研制的需要;

四是继续解决应用软件这一制约应用发展的因素,要通过自研、开源、共享多种手段来解决;

五是缺乏跨学科的高素质人才,是制约应用发展的另一个主要因素,要通过建立新的学科、拓宽人才培养渠道、讲座和实践培训用户来解决人才不足的情况;

六是加强产学研用相结合、多学科协作的长效机制,形成群体优势力量。

确定”十三五”目标与规划

为发挥高性能计算在我国经济社会发展中发挥重要的作用,通过国家高性能计算环境索取的的经验,促进我国计算服务业的产生和成长。相关机构对“十三五”高性能计算发展战略进行了研究和讨论,撰写了“十三五”发展战略报告和重点研发专项实施方案,并提交了重点研发专项的建议书。

总体目标有三项:

一是突破E级计算机的核心技术,依托自主可控技术,研究适应应用需求的E级的高性能计算机系统,使我国高性能计算性能在十三五末期保持世界领先水平;

二是研发一批重点大关键领域或行业的特色应用软件,建立适应不同行业的2~3个高性能计算应用软件中心,构建可持续发展的高性能计算应用生态环境,为我国高性能计算机应用软件产业奠定基础;

三是探索建立新型高性能计算服务的可持续发展机制,配合E级计算机和应用软件研发,创新组织管理与运营模式,建立具有世界一流资源能力和服务水平的国家高性能计算环境。

值得注意的是,美国长期禁止高端应用软件向我国出口,国家超算中心的应用软件采购受限,可提供的服务质量受限。2015年,美国又禁止向中国的一批核心技术单位出口新一代MIC等微处理器。

“中国的高性能计算机事业不能建立在国外技术的基础之上,必须大力研发自主关键技术,提升核心技术水平和自主可控能力。”迟学斌呼吁:“我国高性能计算发展必须自主可控!”