德国当地时间5月30日,全球超算盛会ISC2022在德国汉堡开幕,第59届Top500榜单在会上正式发布,美国凭借其首台E级超算Frontier以1.102 Exaflops的HPL计算性能登顶Top500榜首,开启E级超算时代,其持续计算性能约为排名第二的日本超算系统富岳(Fugaku)的2.5倍,但是功耗却只有富岳的71%。
Frontier超级计算机采用第三代AMD EPYC处理器以及AMD Instinct MI250X加速器,峰值计算性能可超过1.5 exaflops。
与往年相比,来自中国的新上榜的超算系统特并不是很多,但从系统上榜数量占比来看,中国仍旧以35%的占比领先其他国家和地区。
截至2020年,我国科技部批准建立的国家超级计算中心共有8个,分别是天津中心、广州中心、深圳中心、长沙中心、济南中心、无锡中心、郑州中心以及昆山中心。
对高性能计算的基本认识
超级计算机是一种高性能计算(High Performance Computing,HPC)集群,集群由众多计算节点组成,集群由众多计算节点组成,由集群管理系统通过高速IB网或专用网络将多个计算机节点连接在一起,统一调度管理,从而实现强大的计算功能。
首创者是有“高性能计算之父”之称的Seymour Cray。1964年,Seymour Cray研制的CDC 6600将多个普通的处理器连接起来开展协同工作,随后这种新型的高性能计算机逐渐代替原有的大型机,开启了高性能计算技术和产业多年的持续发展与繁荣。
20世纪90年代微处理器的出现,以及大量工业标准硬件的普及,以大规模互连多个通用乃至商用的计算部件的可扩展系统结构技术,创新主导了迄今为止的高性能计算发展。
由于在核爆模拟、油藏开发、极端天气预报等领域的极大价值,高性能计算被视为计算机科学与工程的“皇冠”,各国近年来陆续从国家层面启动研制计划,包括美国的ECP、欧洲的EuroHPC、中国的高性能计算专项等E级超算相关研究专项也纷纷建立;“十四五”规划和新基建等战略,驱动我国高性能计算中心建设进入高速增长期,各级地方政府和企事业单位。高等院校都在积极建设和筹建高性能计算中心。
高性能计算机的核心是CPU,但并不是简单的CPU堆砌,在体系结构设计、高速互联网络、并行文件系统、存储阵列等任何方面的欠缺,即使再多的CPU,也无法提高高性能计算机的性能。
随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统等性能要求越来越高。
高性能计算的主要应用及前景
高性能计算是一种通用算力,在底层芯片性能要求上高于普通的数据中心和智算中心。算力中心有数据中心、高性能计算中心、智算中心,它们都可以用云的形式来提供服务。以实现人工智能需求为例,推理、训练和模拟为AI的三类主要任务。
高性能计算主要应用场景包括飞行器设计、核模拟实验、星云模拟、解密码等数值模拟场景,以及大数据分析、统计和人工智能等数据分析场景。由于涉及敏感科学计算领域应用,发达国家对出口高性能计算十分谨慎,甚至采取打压和制裁措施来抑制别国的发展。
一直以来,全球超算TOP100以HP、IBM等公司为主。随着高性能计算的发展,尤其是使用成本的不断下降,其应用领域也在向更广泛的国民经济主战场快速扩张,如生物医药、基因测序、动漫渲染、金融分析以及互联网服务等等,目前,算力服务、高性能计算中心、人工智能、科学计算等领域是高性能计算的主要用户,互联网、大数据特别是AI领域增长强劲。国内企业联想、曙光和浪潮捕捉到了机会,得到了快速发展并纷纷登榜TOP100,其市占率分列全国前三。
2021年3月,“十四五规划”中明确提出,要“加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群,建设E级和10E级超级计算中心”,根据规划,合肥、兰州、厦门、太原等地多地都将陆续建立高性能计算中心,而“东数西算”工程的落地,有望进一步促进西部地区发展高性能计算中心。2022年2月,发改委批复同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。
“十四五”规划、新基建以及东数西算工程,驱动高性能计算进入快速增长期。
从计算到存储,高性能计算突破“最后一公里”
对很多人来说,高性能计算的核心是计算。这是因为早起计算能力存在明显的不足;而如今,伴随着异构计算越来越多的应用,加上GPU、FPGA、ARM等诸多架构芯片的出现,计算效率呈指数级提升,而高速网络也让这些计算成果让数据本身能够发挥更大的价值,许多应用中存储成为了瓶颈;也就是说,在计算能力的飞速提升和网络数据的高带宽低延迟进入新阶段的今天,与之相适应的就是存储应用也实现海量可扩展与智能化的数据管理。
以8K高清视频为例,其码流为400~2000Mbps,每小时视频占用空间高达5~10TB。北京2022冬奥会和冬残奥会是全球首次规模化使用8K视频技术进行转播和报道的体育赛事,2400小时节目文件共计占用了3PB的存储量;复旦大学类脑智能科学与技术研究院在探秘大脑工作和发病机制过程中,采用国内目前场强最高的活体磁共振机器,以16个节点、PB级存储空间起步,并随着研究数据量增长实现容量线性扩展;设在亦庄的自动驾驶汽车实验基地,每天存储的数据超过300PB,未来投入商业应用后,一个城市众多的车辆将产生ZB级数据,为存储产业带来巨大的商机。
容量带来的难题可以通过增加存储设备来解决,但更重要的是存储效率。而业务场景不同,对于存储的需求也各不相同,衡量存储行业性能的“风向标”呼之欲出。于是,自2017年11月开始,美国和德国的SC大会上除了发布TOP500榜单,还发布一套名为IO500的榜单;IO500能够以接近真实应用的情况体现系统存储性能差异备受青睐:上一期的IO500成绩中,位居IO500总榜榜首和10节点榜单榜首的是华为Atlas 900服务器并运行在麒麟系统之上的“鹏城云脑Ⅱ”。
对于传统高性能计算应用来说,无论是生物基因、高能物理还是流体力学、视频处理等多种科研应用都会利用到海量数据,而提升数据的存储空间和利用率就能够更好的提升高性能计算的发展。
2022全球闪存峰会即将召开,“高性能数据管理与存储系统论坛”将邀请清华大学副教授、智源青年科学家翟季冬,国家超级计算长沙中心总工程师、湖南大学教授唐卓,中国科学技术大学计算机学院副教授李永坤,华中科技大学副教授、博士生导师刘海坤,国防科技大学计算机学院副研究员马胜等专家出席论坛发表精彩演讲,敬请关注!
【根据网络资料整理】