AMD 引领高性能计算迈向百亿亿级计算时代

——世界超级计算机Top500强榜单中采用AMD EPYC处理器的系统加速增长,与11月榜单相比数量翻番并占据一半的新增系统


——AMD EPYC处理器和AMD Instinct加速器可助力实现工程上的突破,为解决世界上最复杂科学挑战的研究提供动力

在今年的2021国际超算大会(ISC2021)上, AMD公司(超威,纳斯达克股票代码:AMD)展示了其AMD EPYC(霄龙)处理器和AMD Instinct加速器在高性能计算(HPC)行业的强劲势头,带来了ROCm开放软件平台的更新,并推出了AMD Instinct教育和研究(AIER)计划。而最新公布的世界超级计算机Top500强榜单则显示了AMD EPYC处理器在HPC系统中的持续增长。采用AMD EPYC处理器的系统数量是2020年6月榜单的近5倍,与2020年11月榜单相比也增加了一倍以上。此外,在2021年6月的新榜单中,AMD EPYC处理器占据了58款新上榜系统的半壁江山。

AMD 公司高级副总裁兼数据中心与嵌入式解决方案事业部总经理Forrest Norrod表示,“高性能计算对于解决全球最大、最重要的挑战至关重要。凭借我们的AMD EPYC处理器和AMD Instinct加速器,AMD将继续成为高性能计算的理想合作伙伴。我们致力于提供推进科学发现所需的性能和能力,打破百亿亿级障碍,继续推动创新。”

AMD HPC持续强劲势头

随着最近推出的可为高性能计算工作负载提供卓越性能的AMD EPYC 7003系列处理器,AMD将继续助力其合作伙伴和客户,为各种规模的集群,跨关键研究领域部署,包括制造、生命科学、金融服务和气候研究等。

2020年 Intersect360对高性能计算用户针对CPU印象的感知研究显示,AMD EPYC处理器在受访者中拥有78%的好感,高于2016年的36%。在Intersect360于2021年对高性能计算机构进行的一项关于AMD EPYC在其站点内渗透率的调查中,23%的受访者表示他们已广泛使用AMD EPYC处理器,另有47%的受访者表示他们正在某种程度上测试或使用AMD EPYC处理器。

最近使用AMD高性能计算解决方案的系统包括:

——保加利亚 EuroHPC Atos BullSequana XH2000 超级计算机, 由AMD EPYC处理器驱动,用于生物信息学、制药、人工智能、气象等领域的科学发展。

——剑桥大学的剑桥数据驱动探索服务 (CSD3) , 采用戴尔EMC PowerEdge XE8545服务器,由第三代AMD EPYC处理器驱动。

——杜伦大学COSMA8超级计算机,采用戴尔EMC PowerEdge C6525 服务器,由第二代和第三代 AMD EPYC 处理器驱动。

——用于英国气象局的微软Azure超级计算机,在HPE Cray EX超级计算机中采用第三代AMD EPYC处理器和下一代AMD EPYC处理器,预计可提供60 千万亿次的先进算力,用于天气和气候研究。

——美国国家大气研究中心的超级计算机,由第三代AMD EPYC处理器和HPE Cray EX超级计算机提供动力,支持美国对地球科学的前沿研究和探知。

——Perlmutter超级计算机 ,来自美国国家能源研究科学计算中心(NERSC)和劳伦斯伯克利国家实验室,其HPE Cray EX超级计算机的节点包含第三代AMD EPYC处理器,其可提供的算力是NERSC现有的4倍。

——新加坡国家超级计算中心超级计算机,由高性能计算资源中心支持建造,采用第三代AMD EPYC 处理器,其算力理论峰值性能预计可达10 千万亿次。

AMD ROCm软件支持持续更新

AMD正在推出其新的AMD Instinct教育和研究(AIER)计划,旨在帮助科学家、研究人员和学者加速其代码在AMD Instinct加速器上的性能。AIER计划根据会员要求,提供对AMD Instinct技术、AMD ROCm学习中心和ROCm软件的远程访问,以及对AMD软、硬件解决方案的技术指导支持。除了区域解决方案合作伙伴外,AIER计划的全球解决方案合作伙伴还包括戴尔科技、技嘉、HPE和Supermicro。

随着支持AMD加速器的应用程序、第三方库和框架的不断增加,ROCm开放软件平台继续获得行业的支持和动能。HPC社区已经欣然接受将HIP作为一种异构编程模型,开发人员可以使用HIP编写或调整其代码,包括Gromacs、TensorFlow和GridTools等,以在AMD GPU上加速。

此外,用于ROCm的PyTorch现在可作为可安装的Python包使用,包括使用AMD的MIOpen和RCCL(通信)库进行混合精度和大规模训练的完整功能。这一创新为数据科学家、研究人员、学生和其他在社区中的人员提供了一种新的选择,可以开始使用AMD GPU加速PyTorch。最近,一个Python开源数组库CuPy,在其新推出的9.0版本中扩大了其对传统GPU的支持,该版本现在为GPU加速计算提供了对ROCm堆栈的支持。

坚守推进前沿研究的承诺

去年,AMD宣布成立了COVID-19高性能计算基金,并捐赠由AMD EPYC处理器和AMD Instinct加速器驱动的系统,为研究人员提供千万亿级的计算能力,以抗击疫情。迄今为止,AMD已经向包括麻省理工学院(MIT)、纽约大学(NYU)、莱斯大学、德克萨斯大学奥斯汀分校和多伦多大学在内的7个国家/地区的23家研究机构,提供了超过12 千万亿次的高性能算力。

Harry C and Olga K. Weiss自然科学教授Peter Rossky表示, “从COVID-19研究到分析基因组结构,凭借AMD CPU和GPU处理器,理论生物物理中心运行代码的速度比以前快1000到10000倍。在这种变革性的设备上运行并行模拟的能力,使我们能在短短20分钟内就能对一个染色体进行全面分析,而这在过去需要长达一个月才能完成。这些是在加入了AMD的高性能计算能力仅几个月后便取得的成就,我们期待在我们研究人员社区中的采用率将会呈指数级增长。”