在突发的新型冠状病毒(COVID-19)的研究工作中,科研人员首先需要对病毒样本进行基因测序,才有可能根据测序结果采用生物信息学方法进行比对和查找,以找到病毒的来源和传播的最大概率宿主,并根据病毒特性决定下一步的防控和治疗手段。病毒体的基因会产生TB级乃至PB级的海量数据,尤其是高通量测序技术产生的DNA序列数据量非常巨大,目前伴随着高通量测序技术的发展,各种生物学数据呈现爆炸式增长,DNA测序数据平均4~5个月就翻一番,面对如此迅速增长的庞大的短读序列数据集,如何有效管理、分析和利用,已成为生物信息学发展亟需解决的问题,而高性能计算(HPC)将能够帮助科研人员解决这一挑战。
在更广泛的行业领域,如石油、气象、CAE、核能、制药、环境监测分析、系统仿真等计算密集型应用领域;以及图书馆、银行、证券、税务、决策支持系统等数据密集型应用领域;还有如网站、信息中心、搜索引擎、电信、流媒体等通信密集型应用领域,HPC正在通过模拟、建模和分析,帮助人类解决需要强大算力的技术难题,引领人类走向 “第四次工业革命” 。
在信息化、数据化不断发展的今天,HPC已经由最初需要执行复杂数学计算的研究科学家所采用,到如今逐渐大众化,赢得了越来越多企业组织的青睐。面对信息时代爆炸性的数据增长和蓬勃发展的数据收集、分析等需求,社会各领域对于HPC算力的渴求日益增长。
高性能计算走下“神坛”, 规模应用带来算力需求飙升
近 几年来,HPC的应用广度得到前所未有的扩展,以数据驱动或数据密集型计算为主要特征的高性能计算应用不断涌现。HPC已经被普遍应用到了生物信息与生命科学领域、智慧城市与城市治理、网络信息安全等社会生活的方方面面,变革着人类对未来科技的想象。
许多企业和IT领导者都以为HPC系统是基于超级计算机的。实际上,HPC虽然被大量应用在由Atos、IBM、HPE、Cray和Fujitsu等公司生产的超级计算机中,但还有一种更广泛使用的方法是将多台小型计算机集成到互连的集群中以提供高性能计算功能。这种方式被广泛地应用于各社会生产领域,有效提升了企业信息处理能力和数据计算速率。
面对指数级攀升的数据增量,无论以哪种应用方式,“算力”都是摆在企业和组织面前的最大诉求。要想提升高性能计算水平,人们需要更高的吞吐量和处理能力(CPU 和 GPU)。AMD作为高性能计算和图形技术领域的行业领军者,近些年来在高性能计算领域表现十分抢眼。无论是在高速互连中协同工作的高性能AMD EPYC CPU和Radeon Instinct GPU,还是AMD开放的生态系统支持的开源AMD ROCm异构计算软件,都为HPC用户带来了足够靓眼的成绩。
第二代AMD EPYC 处理器引领高性能计算新标准
第二代AMD EPYC处理器作为全球首款7nm X86服务器处理器,为HPC用户提供了无与伦比的完美性能组合,包括凭借创纪录的浮点性能、突破性的架构、超高的x86核心数量和超强的内存及I/O带宽。从其打破的140+项世界记录的性能表现和市场反馈来看,高达64核的第二代EPYC无疑是当前市场上最能迎合HPC用户算力需求的尖端产品。
从性能方面看,第二代AMD EPYC为HPC用户带来了堪称 “地表超强” 的卓越性能。第二代EPYC处理器在许多HPC性能标准上都取得了高分,比如高达2倍的FLUENT计算流体动力学性能、最高提升79%的LSTCLS-DYNA有限元分析性能、最高提升72%的RADIOSS结构分析性能、高达60%的GROMACS分子动力学基准提升(相比2019年3月),以及高达79%的浮点性能提升。
对于HPC用户看重的安全性,第二代EPYC同样将安全防御做到了极致。AMD EPYC通过先进的安全功能实现强化到硬件核心的安全性。通过率先集成专用安全处理器,为安全启动、安全内存加密(SME)和安全加密虚拟化(SEV)等安全功能提供了基础。比如,可用于安全加密虚拟化的509个加密密钥,内置在内存控制器中的AES-128加密引擎,以及通过简单的BIOS设置,无需更改软件即可进行的安全内存加密等功能,为用户减少了对数据风险的担忧,使其能够将更多精力集中在业务运营上。
除此之外,基于AMD Infinity Fabric总线技术的Chiplet小芯片设计架构,保障了用户能够借助EPYC持续进行创新。第二代AMD EPYC采用的Chiplet设计是一种混合多芯片架构,这种架构在第二代AMD EPYC 处理器中的应用达到了新的高度。Chiplet设计架构分为两大部分:八个晶片作为处理器核心,每个晶片上有8颗x86计算核心,一个I/O晶片负责处理器安全和外部通信。这种灵活的设计不仅使CPU核心得以采用先进的制程工艺,同时让I/O电路能够按自身规律发展,也正是由于这种非一体化的芯片设计,用户可以借助EPYC更早地使用到高达64核的超高计算性能。
强大的HPC性能,吸引着全球领先的高性能计算用户加入到AMD EPYC的阵营。AMD同美国能源部橡树岭国家实验室合作研发超级计算机Frontier,预计将在2021年交付时成为世界上性能最强的超级计算机。AMD联合劳伦斯利弗莫尔国家实验室(LLNL)和HPE,采用下一代AMD EPYC CPU和AMD Radeon Instinct GPU,以及开源的AMD ROCm异构计算软件。计划在2023年初交付El Capitan系统,拥有超过2 exaflops(百亿亿次)的双精度性能,预计交付后将成为新的世界上最快的超级计算机。数字转换的全球领导者Atos正在向法国气象局提供两台基于第二代EPYC的BullSequana XH2000超级计算机,用于大气、海洋和气候科学的动态天气预报和研究。此外, HPE, 戴尔科技集团,苏黎世联邦理工学院、圣地亚哥超级计算中心等均宣布推出或使用基于第二代EPYC的超级计算机。
合作伙伴生态持续扩张,助力用户向云端及AI超算升级
随着技术的进步,HPC正在与云计算、机器学习、大数据分析、人工智能等技术结合,推动高性能计算迈向新的阶段。将HPC与创新服务交叉需要构建新的基础设施,这对处理器的性能和生态系统均提出了更高的要求。
第二代AMD EPYC处理器自发布以来,获得了来自全球各领域合作伙伴的大力支持。发布后已有包括有技嘉和QCT等原始设计供应商,博通、美光、赛灵思等独立硬件供应商(IHV),微软和多个Linux操作系统供应商,以及主流云提供商腾讯云、AWS,Microsoft Azure,Google Cloud,Oracle Cloud等的加入。
对于云环境下的HPC需求,Microsoft Azure早前基于第一代AMD EPYC处理器的Azure HB云实例,获得了此前无法企及的计算流体力学(CFD)性能水平。如今Azure针对高性能计算的Azure HBv2虚拟机已经提供预览,进一步突破了云端高性能计算的边界。谷歌也于近期在采用第二代AMD EPYC(霄龙)处理器的谷歌计算引擎上推出了 N2D虚拟机的测试版本,为客户带来了顶尖的高性能计算体验。
伴随着云计算的进一步深入,基于容器化和云的工作负载逐渐在HPC环境中占据主导地位,AMD与主流云提供商的密切合作,将能够确保用户能够在云端以较低的成本获得HPC的超级计算性能。
另一方面,针对人工智能的发展对算力提出的更高要求,AMD也在不遗余力地联合硬件合作伙伴,以满足HPC系统需要的异构计算平台需求。异构计算相比传统 CPU 拥有更高的并行浮点运算效率,更高的峰值处理能力,更高的吞吐量,以及更低的延迟,在这方面的准备也为AMD在HPC领域的发挥留下了极大的想象空间。
在中国这个全球最大的半导体消费市场,巨大的算力是支撑信息技术升级的底层基础。面对信息时代爆炸性的数据增长和蓬勃发展的数据收集、分析等需求,各行业各领域对于算力的渴求空前高涨。新冠疫情当前,中国的科研人员短时间内迅速取得了举世瞩目的研究成就,为控制并最终战胜疫情做出了巨大贡献,让我们深切地感受到了 “科技战疫”、“计算战疫”的力量。疫情结束之后,相信基于IT技术的创新科技将会进一步加速在各个领域的应用。第二代AMD EPYC在技术和性能上的优势,加之其领先的总体拥有成本(TCO)优势,使其能够为HPC用户提供源源不断的算力支持,以满足企业和科研机构对于高性能计算的需求,助力各领域步入“算力时代”。