再次声明:我们推崇的是“超算民主化”

毫无疑问,第31届国际超算大会(ISC16)传递出了HPC市场一个重要的变化趋势,那就是HPC正从过去主要以密集型计算为主,逐渐往新兴的大数据、人工智能以及深度学习等方向进行融合和演进。

作为一直倡导高性能计算“民主化”的戴尔,同样也在今年的ISC16上重磅亮相,并积极顺应HPC市场的变化趋势,向市场推出了一系列的“HPC Systems”产品组合,希望在生命科学、制造及分析研究领域向用户提供“开箱即用”的HPC系统。

除此之外,围绕HPC软硬件等基础设施,戴尔还推出了全新的产品,以进一步构建自身的核心竞争力。而从这些新产品的设计思路中,同样也能看出戴尔在HPC领域,始终坚持开放、融合的理念,希望和合作伙伴一起共同推动HPC商用化的快速落地。

ab1

HPC继续增长的趋势是什么?

在戴尔云计算/高性能计算部门战略顾问Ed Turkel看来,除传统的HPC市场之外,以数据为核心的HPC应用以及高性能数据分析(HPDA)是推动HPC市场继续增长的主要驱动力。

仔细来看,在传统HPC市场中,计算密集型的建模和仿真应用、计算机辅助设计与制造(CAD/ CAM / CAE)、天气预报以及石油勘探等应用仍然具备刚性的需求。

在以数据为核心的HPC应用中,尤以基因工程、地震预报等新兴应用为主。例如,基因工程中的测序工作就必须要通过大规模的计算分析,才能从海量的数据信息中辨识载有的基因及其序列,最终获取遗传信息等等。

在当下最为火热的高性能数据分析(HPDA)领域,随着大数据时代的到来, HPDA应用将成为HPC的下一个爆点。数据显示,目前67%的HPC资源用于HPDA,这其中欺诈检测、机器学习、深度学习等需求是其中较为典型的应用。

Ed Turkel认为,随着高性能计算门槛的不断降低,HPC应用已由过去的重大科学研究领域向着更为广阔的企业级和商用市场延伸,而人工智能、深度学习等新概念、新技术的出现和发展,更是刺激了社会各个领域对于HPC的需求和应用。

基于这样的判断,戴尔分别针对生命科学、制造及分析研究领域,推出了一系列“HPC Systems”的产品组合,为上述领域的用户使用HPC提供了一套“开箱即用”的解决方案。

ab2
具体包括:第一,专为满足生命科学组织的需求而设计戴尔HPC系统,可帮助生物信息学中心和遗传学中心,根据临床要求的时限交付结果并确定治疗方案,同时确保合规并保护机密数据。

目前,在面向生命科学领域的戴尔HPC系统1.1版本中,戴尔专门针对动物、植物基因检测的数据处理能力进行了优化,同时增加支持英特尔EE Lustre 3.0和NSS-HA 7.0的功能。接下来,戴尔还将在这套系统中增加分子动力学数据分析、Omni-Path(OPA)以及Bright Cluster软件管理等功能。

第二,面向制造领域的戴尔HPC系统,可帮助制造和工程客户运行复杂的设计仿真,包括结构分析和计算流体力学分析。

这套1.0版本的HPC系统中,首次专门针对制造领域的GPU加速、VDI应用方面进行了显著的完善,同样支持Intel EE Lustre 3.0和NSS-HA 7.0,并新增了可选的远程集群管理器等功能。未来,除增加OPA功能外,戴尔还将针对ISV的软件应用进一步进行优化和支持。

第三,针对分析研究领域的戴尔HPC系统,这是一套可帮助研究机构根据各种工作负载的独特需求快速开发HPC系统,以方便用户开展复杂的科学分析。

据了解,戴尔针对研究领域的HPC系统目前为1.1版本,全面支持英特尔OPA、Intel EE Lustre 3.0和NSS-HA 7.0,同时在下一个系统版本的迭代中,戴尔还将在这款HPC系统上率先使用英特尔至强融核处理器“Knights Landing”以及增加right Cluster管理功能。

产品更新强化HPC核心竞争力

实际上,除了上述“开箱即用”的“HPC Systems”家族之外,在今年的ISC16上,戴尔在HPC的软硬件基础设施方面,尤其是针对服务器和网络交换机也做了较为重要的产品更新,具体来说:

ab3
首先,在服务器产品线方面,全新推出了戴尔PowerEdge C6320p。我们知道,PowerEdge C6320是目前戴尔面向HPC市场主力推广的一款产品,这款产品采用英特尔至强E5-2600 v3处理器,每个插槽提供最多18个内核;提供高达512GB的DDR4内存以及72TB的灵活的本地存储。

而戴尔PowerEdge C6320p则专门针对HPC并行计算而优化,在1U半高的的机箱中,通过采用英特尔至强融核(Xeon Phi)处理器,支持288个内核;提供高达384GB的DDR4内存;同时支持SSD和HDD硬盘,提供12TB的本地存储功能,同时还可选用OPA或者InfiniBand网络接入端口,同时通过戴尔的iDRAC8软件,实现了自动化的管理功能。

在性能上,相比上一代产品,达到了3+TFlops;通过2个节点的设计,让内核数量增加了20%;能耗节约了3/4;在Linpack测试中,可实现代码优化高达2倍等等。可以说,这是戴尔目前面向HPC市场中,提供的“旗舰型”服务器。

ab5
其次,在网络产品线方面,戴尔推出了基于英特尔OPA架构的H系列交换机。众所周知,OPA架构是一项专为优化高性能计算的全新互联技术,也是一款端到端的互联解决方案,它可以更广泛的使用户享受到HPC集群带来的性能优势。

更详细的说,OPA架构在链路层面进行了三项革新:一是数据流控制优化;二是数据包的保护机制;三是链路失效保护。通过这些创新,使得网络方面可以拥有更低的延迟和更高的数据完整性。

目前,戴尔提供了H1024、H1048、H9160、H9124等多个型号的交换机以及HFI适配卡,覆盖了用户的大部分应用场景,通过提供更多的网络带宽和更低的端到端的延迟能力,将大大降低用户初期采购投入和后期运营维护成本。

ab6
最后,除上述两个方面较为重要的产品更新之外,戴尔在ISC16上还重点展示了DSS7000、R730和C4130等众多产品,其中DSS7000是业内最高密度的存储服务器,可满足未来PB级存储需求。

据了解,DSS7000基于DCS XA90,能够在一个4U机箱中提供高达720TB的存储容量。同时,DSS 7000配备最多90个热服务3.5英寸驱动器和两个2-插槽服务器节点,以较低的每GB成本为对象和块存储提供云构建模块。

由此可见,在HPC向商业领域迅速普及化的过程中,戴尔深刻洞察到了这一变化,并充分结合了自身的优势,在产品布局和市场推广方面,引领了HPC公司转型的新方向。

戴尔积极推动超算“民主化”众所周知,在今年ISC16公布的TOP500榜单上,以互联网为主的超算上榜套数正日益增加。这其中当数中国最为明显,在榜单中中国HPC系统有67套的部署地是与互联网相关的,其中2016年新上榜的有20套,而这些互联网相关的来源标注也基本都来自中国。

无独有偶,在去年中国公布的TOP100榜单中这一变化趋势也有很明显体现。从当时公布的数据看,国内TOP100榜中,来自互联网服务占比24%、大数据占比17%、电信运营商占比9%、云计算占比8%。

不仅如此,新兴应用占据超过2/3的市场,达到72%,包括深度学习、数据挖掘、视频分析和事务处理等;而传统应用占比仅为28%,包括科学计算、工业仿真等领域。

显然,互联网超算系统的增加,这背后最直接反应了超算应用的变化趋势,即走向“市场化、商用化、普及化”。正如我之前一直坚持的观点,即这些新的需求表明了HPC发展的新方向,即超算市场不但需要“大机器”,也需要更多“贴近用户”,设计和部署“成本优化”的HPC。

从这个角度来说,戴尔提倡和推动的超算“民主化”确实也符合了未来HPC发展的主流趋势。其实,除了积极在产品和市场方面进行布局,戴尔在产业的合纵连横方面同样动作频频,在去年的SC15上,戴尔也宣布成为OpenHPC创始成员。

OpenHPC项目致力于为高性能计算构建一个开源框架,以适应现在工业和学术研究的需求。相信随着后期开源框架的搭建,其也将会引发HPC新一轮的变革和重塑,加速HPC在科研及民用各个领域的落地进程,这也将为戴尔推动的超算“民主化”理念添砖加瓦。

数据显示,2019年全球HPC市场将达到152亿美元的规模,其中中国市场将成为主要角逐之地;同时,随着HPC逐渐向多行业商用领域应用的转移,越来越多的用户对于HPC的应用效率和产品可靠性提出了极高的要求。

总结一下,在这个过程中,我认为凭借着超算“民主化”的理念以及创新的HPC产品实力和布局,戴尔势必会成为超算市场中一支不容忽视的重要力量。