在2018国际超级计算大会(ISC2018)上,AMD介绍了来自英业达 ( Inventec )、AMAX、Exxact和Supermicro的高性能计算服务,这四款服务器都是基于Radeon Instinct显卡加速器和EPYC(霄龙)处理器。
时隔多年之后,AMD重回数据中心高性能计算服务器市场,推出霄龙系列处理器,AMD素来以性价比著称,新推出的处理器在同等性能下,价格会比同类产品低出一截,如今也不例外。
从市场反应来看,一些通用服务器厂商陆续推出了基于该处理器的产品,一些云服务商也开始使用,还有一些高性能计算集群,一些云计算服务商也在采用霄龙处理器,市场是欢迎AMD回归的。
不久前,AMD还展示了代号为“Rome”的下一代7nm EPYC(霄龙)处理器,新一代的霄龙处理器基于Zen 2架构,最多32核64线程,支持八通道内存,16个DIMM插槽,单路支持最大2TB内存,并可提供128条PCI-e 3.0/4.0通道。
与同类友商英特尔相比,AMD的制程优势非常明显,而且,AMD一直就有独立显卡产品线。有消息称,今年后半年,AMD还将发布7nm Radeon “Vega”专业版/数据中心版显卡,数据中心显卡超强的并行处理能力在人工智能工作负载下得到了充分发挥。
既有服务器处理器又有数据中心显卡,意味着在市场上AMD将面临着英特尔和英伟达的双层压力,不过从产品方案来看,同时整合了AMD处理器和AMD显卡的服务器首先就有许多新意,那么,这样的产品有哪些优势或者独特之处呢?
以英业达(Inventec)的P47G4服务器为例,我们来简单介绍一下这款服务器。
英业达 P47G4是一款单路2U的HPC服务器系统,可挂载四块显卡加速器,半精度浮点(FP16)运算的计算能力能达到100 teraflops。一块AMD EPYC处理器最高提供32核,8内存通道和128条PCIe 3.0通道。多核心和大内存意味着可支持更多的虚拟机。
英业达 P47G4的后面板,红色区域为显卡插槽位
英业达 ( Inventec )官网上的一段介绍写道,无论是单机部署,或者搭建私有云的服务器集群,或者是在混合云环境下,英业达P47G4系列服务器都能提供核心/线程数,内存,IO带宽和安全性之间的绝佳平衡。
计算密度方面,英业达P47G4系列服务器能在单路服务器中挂载四块专用显卡,一般来说,要用上四块显卡的时候通常需要双路服务器,或者接上PCIe交换机来添加额外的显卡。
上文两次提到了EPYC处理器的128条PCIe 3.0通道,可以加显卡,也可以加NVMe存储,这给计算性能或者存储性能的扩展性能带来了很大的想象空间。
存储密度方面,该系列服务器最多8块SATA硬盘或者6块SATA加2块U.2 NVMe SSD,不需要额外配置HBA卡了。与此同时,还支持两块板载的M.2 NVMe SSD,进一步提升存储密度。
在安全性方面, 英业达P47G4系列服务器还采用了业界首个嵌入式x86芯片级数据安全方案,英业达P47G4系列尽可能地降低了攻击的可能,而且采用了AMD的一些保护软件和数据安全的方案。
Radeon Instinct MI25 显卡加速器
英业达P47G4主打的场景是人工智能AI和HPC场景,需要很高的并行计算能力,它采用的显卡是Radeon Instinct MI25 显卡加速器,为了让用户更好地应用在这些场景中,AMD还推出了这两个软件平台:ROCm和MIOpen,这就是AMD 深度学习解决方案。
包括英业达P47G4在内的几个系统都可使用ROCm平台和MIOpen(机器学习框架库)库,为用户TensorFlow或者Caffe这样的深度学习框架环境,了解这几个深度学习框架的朋友都知道,通常只搭建CPU版本的深度学习环境会比较简单,搭建基于GPU版本的框架会比较复杂,为了充分利用GPU的性能还需要进行一些设置。
而且,通常一些深度学习框架都是针对单台设备而设计的,想在集群中使用GPU的话就比较麻烦了,对此场景,目前业内有一些专业的方案,为了方便用户利用多个GPU,AMD做出了一个叫ROCm的GPU开放计算平台,可水平扩展多个GPU进行计算,并且向外提供支持多种编程语言的API,在ROCm之上MIOpen提供了机器学习框架供开发者使用。
简单而言,在AMD 深度学习解决方案的帮助下用户可以按需求选购服务器,组成机器学习计算集群。英业达P47G4这样单路服务器在成本和配置方面给用户带来了很大的灵活性,物尽其用地满足用户的各种应用场景需求。
同样采用AMD显卡和AMD CPU“双A”方案的还有AMAX的ServMax P47,而且也是在2U的空间内置4块Radeon Instinct MI25显卡。
当然,只采用AMD Radeon显卡的也有,比如Exxact的Tensor TS4-672702-AML 4U服务器,超微的SuperServer 4029GP-TRT2的4U服务器,采用的都是英特尔至强处理器,但是都内置了8块Radeon Instinct MI25显卡。
AMD重回数据中心、企业级计算市场令人眼前为之一亮,不同于英特尔和英伟达,AMD同时手握CPU和GPU两条产品线的优势,可以在人工智能计算场景下得到充分发挥,AMD是显而易见的一股颠覆力量,但在乍暖还寒的当下,AMD在这一市场上的生态布局与友商相比之下尚有欠缺,以英业达为代表的创新服务器厂商的率先尝试,也在证明,事情正在悄然发生着变化。
英业达 ( Inventec ) 桃园厂
英业达集团创立于1975年,英业达企业计算机业务群( Inventec Enterprise Business Group ,Inventec EBG)成立于1998年,服务器业务已有二十年的历史,从英业达企业计算机业务群(Inventec EBG )总经理蔡枝安(Jack Tsai)的介绍中了解到,英业达拥有服务器从研发、设计、生产、到配送及技术支持全方位的能力,获得了包括超大型数据中心、世界领导服务器品牌、服务器硬件集成商等多个领域客户的信任。
英业达 ( Inventec ) 上海浦东厂
如今,人工智能的兴起,从一些角度来看,图形运算与人工智能的工作负载有大量重合之处,深耕服务器研发制造20年的英业达(Inventec)如今发布高性能计算P47G4机架服务器,在计算、内存、IO和安全性方面进行了深入优化,并且强调能降低企业数据中心TCO。
TCO是数据中心永远绕不开的话题,摩尔定律最吸引人的就是能让人花更少的钱,做更多的事儿,作为数据中心的重要组成部分,服务器厂商自然责无旁贷,未来,随着新一波的计算负载的兴起,随着AMD在市场上的发力,随着越来越多的像英业达P47G4服务器这样的创新产品应用,计算市场必然发生新的变化。