对于关注服务器基础设施的媒体来说,这些年来很少看到有谁在详细介绍处理器和服务器平台了。然而,2019年10月下旬,戴尔易安信高调向媒体介绍了五款基于AMD服务器新,新处理器新服务器的新特性令人眼前为之一亮。
2017年,当第一代(EPYC)霄龙那不勒斯发布的时候,很多人在好奇,那不勒斯能让AMD扳回一局吗?结果证明,只有少数几个OEM厂商发布了有限的服务器,AMD对数据中心带来的冲击非常有限,人们纷纷感慨,重回数据中心市场的说法止步于想法。
2019年8月,AMD正式发布第二代霄龙-罗马(Rome)架构处理器,第二代霄龙在核数,性能,能效,内存,IO带宽,安全能力等方面均有许多优势。AMD中国区商用事业部销售总监周俊杰介绍说,这次是AMD倾尽全力的打造的方案。颇有背水一战的气势。
确实,从一些性能指标上来看,新一代处理器有了质的飞跃,7nm工艺制程带来了更大的施展空间,而且,许多参数相比上代都是翻倍了。比如上一代最高32核,新一代霄龙处理器则是64核128线程,而且在功耗,性能上均有很大优化和提升,PCIe 4.0的引入使得IO带宽翻倍,在安全性上的设计也非常具有针对性。
随着第二代霄龙处理器的推出,许多OEM厂商都推出了AMD服务器,到现在为止,包括思科,戴尔易安信,HPE,克雷(Cray),联想,超微(SuperMicro)等都OEM出了服务器产品。其中,戴尔易安信一口气推出了五款服务器,包括单路1U的R6515和2U的R7515,双路的有R6525,R7525,另外,还有一款C6525。
R6515是1U单路服务器,主要会集成到OEM厂商的集成系统里,另外,会有少数用户会在高密度虚拟化场景里使用,还有一部分用户会在边缘计算场景里使用。
R7515是上一代基于霄龙一代那不勒斯R7415的下一代产品,与上代相比性能提升了左280%。这款产品在中国市场非常受欢迎,虽然是单路服务器,但IO扩展性方面有所增强,可放置多个存储设备,所以,经常可用作软件定义存储的服务器,用在互联网或者电信运营商的数据中心里。
R6525主打HPC场景,很多高校会将R6525用作高性能计算节点。戴尔科技集团大中华区服务器产品市场高级经理秦建丰表示可能会有很多用户从原有的平台上迁移到这款服务器上。
C6525是一个2U4节点的服务器,该服务器主要适用于HPC和数据分析等计算密集型场景,也有用户将其用作前端Web服务器,C6525的密度可以做的比较高,可比较好的满足高密度计算场景。
R7525更多用在云平台上,支持数据库等场景,还将支持AI等新兴工作负载。
性能提升成几倍的节奏,这在服务器近年来的发展趋势中几乎看不见了,但AMD做到了。
作为OEM厂商,为了发挥新的处理器的优势,需要做许多新的设计工作。并不是只是换上新的处理器那么简单,秦建丰表示,市场上确实有少部分厂商会简单升级处理器,然而并没有用到新一点处理器的新特性。
为了用上新的处理器并且充分发挥新一代处理器的优势,需要做哪些设计呢?
秦建丰举例说,几年前常见的处理器功耗为165瓦,不久前,功耗开始做到了205瓦,而现在已经有240瓦的了,而我们知道,霄龙二代主频最高为3.4G,标称TDP最高为225W,如何在2U的空间内进行散热设计需要考虑很多方面,比如要考虑高密度摆放的内存条,需要考虑内置的GPU散热等,为此需要在OEM厂商在主板上做许多重新设计。
从秦建丰的介绍中也了解到,从PCIe 3.0升级到4.0之后,由于带宽的提升,信号会产生干扰,使得数据完整性问题也比较突出了,如果要用PCIe 4.0的话就不得不进行一些特别设计,不过目前支持PCIe 4.0的设备还比较少,现阶段还无法发挥PCIe 4.0的优势,相信明年会有很多PCIe 4.0的设备上市。
在安全性方面,基于AMD的服务器也会将AMD CPU上具备的安全特性保留下来,比如内存加密和虚拟机加密技术等,与PowerEdge服务器层的安全手段联合起来,在安全上迈向了新的高度。
AMD带着x86处理器重回数据中心领域,不可避免地将与原有的x86服务器共存在一个数据中心里,为了简化管理,PowerEdge可集成虚拟化平台,可以嵌入到VMware的管理体系里,也可以完全嵌入微软的管理系统里,以此对接与其他云平台,提升其互操作性。
戴尔易安信是国内市场上较早推出基于AMD服务器的厂商之一,而且一口气发布了五款,秦建丰表示明年还会有更多的AMD服务器新品推出,作为老牌服务器厂商,新的AMD服务器将沿袭许多之前PowerEdge服务器就有的特性,比如智能化的管理特性(原有的管理特性在PowerEdge上完全可用),比如在部件冷却上会采用矢量散热等。
几年前在说的CPU性能过剩的问题,现在很少有人这么说了,相反则出现了很多专有硬件在offload CPU的负载,摩尔定律几近失效,然而,人们对计算力的需求在持续提升。用周俊杰的话说:用户非常渴望计算力!
周俊杰举例说,国内某大型互联网公司在每年的十一月和十二月前后迎来业务高峰期,不得不部署额外的资源,而这样的业务规模在第二年则成了常态,可见业务增长的速度是多么的快。业务增长的规模将直接拉高企业在基础设施上的投入。
AMD新一代霄龙处理器带来的性能提升打破了多项性能记录,对用户来说,非常实在的益处是:单位计算能力的提升可以直接或间接地降低TCO。
直接来计算的话,按照性能与成本的比例计算,花更少的钱能收获更多性能,TCO收益。间接来看的话,计算密度的提升一方面可以减少空间占用,节省数据中心宝贵的空间,另一方面,单台设备能力的提升可能会减少原有设备数量(或者核数),由于很多商用软件的收费是按照核心数或者Socket数来计费的,间接降低TCO。
兼容性方面,周俊杰宣称AMD霄龙处理器可100%兼容x86应用,也就是说现有的基于x86的应用也能运行在AMD的平台上。但秦建丰介绍说,在实际应用中,许多用户也都会自己做测试做验证,然后在大规模投入到生产环境。
总而言之,戴尔易安信是在努力向用户证明,使用AMD处理器并不需要用户做太多别的操作,降低了用户迁移到AMD服务器的门槛,能享受到很多原来PowerEdge服务器就有的特性,可无障碍的融入现有的IT基础设施环境,而且还能收获很好的TCO效益。
不过,目前,AMD霄龙的处理器主要还是聚焦以单路和双路为主,四路及以上的服务器场景相对较少,秦建丰表示看好将来以双路替代现在的四路服务器的趋势。