从移动CPU看ARM服务器:梦想很美现实很难

从去年年底开始,ARM服务器一度成为热门词汇,一方面来自于其64位Cortex A50架构的发布,另一方面也来自于几个知名厂商的高调宣传。虽然目前仍然缺乏成熟的应用案例,不过成品、小规模的应用案例已经逐渐出现,似乎未来的服务器市场真的要有ARM进来分一杯羹。

无论是RISC服务器还是X86服务器,都已经在各自的市场里处于非常稳固的地位,这样带来的好处是解决方案非常成熟,能够最大限度保障用户所使用的产品是安全可靠的。但对用户而言可选择的空间越来越小,这样解决方案的缺陷也变得无法回避——因为没有替代方案。比如最直接的服务器能耗问题,就直接与架构特性相关联,只有期待“革命性”的整体解决方案出现,才有机会将其彻底解决掉。

这个能革命的东西,叫做SOC。当前主流的服务器平台上,每一个CPU的背后都是一堆堆的IO芯片、扩展接口做支持,这严重妨碍的运算密度的提升。在这样的平台上,单位体积内能够容纳的芯片规模是极大限制的,因此只能最大限度的提升单节点运算性能。如果将整个主板上的芯片全部进行简化,节省出来的空间全部用来安置运算单元,哪怕是性能差一点的,只要密度够大,说不定也可以全面提升性能。而对于ARM来说,由于长期在移动终端领域耕耘,因此芯片的小型化、低功耗化、集成化是与生俱来的。似乎ARM具备了未来高性能服务器想要的所有元素?

不过ARM真的是救世主吗?虽然此前的一些宣传渠道刻意进行描述,然而在现实中迎来的ARM似乎和描述有一定差距。目前还缺乏ARM在服务器应用方面的数据,不过ARM与Intel之间的竞争发生在两个领域,分别是ARM将要进入的服务器领域和Intel将要进入的移动终端领域。恰巧这两个领域都在集中关注两个关键词,第一个关键词叫运算性能,第二个关键词叫功耗。如果将视角从移动终端领域切入,也许能够分析出ARM在服务器领域的发展前景。

ARM平台的处理器目前主流架构为Cortex A9和Cortex A15两种,另外还有来自高通的Krait架构,根据资料显示这种架构与Cortex A15完全兼容。目前ARM阵营中的主力产品之一就是高通APQ8064,这款移动处理器为四核心设计,并且已经被许多新手机以及移动终端所采用。

Intel的移动平台解决方案来自SOC化的ATOM。即在ATOM处理器的基础上,整合了图形核心、视频解码核心、内存控 制器、显示输出控制器、音频加速模块、摄像头控制器、存储控制器以及各种输入输出模块等众多组件。在2012年初,专门针对移动平台发布了ATOM Z2460处理器,这款处理器核心代号为“Medfield”,具备了ATOM处理器的大部分特性,甚至连其劣势之一的不支持乱序执行“OoO:Out of Order”也继承了下来。在2013年初,Intel将两个Medfield整合成为双核SOC,命名为ATOM Z2580。

因此移动领域,Cortex A15与全新的ATOM直接形成了竞争关系。在CES上,不但有ATOM Z2580的手机实物展示,甚至连测试成绩都被发布出来。根据测试成绩来看,Z2580的性能远远超过了目前主流的高通四核APQ8064,超越幅度为10%,同时有新闻显示,基于Z2580的联想K900最终测试成绩将冲击30000分。

将两个平台延伸到服务器领域,就是我们关注的另外两个产品:即将上市的Cortex A50处理器以及即将上市的代号为“Avoton”的Intel ATOM处理器。由于两款产品都停留于纸面阶段,因此无法进行实际的测试对比。但ARM在介绍Cortex A50架构的产品时,曾经贴出这样一张图。

这张图意在指明下一代高端平台Cortex A57与当前Cortex A15之间的性能差距,由于前面有了ATOM Z2580与APQ8064的实际对比,因此对原本处于不同领域的产品也就有了分析的余地。

结合两张图来看,目前“还有提升空间”的Z2580与Krait平台的旗舰产品APQ8064之间有超过10%的性能领先幅度,而Cortex A57与A15架构的产品之间有大约20%的领先幅度。从这种对比上可以理解Cortex A57是占有一定优势的。但是服务器版Cortex A57的上市时间是2014年,届时会被两种服务器ATOM“夹击”:2013年下半年上市的Avoton ATOM和2014年的Silvermont ATOM,支持双通道内存,内置20个PCIE通道,带有睿频技术,Silvermont支持乱序执行。如果跨过所处的行业限制,纯粹在数字上将 Avoton与Z2580相比,核心数增加到四倍(8核心),频率增加20%到35%(主频2.4GHz,睿频2.7GHz)。在这样的产品面前 Cortex A57还有优势吗?并且ARM必须面对移动平台也要受到四核心Avoton侵蚀的问题。

ARM挺近服务器领域的另一个可能的优势,就是功耗。因为X86服务器的功耗巨大,而且在类似数据中心这样的大规模应用领域,一个广泛的认识就是单节点性能高不如规模足够大,在同样的投资规模下,如果大量使用低功耗处理器堆积节点数量,可以获得性能更好的解决方案。偏偏X86就是单节点性能高的产品。因此ARM认为自己就是那个适合以节点数量战胜现有解决方案的替代品。

然而如今Intel也在低功耗产品上发力,而且SOC化的ATOM处理器看起来也像是能做多节点运算的产品。比如Avoton ATOM,除了处理器之外,还整合了双通道内存控制器、SATA控制器、USB控制器,16条PCIE通道、四路千兆以太网控制器、HD3000级别显示核心等。也就是说单个处理器就可以搭建成一个小型运算平台,并且PCIE通道很容易成为多节点之间的连接通道,这样也就便于服务器厂商设计出节点密度极高的多节点服务器。

说到这,核心思想就是原本ARM Cortex A50能做的事情,通过Intel Avoton一整合,如今ATOM也完全能做了。而且如果拼运算性能和整合度的话,ATOM可能还占有一些优势。

性能、方案方面都缺少优势了,那ARM能够依靠功耗获得独特的竞争力吗?在服务器领域没有测试数据的情况下,我们依然只能搬来移动平台的一些数据作为参考。这次是典型的Cortex A15架构、Krait架构、Clover Trail ATOM之间进行比较,分别是Tegra 3平台、APQ8064平台以及ATOM Z2760平台。

从待机功耗上看,两款ARM平台差距在伯仲之间,Atom Z2760平台具备了明显的功耗优势。

而在跑SunSpider测试期间,三者的满载功耗有一些区分,Z2760处于中间水平。但是测试时间上有所不同。由于ATOM具备了更优秀的运算性能,因此最早回到待机状态,架构相对落后、仅能运行异步多核模式的高通APQ8064平台满载时间最长。

如果服务器领域,ARM寄予厚望的Cortex A50也是这样结果的话,那么可以说与X86相比毫无优势。不但在绝对的功耗比较上根本拉不开差距,而且由于满载时间会更长,即使有微弱的优势也会因为实际运行中长期满载而被逆转。

传统的服务器产品,功耗动辄数百瓦,如果说有类似ARM这样的SOC方案能够搭建高密度服务器,也许ARM真的能做到以量取胜。现在看起来 ARM进军服务器领域的举动,应该就是以此为出发点。但是ARM Cortex A50的发布时间是在2012年12月,此前Intel就已经有了Moorestown、medfield、oak trail、Clover Trail等一代代逐步SOC化的ATOM出现,显然对于ARM来说,无论是产品的进化幅度还是整体战略,都已经慢了。