唯一双路架构ARM服务器ThunderX特性解析

12月9日,2016中国存储峰会在北京举行,Cavium/QLogic中国区总经理卢涛介绍了最新的基于ARM按机构的ThunderX服务器,它是目前唯一支持双路架构的ARM芯片服务器。从用户体验上讲,性能与英特尔差不多;高集成度;可以针对一些特定的应用进行一些优化,比如存储,网络和安全等等。

卢涛表示,从各种不同场景的测试来看,ThunderX并不弱于X86,甚至在很多指标上已经实现了超越。从TCO的角度,相同计算节点、存储节点,ThunderX的TCO更低。

以下为卢涛演讲摘录。

刚刚的讲解非常精彩。我们做的事情跟大家有一点不一样,但也是在这个产业链里面。今天主要介绍一下,从一个芯片公司角度,如何帮助大家可以构建更有竞争力存储产品以及相关的一些应用。

这是一款新产品,基于ARM服务器芯片,产品名字叫做ThunderX,这个是ARM服务器芯片。从服务器角度,有几点跟X86是一样的,一样的操作系统;第二,既然是服务器,就是跟英特尔最主流产品性能相当,或者是更好;然后,就是当前大家使用英特尔服务器,不管是什么应用,很多的场景都用这个方案。

%e5%9b%be%e7%89%873

但是,ThunderX目前是唯一支持双路架构的ARM芯片服务器。从用户体验上讲,性能差不多;高集成度;可以针对一些特定的应用进行一些优化,比如存储,网络和安全等等。

这个是处理器一个系统框图,黄色部分是CPU核心,有很多处理器,是自主开发的48核处理器。这个可以通过右侧CCPI实现互联,就是SSMP;另外,左侧非常重要,我们有16个控制器。然后,这个芯片里面集成万兆40级网络接口,最多可以到8个。

%e5%9b%be%e7%89%874

我们针对不同的业务,还有很多的应用加速引擎。针对安全,有一些专门应用单元。然后,有一些专门的计算单元。比如在做分布式存储时候,要求实时压缩减压缩,这个里面集成一个减压缩的硬件模块。总之,这是一个很完整的一个系统。

做超融合,需要一个解决方案,今天拿这个作为一个案例来讲,怎么样利用相关技术构建一个整个环境。

%e5%9b%be%e7%89%875

这里面需要交换机,我们这上面有一个交换芯片,这是一个SDN的可编程软件。下面这个OSD,还有存储集群,我们就是构建一个存储服务器。这样在一个机架里面,最多可以到两个PB存储空间,还有就是64位存储器,1920和存储内核。然后,也是非常大的内存,10T-20T内存,720Gbps网络带宽,1726Gbps存储带宽。

往这个里面看一下,有网络交换机,有计算,以及有OSD,这里面怎样组织的?在这个框图右侧,就是一个OSD,这里面有一个ThunderX处理器,支持16个SATA2 6Gb/s。所以,这个里面可以有两个SSD操作系统。另外,有14个硬盘,通过SSD做日志,有12个做数据。上网络以后,就可以出40G接口,上交换机。这是从系统配制的角度。这是一个单独的48核或者24核处理器,可以根据应用场景做不同的系统配制。

%e5%9b%be%e7%89%876

看一下ThunderX Ceph平台。主板,里面有处理器芯片,8个内存的插头。另外有一些接口,然后,另外有16个SATA2 6Gb/s 接口,有一些40G网络接口,这可以构建一个系统,比如可以支持12个硬盘,2xSSD,还有内存,Ubunte 16.04操作系统。

%e5%9b%be%e7%89%877

进一步往机器里面看一看,中间是一个ThunderX处理器,左侧是硬盘,有SSD,右面就是网络接口。比如说,做计算的时候,可以选一个24核处理器,然后CPU配比,一个OSD,对两个CPU核心。如果是存储,12+2这样一个硬盘,可以做到1比6,OSD,还有SSD这个配比。网络部分,选择机器硬盘,还有SSD这个配制,是选择出10G,40G网络接口,每一个可以出240个OSD。然后,有很多网络带宽处理这些业务。

%e5%9b%be%e7%89%878

这是一个在运行ThunderX24的情况下跟英特尔对比的情况,英特尔是用E5 2620v3处理器,我们运行同样版本操作系统,同样的内存,同样硬盘配制情况下,做了两种测试,第一种,就是对象存储,还有一种块存储,我们看到大部分的场景基本上跟英特尔持平,有些场景可以超过英特尔。

%e5%9b%be%e7%89%879

大家都在讲TCO。如图,左边是基于ThunderX计算节点,存储节点,右边就是基于英特尔X86,需要芯片组,需要外置网卡。如果都是做存储,需要CPU,需要芯片组,需要HBA卡,再需要这个这个网卡组件这样的系统。非常简单,不管是计算节点,还是存储节点,就是一个芯片都是可以搞定,不需要任何扩展。所以,整体上TCO更低。

%e5%9b%be%e7%89%8710

总体上,ThunderX Ceph可以降低40%和60%的成本。性能,因为多核,通过优化内核和OSD的比率,可以非常大限度提高对象存储、块存储的性能。网络带宽方面,我们有一些接口,还有非常好的一些功能。

%e5%9b%be%e7%89%8711

两个存储的应用场景。第一个,作为存储系统应用,我们是用48核处理器,大概最高或者是排第二位的一个处理器,2千多美金一个处理器。同样的环境,同样的应用,我们可以看到ThunderX都比2690 V3有一个更好的表现。

%e5%9b%be%e7%89%8712

数据库,也是某种意义上的存储应用,如图,我们是48核处理器,因特尔也是2690 V3,跟英特尔比较起来,平均是14%的提升。实际业务场景里面,特别是高并发业务场景,我们不仅仅是性能很好,还非常稳定。当然,英特尔也非常稳定。

%e5%9b%be%e7%89%8713

看看生态。过去2年的时间,我们花了非常多的精力构建基于ThundnerX的生态系统。最下面就是服务器平台,中间是平台软件,还有操作系统,虚拟化,最上面,开发工具。主流的都在里面了。

%e5%9b%be%e7%89%8714

%e5%9b%be%e7%89%8715

今年8月份,我们收购了QLogic,它是Cavium的全资子公司。我的报告到这里了。谢谢大家。