ARM/DSP混合芯片为数据中心带来可能

惠普正在它的下一代“Moonshot”超大规模服务器项目中推出更多的ARM服务器处理器产品,最新的一个产品来自于德州仪器公司,一直以来该公司在服务器市场上并不显山露水,但在ARM芯片市场上确实异常活跃。

惠普超大规模服务器事业部生态系统战略高级总监Tim Wesselman在他的一篇博文中表示,德州仪器公司已经加入了Moonshot PathFinder合作伙伴计划,并将找出如何将其ARM RISC处理器的KeyStone II型产品用于惠普的Moonshot服务器以满足“大规模、云计算并行实时处理和传统电信工作负载”的需求。

如同所有出自于Calxeda、Marvell以及Applied Micro Circuits令人兴奋的ARM服务器处理器一样,KeyStone II芯片并不仅仅是能够支持服务器级运行负载而已,它们还包括了被用于组成多服务器节点网络的集成网络。

当AMD公司还没有宣布其计划时,就好象未来的Opteron品牌的ARM处理器如果不是配有诸如Calxeda这样的分布式交换架构,也最起码应包括芯载网络适配器和链接SeaMicro的"自由度"。如果不是这样的话,AMD应当不会感到困扰。

坊间传言,惠普将在它的第二代“Gemini”Moonshot服务器中使用德州仪器的KeyStone II芯片,该产品在去年夏天进行了预展。在去年六月的预展期间,惠普谈及的唯一一个处理器是英特尔公司的“Centerton” Atom S1200服务器芯片,该产品于去年十二月推出,但从未提及ARM处理器。

除了使用双核Atom S1200处理器以外,惠普一直都没有对Gemini机器提供多少其他的东东,但这款处理器拥有64位处理能力、支持VT虚拟化技术以及主内存ECC擦除功能,它通过了可运行Linux和Windows的服务器衍生产品的验证。

ARM/DSP混合芯片为数据中心带来可能

惠普Moonshot项目Gemini机箱

从上图来看,好象Gemini机箱大约有十个机架单元高,配有两个可载入服务器“墨盒”的托架。这是任何人从所有公开声明中所能获知Gemini机器的全部信息了,惠普并没有公开表示将在未来的Gemini机箱中使用德州仪器的KeyStone ARM处理器。

惠普也没有表示,与公司于2011年十一月推出的“Redstone”Moonshot机箱相比,Gemini服务器将如何进行配置,前者使用了32位Calxeda ECX-100 ARM芯片,其中包括了一个非常智能的芯载分布式两层交换机。

因为Calxeda与惠普在Redstone上的长期合作以及Calxeda的产品已经在惠普发现实验室中的事实,Calxeda ARM芯片非常有可能被用于Gemini机器中,但Calxeda和惠普都没有对此予以证实。

而另一个Moonshot机器(可能是Satum或Apollo,这取决于惠普是使用boost还是capsule的名称)成为下一个产品是完全可能的,它将基于开放计算的Group Hug微服务器背板和形成因素的,这是目前和未来的ARM服务器、甚至未来Atom、Xeon以及Opteron服务器将被使用的所在。

德州仪器已推出了Cortex-A15处理器,该款处理器具有两个或四个32位核并配有40位内存寻址(即在ARM世界中被称为大物理地址扩展)以及混合ARM处理器(该技术把一至四个Cortex-A15核与一至八个TMS320C66x数字信号处理器集成在一个硅片上。

ARM/DSP混合芯片为数据中心带来可能

德州仪器的KeyStone II芯片系统框图

有趣的是,这些ARM-DSP混合芯片使用了相同的TMS320C66x DSP 组件,使用了相同的TeraNet一致性网络来集成为一个SoC,德州仪器在一年多以前SC11超级计算事件中将其作为x86的协处理器进行销售。

DSP和ARM芯片的架构是一致的,并与其KeyStone的名称一样为人所知。现在的差别在于,如果你有需求它们就可以配上ARM核,而如果你完全不需要任何的DSP和ARM核,那么德州仪器也可以满足你的要求。

通过这种方法,德州仪器可以紧贴纯粹的云计算基础设施工作负载:服务器、交换机、路由器、网络控制板、工业传感器以及无线传输设备,提供KeyStone II芯片的普通ARM版本。

它可以调低使用混合芯片上的DSP以满足如视频、IP摄像头、流量系统、语音网关以及医疗设备应用的工作负载需求,也可以调高使用混合ARM-DSP芯片上的DSP以满足诸如超级计算、视频会议、图像处理与分析、医疗成像甚至虚拟桌面基础设施等更高工作负载的需求。

这些DSP中的八个可以提供约1万亿次单精度浮点运算性能和约384亿次双精度浮点运算性能,而德州仪器的第二代DSP有望实现更高的性能。

有一点需要指出的是,性能是以单位功耗(瓦)计算的。使用几个ARM芯片和你会相当感兴趣的模块在200瓦的功耗下完成两万亿次运算的ceepie-deepie 超级计算机.

DSP运行频率高达1.2GHz并配有一个1MB自有SRAM Level 2缓存,以及两个或四个Cortex-A15 ARM核共享的一个4MB L2缓存,而每个核都有32KB 的L1指令型缓存和32KB L1数据型缓存。ARM核的运行频率高到1.4GHz,所有缓存均配有ECC擦除,这对于服务器工作负载来说是很重要的,只有DSP具有软错误保护。

ARM/DSP混合芯片为数据中心带来可能

ARM Cortex-A15处理器的KeyStone II系列产品

同样重要的是,KeyStone II处理器在其芯片上有一个集成的以太网交换机。这个交换机就可能能够像Calxeda用其处理器那样把SoC连接至一个交换网络。

但是其容量可能并不会太高,因为根据规格设计,它只是一个五端口千兆以太网交换机,一个端口用于计算单元而四个端口用于外部世界的Soc。

我们希望,有可能在软件中创建一个有别于多个Soc及其内部千兆以太网交换机的Layer 2 网络,以形成简洁的高密度集群。KeyStone II芯片的网络加速器运行线速度为1Gb/秒,它可以每秒150万个数据包的吞吐量进行处理,而这对于大量的云计算和超大规模负载应用也是非常有用的。