2003年,AMD公司历史性地推出集成内存控制器的的皓龙(Opteron)系列服务器处理器,改变了x86服务器处理器市场上英特尔一家独大的局面,迅速从几乎为零到占据了20%多的市场份额;而将在9月10日面世的“巴塞罗那”四核处理器,将再次改变x86服务器市场上的游戏规则。AMD对此信心十足,并认为巴塞罗那对行业的影响会比AMD原来预期的更大。先不论巴塞罗那是否影响到了整个行业,但它起码影响到了英特尔:对巴塞罗那,英特尔如临大敌,将原定9月11日发布的四核四路至强7300匆忙改到了9月6日,这也从一个侧面证实了巴塞罗那的分量。
实际上,全球服务器市场对x86服务器处理器的认可度都在不断提升,需求也在不断加大。从各种第三方的数据可以看出,近几年以来,x86服务器市场在不断扩大,而传统的RISC服务器市场则是稳中有降。随着x86服务器在性能上的不断提升,例如虚拟化技术也在x86平台上逐渐成熟,这些都加强了x86服务器在企业IT基础架构当中的地位。x86服务器不再是以往仅能胜任文件服务器、Web服务器的低档产品,甚至已经进入了企业的关键应用。相应地,AMD的巴塞罗那处理器由于在性能、虚拟化、投资保护以及能耗等四个方面的优势,更令用户期待。
真四核带来超强性能
与竞争对手的处理器相比,巴塞罗那处理器沿用了带来成功的直连架构,使内存带宽可达传统“前端总线+北桥”架构的两倍多,内存响应时延仅为传统架构的一半。同时,由于集成了DDR2内存控制器,也使内存延迟达到最低。不仅如此,直连架构也使皓龙处理器有了更好的升级扩展能力,I/O带宽、内存容量能够与处理器数目同步增长,从而搭建一个平衡的系统。作为对比,传统的“前端总线+北桥”的架构在升级了处理器数目之后,就不得不放弃前端总线和内存速度。
巴塞罗那的内存控制器就采用了双72位总线,内存传输带宽达到了10.7 GB/s,3个HyperTranport传输总线达到了24GB/s的传输速率。根据第三方的数据测试,在两路平台上,真四核皓龙处理器提供的内存带宽比对手的四核处理器内存带宽高124%。不仅如此,巴塞罗那采用了真四核设计,即四个处理器都能够共享缓存,相互之间直接沟通而无需总线,这就极大地提高了巴塞罗那的效率。竞争产品采用了多芯片封装设计(MCM) 来代替真四核的设计,从而受限于前端总线,使处理器的整体效能打了折扣。
此外,AMD的智能缓存技术也为巴塞罗那增色不少。巴塞罗那设计了三级缓存,其中所有的4个核共享2MB的三级缓存,每个核都有自己的一级、二级缓存。由于一级缓存的容量往往很小,因此在执行应用时经常会用到二级或者更高级的缓存。如果当一个内核运行一个大的工作负载占用了所有的三级缓存并需要访问主内存时,保有一级和二级缓存的其他内核还可以执行更小的应用,也保证了Barcelona处理器能够提供更好的并发能力。作为对比,英特尔的四核处理器是每两个内核共享二级缓存,这就导致一个处理器的大工作负载占用所有的二级缓存且访问主内存时,另一个处理器将处于完全不能工作的状态。
领先的硬件虚拟化设计
VMware上市后收到投资者的热捧,让EMC收获颇丰,高扬的股价昭示着x86架构上虚拟化技术的广泛应用。根据分析公司的统计,北美地区现在有25%的用户开始采用虚拟化技术,而这个数字将在明年达到70%。因此,提供更好的虚拟化支持对用户有极大的帮助。根据第三方的统计,得益于皓龙处理器的直连架构,早先的双核皓龙在虚拟化性能上就比竞争对手的同档次产品高出很多:在支持20台虚拟机时,皓龙服务器的Web服务提高2倍以上、文件和打印服务性能提高50%以上、功耗降低15%、CPU余量多14%。而在真四核皓龙里,这一优势得到进一步增强。
在巴塞罗那中,AMD提供了Device Exclusion Vector(DEV)等新技术。DEV技术允许Hypervisor创建保护域,使得设备在未经授权的情况下不能访问内存页面,从而提高虚拟化安全性。AMD还在Barcelona中提供了带标签的 TLB(地址转换后备缓冲器),使虚拟机之间的切换无需每次都刷新TLB,从而提高了虚拟化性能。需要指出的是,TLB是CPU中的一个表,用于存储最近使用的从虚拟到物理内存翻译记录。
此外,巴塞罗那还提供了快速虚拟索引(Rapid Virtualization Indexing)技术,可以在硬件中完成内存查询,减少Hypervisor对虚拟机的干预,并缩短Hypervisor切换时间。可以说,更好的虚拟化架构为巴塞罗那提供了更好的扩展性、更低的成本,使工作负载增加时,性能同步提升。
精细控制带来能耗优势
随着能源费用的高涨,客户对高能效性表现的处理器也越来越重视,AMD也据此提出了每瓦性能的理念。在功耗方面,巴塞罗那并不仅仅是简单地保证了四核与双核功耗相同,实现了每个处理器内核的功耗降低一半,还进一步对Barcelona在各种环境下的表现进行了优化。例如,AMD CoolCore技术可以自动关闭处于空闲状态的逻辑区块,还能够实现内存控制器读或者写功能的分别关闭,加上Barcelona处理器可以支持独立动态核心技术,每个内核都可以根据自己的负载情况决定当前的主频,从而降低了能源消耗。
在新的巴塞罗那处理器当中,AMD还设计了双重动态电源管理功能,为处理器内核和内存控制器分别设立了电源供应,从而使内存控制器能够以更高的频率工作,提供更大的带宽。在I/O方面,巴塞罗那处理器还采用了基于AMD内存优化器技术的独立内存控制器,能够以双倍访问内存,提高内存带宽。
平滑升级保护用户投资
AMD在设计时首先考虑的就是一致的平台和路线图。AMD曾表示,“客户肯定会关心平台和产品路线图,因为客户今天和明天所用的产品就是由此而来。所以,AMD的设计目标就是尽可能少地改变后台,尽力降低转换成本,并且为AMD的处理器提供平滑的升级路线。”因此,AMD在设计产品时的一个重要目标就是确保用户的无缝升级。AMD公司的客户不想有一个“非常不连贯的升级路径”,即那种需要改变芯片组或者供应商的方式。显然,这种改变会带风险和更高的成本。更重要的是,这会造成售后服务上的困难。
四核巴塞罗那由于功耗与上一代双核处理器一样,而且在电气特性和插槽上均没有改变,这就使用户可以通过升级BIOS的方式将现有的平台升级为四核处理器平台。这种做法也获得了OEM的一致赞赏,曙光公司表示,将把旗下的皓龙服务器全线升级到四核巴塞罗那处理器。
可以说,随着数据中心对虚拟化、能耗等方面的重视,能够平滑升级的巴塞罗那处理器成为了数据中心的最佳选择。因为,真四核皓龙具备的优势主要是在保证了平台一致性(插槽、电气特性均不变)的前提下,采用真四核架构和增强的核心技术,实现了前所未有的x86平台上的虚拟化特性、吞吐能力和内存带宽。从而让业界和用户们认识到:要获得性能的大幅提升,有时候并不用重新采购一整套硬件系统,而可以简单到换一换处理器就可以。未来的游戏规则,将因巴塞罗那的出现而不同。