从传统来看,服务器根据划分标准的不同,可以分成很多种。比如根据所使用的处理器和体系架构不同,可分为x86服务器、GPU服务器、RISC小型机、大型主机等;根据性能档次的不同,可以分为入门级服务器、工作组级服务器、部门级服务器和企业级服务器;根据机箱外观的不同,可以分为塔式服务器、机架式服务器、刀片式服务器和机柜式服务器;根据操作系统不同,则可以分为Windows服务器、Linux服务器和UNIX服务器;此外,我们还可以根据应用领域、主要功能、CPU颗数等指标进行划分。
不过,随着时代的发展,服务器的划分与选型已经变得不象以前那么单纯了。一方面技术和应用在不断融合,比如今天的UNIX服务器上面跑的不只是UNIX一种操作系统,还可以跑Linux,甚至是Windows;又比如今天的一台4U机架式服务器可能比42U机柜式服务器性能还要高。另一方面,许多新的技术和应用负载开始出现,如Web2.0、虚拟化、云计算等,对服务器也提出了许多新的不一样的要求。
这些因素使得今天的服务器选型,尤其是中高端产品的选型,变得比以往更加复杂了,许多用户面临这样或那样的困惑,如中高端IT系统究竟该怎样做技术选型?怎样衡量性价比的高低?怎样把握未来的技术走势?选择一家什么样的合作伙伴才能规避未来的风险?等等。
我们知道,今天的中高端服务器市场上有着众多的竞争者,主要包括IBM POWER、HP安腾、Oracle/Sun、富士通SPARC,另外以英特尔新一代至强7500为代表的x86服务器也开始试图进入其中。为此,笔者从应用特征分析、产品技术选型、性价比分析、生态系统比较等多个角度总结了一些经验和建议,希望对用户朋友们在选购这类产品(尤其是非x86架构服务器)时有所帮助。
一问:中高端服务器适合何种应用?
随着行业信息化的深入发展,越来越多的企业客户需要把核心数据库和关键业务应用运行在高可靠的平台之上。正是凭借稳定可靠、安全、高可扩展以及高性能等固有优势,传统UNIX服务器(也称小型机)在企业数据中心里会占据越来越重要的地位。
不过,今天的用户已经不再简单地根据操作系统来选择服务器,因为技术在向前发展,如IBM的Power就可以跑AIX、i和Linux多种操作系统,借助其PowerVM虚拟化技术,甚至可以运行包括Linux和Windows在内的几乎所有x86应用。因此,今天用户首先要考虑的是自己的应用负载。
而对于中高端服务器厂商来说,一个重要的趋势是要为工作负载设计产品,其产品不仅要适用于传统的高吞吐量计算,而且还要适应新兴的大规模并发度计算。
所谓高吞吐量计算,如数据库处理,这种应用需要在很短的时间内,快速地从硬盘中拿到数据,并且很快速地把结果计算出来。比如每月结算手机话费这类应用,由于是绑定在某一颗或几颗CPU上运行,只有高吞吐量、高主频的机器才能解决,而不能依靠简单地增加CPU数量。由于Power是当前世界上主频最高的CPU,4-5GHz的高主频远远高于其他处理器的2-3GHz,同时IBM POWER7处理器是当前世界上性能最高的CPU,因此非常适合这类应用,这也是POWER系统的传统优势领域。
而高并发度计算则要同时处理多个用户的需求,一般是内核数量越多,线程数量越多,所能同时处理的用户数量规模也就越大,如Web类、Java类应用。POWER7不仅保留了高主频的设计,而且同时把内核数提高了4倍,从POWER6的双核提高到现在的8核,同时线程数量提高了8倍,从4个线程并发提高到了32个,从而使得POWER7能够更好地适应高并发的应用负载。其他处理器也在朝这个方向发展,比如SPARC64 VI的Vertical Multi-Threading(VMT)技术,但与POWER不同的是,VMT两条线程在同一时间内并不是并行的,效率较差,而IBM从POWER5开始就采用了Simultaneous Multi-Threading(SMT)的技术,能够真正达到同时多线程并行,效能更好。事实上,新一代SPARC64 VII在2008年推出时才有了SMT功能,但比POWER迟了四年多。
因此,用户在做技术选型时,首先需要清楚了解自己的关键应用类型和特点,然后选择合适的平台。今天的POWR7处理器其实是开创了小型机的新纪元,因为它不仅可以解决X86架构无法实现的高吞吐量计算,如大型数据库、企业资源管理、I/O应用和高性能应用等,同时也可以应对大规模并发度计算,如需要多核、多线程的Web应用。而且,由于POWER平台能够支持主流的Linux操作系统,配以优秀的虚拟化技术,从而也吸引用户将原来一些传统的X86应用整合到强大的POWER平台上来。
二问:怎样做中高端系统技术选型?
谈到服务器技术选型,用户一般都会从性能、能耗、可扩展性、可用性、可管理性等几个方面去考虑。不过,对于越高端的产品,解决方案和服务在其中的重要性也会越突出。因此,我们建议用户既要关注产品的硬件指标,更要关注整体解决方案的价值。那么,如何具体做这类产品的技术选型呢?
首先,在选购中高端服务器时,建议用户可以先从内核数量、CPU主频、L3缓存等几方面来比较不同机器的档次。对同一厂家产品,一般来说,内核数越多、主频越高、L3缓存越大的系统,性能也会越好。另外,你还可以直接去SPEC、TPC等网站上查阅、比较不同厂商的机器性能。目前,IBM最新的POWER7系统性能是其他厂家的3-4倍。
其次,系统扩展能力非常重要。中高端产品要求能够应对突如其来的业务需求,如果CPU、内存和I/O等组件没有很好的扩展性,就意味着可能每年都要更换一批机器。
第三,可靠性、可用性往往缺少可量化的参考指标,但可以比较厂商独有的高可用技术。比如IBM在高端系统上提供的双时钟设计,可减少单点故障;一系列CPU保护功能可以把可靠性提高100倍;全世界只有IBM大型主机和小型机里才有的内存标签功能等。另外也可以收集参考一些第三方的对比数据。比如,有统计表明,一年内IBM AIX操作系统非计划停机时间少于15分钟,这意味着在一年365天不停机运转的情况下,硬件加上操作环境可靠性可以达到99.997%,是其他UNIX操作系统的2.3倍,比X86/Windows架构更是高出10倍。用户需要注意有些厂商崇尚低价策略其实是以牺牲高可靠性、高可用性及高可服务性(RAS)特性为代价的,因为高可用技术的背后需要巨大投资和研发力量的支撑,IBM每年在POWER系统研发上投资超过50亿美元投入堪称"天文数字"。
第四,对于关注能源消耗的用户,可以重点比较不同产品之间的每瓦特性能指标以及各家独有的软硬件节能技术特性。IBM POWER从芯片到整机再到管理软件都提供了一系列先进的节能措施,如CPU可以根据负载调整主频,节能模式能把主频调低50% 或性能优化模式能支持最高110% 主频设计,通过Director中的AEM动态能源管理软件可以进行能源的统一管理等。
第五,除了硬件,还应该考虑操作系统、虚拟化等系统软件,尤其是对于那些CPU利用率偏低,希望通过虚拟化进行整合的用户,尤其重要。因为不同厂家的虚拟化技术在效率、功能、扩展性、安全性等方面其实存在非常大的差异,如IBM的PowerVM由于采用硬件来实现固件层(Hypervisor),就可以把虚拟化后整机的CPU利用率提升至90%,而一般业界水平只能达到50%左右。
当然,对于很多用户来说,纯粹的硬件指标并不能代表系统实际的收益和价值,真正关心的是服务器硬件与系统软件、应用软件的紧密结合程度。这也是为什么IBM在研制POWER7时就非常注重与软件的结合与优化,以便能够向用户提供一站式的解决方案,让用户把原来用在系统整合、兼容性测试、性能调优等日常IT运维管理上的精力和资源腾出来。这一点,尤其对于那些业务创新要求较高的企业,如银行、电信等,是一种非常重要的价值。
三问:怎样选择虚拟化技术?
如前所述,虚拟化已经是一种越来越广泛的应用模式。不过,市场上形形色色的虚拟化产品却参差不齐,从一般的X86虚拟化,如VMware的vSphere,开源的Xen,到针对非x86平台的虚拟化技术,如惠普的nPartitions、vPars、IVM,Sun的Dynamic Domain和Logical Domain,IBM的PowerVM等,这些虚拟化技术在性能、功能上其实存在很大的差异。大体上,用户可以从以下几个方面加以比较:
一是虚拟化的效率。这方面硬件虚拟化和软件虚拟化两种方式存在天壤之别,前者的效率要高很多。比如,IBM PowerVM是一件硬件虚拟化技术,可以在把一台机器的CPU利用率提高到90%,而其他虚拟化技术一般只能做到50%左右,这是因为硬件虚拟化无须占用太多的CPU资源,而后者由于要经过多层转换,不得不面临性能损耗的问题。
二是虚拟化的功能。比如CPU、内存和I/O等分区资源能否在不重启机器的条件下动态灵活调整,增大或减少;又比如分区或虚拟机能否在线迁移,即让一个分区在不停机、不停应用的情况下从一个物理机器动态地迁移到另外一个物理机器上,以提高系统高可用性。当然,对于不同的用户而言,对功能的需求也是不一样的,但关键是你的虚拟化供应商能否提供你真正想要的东西。
三是虚拟化的范畴。对于那些希望在现在和将来实现动态IT架构或私有云环境部署的企业来说,虚拟化的范畴,即能否实现全面的虚拟化就很关键了。因为,要实现动态的数据中心,仅仅对服务器CPU资源进行虚拟池化是远远不够的,还需要对内存、I/O、存储等各种软硬件资源进行虚拟化,有效实现内存、I/O、存储在分区之间的资源增减或自动调整。
四是虚拟化的安全性。虚拟化整合是把多个鸡蛋放在一个篮子里,这就要求这个篮子得足够的牢靠,对于用在关键业务领域的中高端服务器来说,这一点更加重要。所以,你还需要看看虚拟化供应商有没有通过第三方的审计或相关的安全认证,如IBM PowerVM就通过了EAL4+级别的认证,属于除了主机以外,安全级别最高的操作环境。
五是虚拟机的扩展性。比如IBM PowerVM的一个分区可以支持从0.1颗CPU到64颗CPU的扩展,未来还可以达到256颗CPU,内存方面最高也可以扩展到4TB;而惠普的IVM目前只能扩展到8颗CPU,分区内存也只有64GB,二者之间存在量级的巨大的差别。
可见,虚拟化技术的选择也是比较复杂的。在这一方面,有着40多年虚拟化技术发展历史和相关经验积累的IBM显然有着绝对领先的优势。
四问:选择机架服务器还是刀片服务器?
凭借高密度、高可管理性、高度整合等优势特性,刀片服务器一度被认为是机架产品的替代品,甚至有厂商喊出了"Blade Everything"的口号。但刀片真的能适应所有环境,并完全取代机架吗?答案显然是否定的,因为没有一种架构完美到可以适用所有的场合,什么时候用刀片,关键还得具体情况具体分析。
由于刀片机箱在很小的空间里把服务器、存储、网络、供电、散热、管理等模块集成在一起,使得其单位空间的能耗大大提升,一般功率都在2000-9000W之间,远远高于同等空间大小的机架服务器。而且,实际上并不是所有的客户和机房都能支持这种高密度的设备,由于供电能力有限,数据中心里往往出现一个42U机柜里只能放置1-2台刀片机箱的情况,宝贵的机柜空间没被善用。此外,机架服务器由于有足够的散热空间,可靠性也比刀片服务器更高,并且机箱里也有足够的空间去支持更高的I/O扩展能力。而这些因素对于关键业务应用而言都是不可忽视的。
因此,用户在选型时应该根据应用特点来决定,特别是对于I/O吞吐比较大的应用,如数据库、大规模网络输入输出等,机架式产品反而更有优势。为此,IBM的POWER系统为用户提供了从刀片到2U机架一直到42U机柜式产品的多种选择,以满足不同客户的需求。
五问:如何比较服务器的性价比?
在做完技术选型之后,我们还要在经济投资回报方面进行比较。中高端服务器的投资回报率即ROI如何计算,一直是令许多用户头痛的问题。由于ROI涉及的因素很多,计算起来比较复杂,使得一些用户在选择服务器时只是简单地考量硬件采购成本,而且按配置价格比来衡量,这其实存在很大的误区。合理的做法应该是在总拥有成本(TCO)的基础上比较总体性能和收益价值的大小。一般而言,总拥有成本包括硬件采购费用、软件费用、维护费用、管理支出如人力成本、机房场地费、空调和电力费用等等。
首先,在比较硬件采购成本时,如果只是简单地比较配置和价格,可能会造成很大的误差,因为中高端服务器不同于一般的单双路X86服务器,后者的配置规格在一定程度上能够代表性能的高低,但对于中高端产品,尤其是非x86架构的服务器却不然。比如,一台小小的4U机架服务器IBM POWER750(32核配置)与一套42U的机柜式系统HP Superdome(64核配置)相比,不仅前者性能高28%,能耗少83%,体积只有1/10,而且采购价格也比后者低上好几倍。实际上,今天IBM的中高端产品已经达到甚至超过其他厂商最高端产品的性能。
其次,现在多核CPU应用越来越普遍,但由于有一些软件仍然按CPU核数收费,导致软件许可费用在总成本中所占的比例越来越高,甚至比机器硬件还要贵。因此,选择CPU内核数较少但性能更高的机器,有助于大大节省软件费用。比如IBM的POWER7服务器与市场上同等配置的机器相比,性能往往要高出3-4倍。
再次,还应该考虑硬件资源利用率这个重要因素,因为即便服务器理论性能很高,但实际利用率却很低,还是会造成资源的严重浪费。IBM虚拟化技术可以把机器的利用率大幅度提高到90%,而市场上其他虚拟化技术一般只能做到50%左右。
因此,如果按照综合性能价格比来衡量,同时考虑到软件、节能、虚拟化等应用价值的话,IBM POWER系统无疑是当前市场上性价比最高的UNIX服务器。
六问:怎样选择一个可"托付终身"的伙伴?
中高端服务器作为一种关键的基础架构,对任何企业而言都是一种审慎的技术投资。由于IBM、惠普、Oracle/Sun和富士通等传统UNIX服务器厂商从芯片到服务器整机到操作系统都自成一脉,所以用户在做投资决策时要选的不只是一堆冷冰冰的软硬件设备,也是在选一个可以"托付终身"的伙伴!因此,这个伙伴自身发展是否稳健?其技术发展路线是否可预期?其新一代产品与上一代产品之间能否平滑升级?等等,这些问题都变得至关重要,因为它影响的不只是一笔投资,而且也会影响你的未来。
今天,一些多年前选择了SCO UNIX,或是HP PA-RISC,或是Sun小型机的企业正在面临痛苦的决择,因为这些UNIX产品或停产或被收购的现实,迫使企业必须转换到另一个稳定、可持续发展的平台上去,而且为此要支付相当大的转换费用。
纵观今天全球非x86架构服务器市场,IBM的POWER系统可谓一枝独秀。自从2005年获得全球第一的UNIX服务器市场份额以来,IBM一直保持着这一地位。而且,得益于每年10亿美元投资带来的创新技术,以及不断扩大的客户群和健康的生态环境,POWER系统成为IBM过去10年来最重要的产品。
考虑到CPU是中高端系统中最核心的技术,其它技术创新如虚拟化、高可用、操作系统性能优化等都得依赖于它,因此能否保证CPU稳步可持续发展也就成为厂商实力最直接的体现。在这一方面,IBM从20年前的POWER1到上一代的POWER6,再到今天的POWER7以及未来的POWER8,每一步都有条不紊,用户也可以根据自己的业务发展情况预测何时可以进行升级。而其他厂商的每一代新CPU却要"难产"很多,如Sun的Ultra-SPARC VI产品2009年停产并退出市场,其高端ROCK芯片研发被取消,HP过去的PA-RISC停产并将终止服务,英特尔的新一代Tukwila安腾频频延迟上市,而且由于系统总线变化,让老一代安腾产品用户无法平滑升级……实际上今天的IBM POWER处理器已经在技术先进性上领先安腾等产品至少3年以上的时间,这些都在促使越来越多的用户转投IBM麾下。
CPU会引发"多米诺效应",一个健康的CPU技术体系和产品路线能够带来健康的生态环境。IBM POWER系统的市场份额自2005年以来一直保持全球第一的位置,因此各大独立软件开发商也越来越重视相关的应用开发。去年,IBM的"迁移工厂"计划计划就帮助了超过2000个企业成功迁移往IBM平台。
反观其他厂商,生态环境却在不断恶化,如Sun被Oracle收购之后,硬件业务发展受到影响,高端芯片研发计划被搁浅;英特尔的安腾芯片频频延期上市,红帽和微软宣称新一代操作系统不再支持安腾,一些厂商正在退出安腾联盟组织等。
正如俗话说得好,"男怕入错行,女怕嫁错郎",高端IT系统的选择,又何尝不是这个道理?