4>2×2 浪潮SPEC测试破世界记录调查与思考

      近日传来消息,浪潮在SPECjAPPServer2004测试中,其双路四核服务器以1538JOPS(Java Operation Per Second,每秒处理的事务数)的成绩,不但刷新了该测试双路服务器最好纪录,而且超越了国际某品牌小型机。这也使浪潮一跃成为英特尔的双路四核应用方面全球领先的厂商。
  
      不过,更引起记者注意的,不仅仅是这个打破记录本身??事实上,去年11月,浪潮天梭20000也曾经以每节点733JOPS的成绩刷新过SPECjAppServer2004双路平台的测试纪录??而是两次测试的数据。
  
      记者了解到,本次测试采用的是双路四核处理器,而去年是双路双核。但是,从733JOPS到1538JOPS,同样的环境,数据提高了一倍有余,这与传统上“双核性能小于单核的2倍(即2<1×2)”、“四核性能小于双核的2倍(4<2×2)”的观念是直接冲突的!
  
      浪潮究竟是如何实现4=2×2甚至4>2×2的?这种突破有何重要意义?


      从双核到四核:不仅仅是CPU的简单叠加
  
      面对记者的疑问,浪潮服务器技术总监胡雷钧解释说,武断说这样是否合理不太合适。此前已经有人多次做过这样的测试,包括其他其他厂商,已经证明了2×2<4是现实存在的。不过,CPU从两核到四核,不是一个简单的叠加,否则肯定是得不到这样好的效果。应该说,这种提升是综合性的体现,总结起来有这么几个原因:
  
      首先当然是CPU本身的提升,包括CPU内部微结构的提升,这是整体性能提升的基础。
  
      其次很重要的是和CPU配合的平台的提升。例如对这个应用测试中,内存的访问速度的影响还是比较大的,原先的两路两核平台还存在某些平台方面的限制,例如IO限制、内存的瓶颈问题制约了CPU的发挥等,而这次测试四核的应用平台在这些瓶颈上应该比上一代要好,这从一些具体参数的比较可以明显看出来。
  
      当然,相应的软件技术也在提升也是个重要原因,包括相应的数据库、中间件等。
  
      最后,一个比较关键的因素是浪潮自己的的调优技术也在提升。从双核到四核,指标变了,系统的内存、带宽加宽了,Cache也变大了,I/O也提升了,同样一个应用,从双核拿到四核平台上去,调配方法也不一样。这就给系统调优也带来了更大的挑战,如果不好好摸索这个系统,就不能发挥出这个系统的最高性能。浪潮前后这个测试实际运行时间有差不多30多天,经过了一遍遍的从硬件配置、软件搭配、软件参数调整等等艰苦和漫长的调整工作,所以才能有这个成绩,打破了两路的记录。


      因此,实现“4>2×2”这个结果是一个综合的结果,CPU、平台、软件和调优能力这四方面的因素才有这样的结果。
  
      从制造到综合应用:不仅仅是测试
  
      SPECjAPPServer2004测试是服务器领域的一种重要测试,这种重要的原因就是这个测试与现实应用架构的极其近似。测试模拟了一个汽车销售厂家、制造厂家、零配件构成的业务模型。
  
      因此它集中体现了该产品在应用中的效能,而不是简单的计算等性能指标。
  
      那么这种测试的示范意义何在?能说明四核服务器已经成为行业中应该首选的设备吗?能说明在各个行业中浪潮产品的优势了吗?
  
      能,也不能。
  
      前面的测试结果,其实已经说明了四核的超强效能。这不仅证明了四核服务器产品对比双核性能提升幅度是极其明显的,而且证明了四核服务器与周边软件产品和应用环境搭建等方面已经可以走出实验室完全用于实战,并且效果突出。对无数日益依赖于服务器的企业来说,无疑是一个福音??因为相对双核,四核不仅意味着双倍效能,还有40%的综合成本降低。从这种意义上讲,这种测试是一个非常重要的标志,甚至说标志着四核时代大门的正式开启。
  
      不过,SPECjAPPServer2004测试是基于制造业有代表性应用环境的一个抽象这一特点,也说明了测试的局限。这种局限性首先表现在抽象不能完全代表实际,毕竟还有部分差距;其次,制造业本身不能完全代表包括金融、电信等行业。此外,还需要注意,本次测试的结果毕竟是浪潮精英团队经过数十天艰苦努力的结果,而实际应用中,不能指望每个应用、每个用户都得到这种资源。
  
      当然,局限性的存在也不能掩盖其代表性的价值。


      首先,这种测试让用户有了一个可以参考的重要数据,而相比普通产品白皮书上的性能指标,这种数据显然距离实际接近的多。无论对制造业还是其他各个行业,这种测试对用户的参考意义当然也重大太多。
  
      其次,这种测试和浪潮其他相关测试一起,不仅锻炼了浪潮的调优工程师队伍,同时也获得了大量的实战经验数据,这些数据将对今后各个行业的应用中起到极其重要的作用。胡雷钧称,经过长期的性能调优实践积累,浪潮在硬件调整以及中间件、数据库等方面的调优方面已经具有极其丰富的经验。


      如果用户愿意,浪潮完全可以帮用户看实际应用的源码,并从源码中找到由于开发问题造成的性能瓶颈。事实上,浪潮有过多次这样的经历:有一次,浪潮在某电信客户中调整了一个功能模块,原先它做这些功能差不多要24个小时,调整了写法之后,竟然缩短到20多分钟!
  
      测试就是一个测试,就像一场比赛,不能期望一个结果改变世界。
  
      但测试又不仅仅就是一个测试,就像一场竞技,它可能影响整个世界。