谈基于AMD平台的HP服务器

日前,记者就AMD皓龙处理器和惠普全线机架、刀片服务器产品与云计算之间的话题,独家视频专访了中国惠普工业标准服务器产品经理安源小姐,中国惠普工业标准服务器产品经理陈晖先生和AMD中国区服务器产品市场经理梁宏伟先生

以下是访谈实录:

孟庆:各位网友大家好,欢迎收看本期节目,我是ZDNet服务器频道主编孟庆。今天我们主要的话题是关于AMD皓龙处理器和惠普全线机架刀片服务器与如今火热的云计算话题之间的讨论。今天我们请来了中国惠普工业标准服务器产品经理安源小姐,中国惠普工业标准服务器产品经理陈晖先生,及AMD中国区服务器产品市场经理梁宏伟先生。请三位嘉宾和我一起来为各位网友回答一些现在比较热点的问题。首先请两位惠普的产品经理为我们介绍一下现在惠普采用 AMD平台的服务器都有哪些?主要现状是什么?

陈晖:我先简单介绍一下中国惠普公司关于AMD皓龙CPU平台的服务器。那么我们其实在机架这个产品线,各位网友应该了解,现在服务器市场上用途最广泛的在企业里面,是这种基于机架和机柜的服务器。那么我们是有三款产品在主打这个市场:第一种是DL165,大家熟悉的这种两路但只有1U高的密度比较好的服务器;还有一款是比较主流的DL385,它是两路2U高度的服务器;从高端产品线来说,我们有一款DL585,是主流用于企业关键任务应用的四路服务器,那么这就是我们全线的机架产品。

安源:除了机架服务器,其实我们在刀片产品里也有两款性价比非常高的产品。一款是两路采用AMD的BL465,它在密度和性价比上有非常好的性能。465在采用了AMD新的6200 CPU之后,在性能上也提升了很多,在今年还有了非常多的成功案例,无论是在虚拟化的应用还是普通企业级应用上。另外我们还有一个四路里明星级的产品 BL685,这款产品是在四路里密度最高的,我们在很多银行和保险行业里面也使用了很多685的机器。

孟庆:两位产品经理为我们介绍了目前AMD主打的几个机架和刀片服务器产品,那么Harry(梁宏伟),您觉得AMD皓龙平台从处理器角度上有什么优势?具体是什么?

梁宏伟:皓龙平台在基于云计算和虚拟化这个平台上有非常好的平衡。其实在虚拟化里面的发展也是多方面的。虚拟化其实是需要一个平衡,它是为了提高服务器的效率,提升总体的资源利用率。但是也不是说所有的物理服务器被虚拟化以后,绝对的虚拟机数量越多越好。那么皓龙在这方面做得还是非常好的,因为我们有业界最大的物理合密度。所以在平衡这方面我们有非常好的表现。通常来说,为了保证虚拟机的效率,使虚拟机的性能和各方面的处理最大化的话,一个物理核放一个虚拟机是比较合适的。因为它保证虚拟机以几乎独占的方法去保证它的性能。

第二的话,现在从用户的角度对虚拟机的衡量,单纯从以往的看虚拟机的数量和性能,已经发展成TCO的概念。也就是说,用户不光看这台服务器做到了多少虚拟机,我们还要关注每个虚拟机的成本是多少、使用成本是多少,同时还能看到每个虚拟机的机架占的空间密度是怎样的。我们对虚拟机的衡量从以前的单维的空间变成现在多维的空间,再一个因为AMD在核数比较多的情况下,除了能更好的容纳更多虚拟机以外,其实对整个业务的增长也有很好的保证。因为可以通过多的物理核,在你需要的时候,通过更多的资源分配给虚拟机的话,可以去提升虚拟机的数量。同时当你快速需要资源的时候,通过这个虚拟机分配的方法,可以去容纳更多的虚拟机数量,去提升系统的效率。

孟庆:那么也就是像现在的这个衡量虚拟化的等于说它的指标、它的标准,就更加的多元化了。那么刚才也提到,虚拟化的指标已经不是单一,比如说我能虚拟处多少虚拟机这种从性能,而是更多从每台虚拟机的实际成本来衡量的,那么惠普你们是怎么看待他提的这个问题?

陈晖:那我先谈一点我的见解。关于性价比这个词,其实我们之前谈这个东西,往往是注重它的硬件性能和整机的价格这样的一个比较。但是到了虚拟化这个时代,这种计算的方式和这种思维的逻辑就有一些变化,是不太一样的。为什么要这么说?因为我们知道虚拟化技术产生的一个前提,它的一个前提就是我们传统的这种服务器里边,CPU的能力、IO的能力,甚至说电源的这种能力其实都是消耗不足的,也就是使用率很低。那么很多年前我们其实在深圳做过一个比较大规模的调研,发现实际上很多,包括一些银行,或者说一些制造业的服务器的使用效率,实际上不足30%。所以其实差不多是,如果没有记错的话,2007年之后虚拟化开始火了起来。这个原因就是大家开始注重如何把现有的机器性能完全发挥出来。

那么在这个前提下,就开始出现了说每虚拟机成本这样一个概念。因为大家发现,我的应用可以既然可以部署在不同的虚拟机上,那么虚拟机又可以在甚至是物理服务器之间发生这种迁移。那计算性价比时,单纯考虑一台服务器的硬件成本显然是不够的。那我们现在开始考量买虚拟机的成本,因为在IT工程师或者是IT经理的眼里,甚至我们说在CIO的眼里,他其实把每个虚拟机看成了一台服务器,那么既然是这样,那我肯定要考虑每台虚拟机的这样一个成本。那么 AMD实际上给了我们一个非常好、非常直观的了解方法,就是刚才Harry所提到的,关于最简单的就是多核的技术,和虚拟机的数量。最理想的方式,当然是每个虚拟机占用CPU的一颗核心,即使是非IT人的眼里,他们也会比较好理解这一点,也非常容易接受我们这一点。所以说这是我们去来衡量,举例来说,DL385。DL385实际上我们之前做过一个测试,一个官方的测试,它在业界所有的两路服务器里边,是每虚拟机成本最低的。这得益于两点,第一得益于CPU本身的性价比,还得益于这种多核的技术。因为如果我没有记错的话,实际上在去年在市场上,AMD的CPU以八核和十二核为主流的时候,我们的竞争对手相对来说,是1/2的数量。所以说在那个时代,我们用DL385做过一个测试,那我们每虚拟机的成本在业界里边,肯定是最低的。那我不用举具体的数字来佐证,主要考虑一下我们分母的核数就知道了。

反推到今年,今年AMD实际上推出的十六核的CPU,将我们的这个市场竞争,CPU核数的市场竞争,从原来的八核已经提升到十二和十六核为主,是这样一个情况。所以说我们认为在今后,包括DL385、585,甚至包括刀片的产品,从每虚拟机的成本上,肯定会给业界带来更多的很有价值的解决方案。关于刀片这方面,肯定在管理性和密度上肯定会有自己的特长,那我们不妨请安源来帮我们简单介绍一下。

安源:其实这个问题我想再补充两点就是我自己的看法。那第一点呢,就是刚刚其实Harry提到的一个平衡,我觉得平衡这个词用得非常的好。因为其实在我们服务器运行的时候,如果我们仅仅是CPU的性能非常好,或者说内存性能非常好的时候,我们并不能使这个机器的性能达到最优。那这个整机的性能其实包括很多方面,CPU、内存以及IO等等这些的相互配合,那惠普整个刀片的架构就会客户提供了一个非常好的环境。因为我们现在的刀片从上一代,包括现在在卖的这一代刀片,都已经集成了万兆的网卡。

而且同时这个万兆的网卡是多功能的,是可以支持一些虚拟化的功能的。那这个功能呢,结合我们现在CPU的这种高性能、多内核,然后再加上现在的一些虚拟化软件,就能够为我们现在客户需要的一种虚拟化应用,提供非常好的一种平衡的架构。

第二点我想说的是,在现在大家都希望把应用迁到虚拟化的过程当中,其实当我们去算每一台虚拟机成本的时候,这个计算方法,我觉得是非常赞同的。因为我们毕竟是把原来传统的物理机上的应用迁移到了虚拟机上,但是这个成本其实不仅仅是,通过现在一台机器的成本,加上软件的成本来计算,其实还应该包括它的散热、功耗,以及空间租赁的费用等等,这些成本加在一起,然后再去合出我们每台虚拟机的成本。这个才是真正我想我们的IT的管理者,或者公司CIO去关注的一个问题。那如果说我们能够把这样的一个总成本合下来,每台虚拟机的成本降低,那这样才是我们客户真正需要的。

孟庆:那么也就是说,我们通过虚拟化的这种方式,去降低我们在做很多应用时候的这种成本。但是另一方面刀片服务器,虽然它有很高的计算密度,但是也有人认为,它可能带来一些管理上的难题,不管是人员还是说刀片。因为它密度过高,所以在很多管理上,可靠性的方面,都可能相比原来机架产品要难一些。那么惠普,就是安源你觉得新一代,或者说未来可能刀片产品在管理上面临哪些问题,它会有哪些提升?

安源:这个问题,其实我想分两部分来说,那第一部分我想先跟大家聊一下,就是关于刀片服务器刚才提到的管理复杂性的这个问题。那我们知道,其实刀片服务器,在刚开始大家在设计这款服务器的初衷,大家有三个目的,那第一就是提高密度,第二是要简化管理,因为它会把很多外围相关的设备集中在这个刀片的机箱里面,第三个其实还是要面向一些企业级的应用。所以呢,针对这三个特点,高密度这点很简单,我们从现在各个厂商的刀片的形式包括惠普,我们在一个机箱里可以放16个刀片服务器的这种密度就可以看出来。

第二个就是面向企业级,就决定了刀片服务器它本身一定是可靠性一定是比较高的,那我们就主要来说一下中间的管理性。因为其实在从刀片服务器发布,一直到今天,我想这个管理性都是各个厂商一直在强调的,包括惠普我们也一直致力于提高它的管理性,然后简化管理中间的烦琐的过程。那我想大家认为,或者说国内的使用者认为,刀片服务器还是管理起来很复杂,可能这是跟我们平时的一个使用习惯是有关系的。因为很长一段时间来,大家都习惯于去管理原来我们的这种,传统的机架式服务器或者塔式服务器,使用这种面对面的方式。

而刀片服务器可能更多的,希望大家使用的是这种远程的方式,通过网络的这种方式来远程管理数据中心的这些设备。那我们可以想象一下,其实它这种管理方式,第一是给管理者提供了一个更好的环境,就是你完全不需要在原来这种,有很嘈杂的机房的环境当中,去管理你的物理服务器。你可以在你的办公室里,在一个非常舒适的环境当中,看到所有在数据中心里运行机器的任何状态,你的操作就好像你在机器面前一样。第二呢,其实它简化了很多我们前端的机器和后端的网络设备中间的连接线缆,甚至包括电源,因为刀箱它的密度高,所以它的电源其实是十几台机器是共用的。第三个,刀片服务器它通过这种管理模块的集中管理,能够让我们只通过一个网络的连接,就能够管理一个机箱里面的所有设备。这些其实从根本的设计上来讲,都是为了帮助大家去简化这个刀片服务器的管理。

前一段惠普已经发布了在其他产品上,包括刀片产品,我们也已经发布了下一代的新产品。那在新的产品上,我们其实在管理上有了更多的这种突破,我们通过我们新的管理芯片,能够去管理到这个服务器里面,更细的一些组件,简单来讲,我给大家举几个例子,也是其中四个我们最核心的功能。其中第一个呢,我们叫active health,就是智能的健康检查,这个功能能够帮助客户实时的去监控我们的服务器里面,任何一个微小的组件。能够去提供一些预报警的功能,这样就能够让我们的管理员在任何时间、任何地点,他就能够通过比如手持设备,通过手机,或者是在机房外面的电脑,能够看到是说在机房里面哪些机器有可能哪个部件有故障。那在他收到这种预报警时候,可能他的设备并没有出现故障,但是他可以做一些预防的措施,来防止将来可能发生的宕机的事情。

那第二呢,就是我们的无代理管理,我们知道代理这种东西,其实在以前的管理架构中是非常重要的。那在原来,我们很多机器如果是要做远程管理,都需要在这个服务器上去装上这种代理的客户端这样一个软件。那在今天呢,尤其在我们下一代刀片服务器上,我们就可以不用安装这种软件,因为惠普把这个软件的程序,已经集成在了我们的服务器里面,所以客户拿到新的机器之后,就可以直接插上电源,就可以对这个机器进行远程的管理,那这个也帮助客户,非常方便的能够做到真正的实现基于硬件的这种远程管理。

第三个呢,就是智能部署。智能部署也是一个非常有用的功能,刚刚我们有提到,就是刀片一个最大的好处就是,帮助客户在远程去管理。那远程去管理,其实不仅仅包括监控、开机、关机等等这些简单的操作,其实还包括一个,就是我们远程安装操作系统,我们可以试想一下,如果是现在比如说我们要部署 100台,甚至上千台的机器,你可能要在机房里面去做很多很多的工作,将来在我们下一代服务器上,其实客户可以通过这种智能远程部署,在机器上拿到这个新的硬件的时候,不需要做任何的操作,开机的时候就可以去安装操作系统。那这里面有一点是说,我们是在服务器的主板的管理芯片里面,集成了一些这台机器可能会常用到的一些驱动,这样就可以避免我们在安装操作系统中,传统的操作需要手动去添加这些设备驱动的过程,这也是惠普的一个创新。还有最后一点,就是惠普提供的这种在线的支持。简单来讲,在线的支持就是在惠普的网站上,我们会为客户设置一个在线支持的网页,客户可以在这个网页上去注册自己的服务器的信息。同时就会有惠普的后台的专业人员,帮助客户去监控这些设备,一旦这些设备出了问题,我们就会有相关的人员来通知客户,并帮助他找到问题,或者是帮助他去解决这些问题。我想这些都是给客户提供了非常好的便利管理方式。

孟庆:好,那刚才安源也介绍了很多,相当于给我们重新普及了一下,刀片服务器,它的可靠性、可管理写以及未来可能惠普会推出的产品中,具有的一些新的这些管理特性。那么我们知道,刚才您也引用了一些应用场景,包括不管是宕机还是重新预装系统这些情况,那么我想知道一下,Harry,AMD的处理器作为底层的这种硬件,在支持上述这些应用场景,或者可能还可以支持更多的这些应用上面,具有哪些优势,一些特性?

梁宏伟:首先现在很热的不论是云计算还是虚拟化的角度去看的话,尤其是云计算,因为传统的IT来说云计算有一些不同。首先是规模不同,云计算的部署的量非常大,所以在云计算里头,不论是云计算的运营商或者是使用者来说,更关注能耗。所以在这上面,AMD做了很多节能的工作,在新一代最典型的是核心数量增加了。在33%的情况下,我们的散热功耗并没有变,所以这意味着在提供更多性能的同时,每个虚拟机或者是每一个用户,他的实际对服务器的能耗是下降的。

第二个部分,在云计算的这种大的背景底下,很重要的一点,从运营商的角度,从用户、使用者的角度,云计算是一种服务。那能不能就是说,在我需要的性能的同时,你能够给到我,所以这里头在云计算里头有典型得有峰谷之分,可能在高峰期你需要云计算的提供商,能够把这个能力去提供处理。在你那些客户不用的时候,所谓谷底的时候,你还要能够达到一个节能的目的,这样去降低你自身的整个的运营,或者是使用的成本。所以在整个满足峰的这边,我们会通过核心数量的增加,尤其是做平台级服务的云计算的服务商,非常容易通过核心的数量,在提高虚拟机的数量以后,把这种能力去发挥出来。第二,在这个里头,也有一些新的技术,在这个里头它通过这些组频的智能的提升,可以在满足虚拟机数量的同时,可以进一步提升性能。在功耗不变的情况下,利用功耗的余量去提升。那在谷的这方面,我们有TTP的ProCat这个功能,包括自身的节能的设计。

换句话说,由于各种各样的原因限制,你可以在不牺牲一定性能的情况下,根据你日常对整个性能,包括对整个服务器的性能的要求的情况下,你可以把它的功耗限制在一定的范围之内。所以这样的话,可以很好的通过这样的一个手段,去平衡你所需要的性能跟数量,通过这些一系列的在节能、在多核等等这一些方面的技术以后,对于云计算这个大的环境低下,基于皓龙处理器的平台,可以很好的用平衡这个词,就是说使整个云计算服务的提供商,一个非常好的手段,去平衡你所需要的性能。你可以平衡你给用户提供的所谓的峰的能力,同时更好的话在谷的时候去降低你整个对电力,整个散热的要求,从而去整个在峰谷之间取到一个非常好的一个平衡。

孟庆:那么不管是像刚才咱们说的用云计算去平衡整个数据中心,还是去提升数据中心的管理,优化它的功耗,都离不开,不管是我们AMD的皓龙平台这样的底层硬件提供的一些特性,以及像惠普这种服务器平台层面,提供的这种支持和整体的这种软件等等合理的规划。那么几位认为,惠普服务器和这个AMD皓龙平台,合在一块,能给我们不管是云计算也好,数据中心整体的优化,功耗控制等等各个方面,能带来哪些方面的优势?

陈晖:我先说一点,其实这是一个很好的话题,因为惠普它之所以称为工业标准服务器,说明它这个产品从一开始设计就是为了这种工业标准和数据中心的应用所创立的,是这样一个概念。所以我认为惠普的每一台服务器,包括AMD皓龙CPU的服务器,它都更好的能适应我们现在数据中心的发展。举一个简单的例子,我们只谈虚拟化这一块,比如说传统的环境,或者是以往部署虚拟化的环境,用户需要购买了服务器之后,自己去部署这种不管是来自于VMware,还是来自于微软的这种虚拟化软件,自己手中的手工的去部署上面的虚拟机、管理虚拟机,那么你往往碰到的情况就是,既要用服务器的管理软件去管理你的硬件,监控它的能耗,监控它的这种宕机有什么错误,那么另外要开启这种第三方的虚拟化软件,进行这种虚拟化的管理和优化。

那么在惠普产品的管理性能里边,有一个很重要的家族称为Insight Control功能组件,实际上是集成了,或者我们更准确的说,是预集成了来自于这种第三方虚拟化软件厂商的管理功能。那么这样用户不需要再额外购买,或者说去使用第三方的工具,可以完全通过惠普一体化的操作界面,完成你服务器的开机、部署,虚拟机的创建、分配,甚至是迁移。从这一点来考虑的话,那么我们认为我们的平台针对这种虚拟化的这种数据中心,确实做了很好的工作和优化的步骤,那么这是在虚拟化的管理上面,我们必须要提出的,那我请安源来介绍一些其他方面的东西。

安源:其实谈到了这个话题,我就想到了两点,那第一个就是关于硬件的管理。因为刚刚其实提到了刀片的管理,那我们就究竟怎么才能把我们的整个数据中心更快的去管理起来。在我们即将发布的新的机器上有一个新功能,就是位置发现,也是通过这个管理功能,我们就可以非常简单的,然后很迅速的在我们的管理软件上,去搜集到所有的服务器的信息,甚至细节到它在哪个机柜上,这个信息就可以帮助客户非常快的在短时间内,去类似化出一张拓扑图,那客户就能够根据这张图,能够知道自己什么样的设备,在什么样的位置,能够帮他更好的去规划他的机房的管理。那第二个呢,就是接着刚才陈辉提到的,就是我们Insight Control的一些功能,那这个我想提的是Insight Control关于电源管理的一些功能,其实它的电源管理的功能是非常强大的。

举个简单的例子,我们都知道,其实很多管理员他是需要去给我们老板做一些报告的,那这些报告怎么生成呢,如果你用我们惠普的这个软件之后,其实不需要自己手动的去搜集很多的信息,那我们可以对他做一个设定,举一个简单的例子,它可以每天早上给我发一封邮件,这封邮件里会有一个报告。这个报告会显示,我在这个数据中心中,每一台机器它的耗电是什么样子的,我在哪个地方可能这个耗电是有问题的过高,或者是说某些地方它的使用率过低,它会帮我自动生成这样一个报告,那这个报告的内容,我也可以自己去设定。这样我每天早上到了公司之后,8点钟打开电脑,我就可以把这个报告整理出来,然后发给我的老板,这个我相信在一些大型的数据中心做管理的时候,是非常方便的。

孟庆:那么Harry你觉得呢?

梁宏伟:根据这些,不论是对功耗的控制这些,AMD在新的一代里头,都提供这个高级管理APML,那这样的一个功能,通过对CPU里头的控制,更好的跟着我们合作伙伴平台的控制软件等等,可以去实现一个更好的集成,可以透过整个在平台级的这些工具,可以对整个CPU,这些刚才讲的这些功耗的峰顶的控制等等这一系列的节能,你可以进行更细的、更颗粒化的管理功能,为整个数据中心去平衡这样一个能耗在性能中间,可以提供一个更好的手段。

孟庆:通过三位刚才的总结,我们也就更进一步的了解了惠普的服务器,结合了AMD皓龙系列产品,能给我们大家带来不管在机架、刀片,还是在未来面向云计算数据中心的整体方面的一些优化和一些特性,那么我们在此也感谢陈辉、安源和梁宏伟三位嘉宾,给我们带来的精彩的一系列的演讲,谢谢。

陈晖:好,谢谢大家。

安源:谢谢大家。