IDC亚太论坛:英特尔畅谈创新未来数据中心计算

DoSTOR存储在线 11月29日北京消息:"IDC亚太区IT架构前景论坛"今日在京成功举办。IDC根据对数据中心的调研结果与参会嘉宾分享了目前数据中心的现状与未来发展趋势。以下是英特尔(中国)公司,服务器平台架构经理 赵萌 题为《创新未来数据中心计算》的主题演讲:

感谢IDC,非常高兴来到这个会场,作为因特尔的代表,我谨代表我们公司和大家探讨一下英特尔对于创新未来数据中心计算的见解。我是来自英特尔公司服务器产品的产品经理,我叫赵萌,接下来30分钟会探讨一下英特尔作为一个厂商看到在整个数据中心以及服务产业链的发展状态以及英特尔提出的见解。

谈到数据中心,必须谈到服务器以及相应的存储,因为这是构建一个数据中心所必须采用的一个基础设施。从这张图可以看到随着整个数据规模的不断扩大以及新的业务基础设施的构建,包括新型的互联网的数据中心,包括Web  2.0的应用,导致服务器在全球的出货量会有一个大的增长。随之而来,存储也会有一个很大的增长,从过去几年内到2010年的增长趋势是非常明显的,有两位数字的增长。存储的增长可能会更高,大概到15%左右。

我们看一下全球的服务器的支出部分,这里衡量的标准是它所用于购买服务器的金额,也就是它的花费的部分。大家可以看到,这里面有一般的主流的服务器,包括高端的服务器以及中档次的服务器。在全球不同的区域,包括北美、亚洲,还有一些欧洲的地区具体的分析。从这个图上可以看到,亚太区特别是中国在整个服务器的支出的方面,购买力是最强的。因为整个中国IT基础设施这几年呈现出高速发展的趋势,以及新兴互联网的应用急剧膨胀,包括Web  2.0的应用导致存储的应用非常的大。

作为英特尔来讲,从内部分析结果也验证了这一点。英特尔中国公司是今年1月1号独立的,现在英特尔(中国)已经成为全球第二大的市场,除了美国之外,英特尔已经成为第二大的IT产品的消费市场。

在这里面分析一下管理成本。大家从这张图可以看到服务的成本,指的是一次性购买硬件的设备,占的不是很高的一部分,红色的柱状图是每一年我们的用户所用于购买服务器的一个成本。大家可以看到基本上从2001年之后,这个曲线有增长但不是很高,每年增长在3%-5%左右。我们分析一下管理成本之后会发现,管理成本的增长是非常迅速的。到今天为止,我们用所于整个数据中心的管理成本,包括作为数据中心管理的硬件投入、软件投入,也包括人员的支出等等。这样的整合可以发现管理成本相当于用于购买服务器的设备成本大概有三倍这样的数量级。所以,管理成本已经成为构成数据中心总体拥有成本最重要的一个部分。

每当和我们的用户探讨如何构建数据中心以及如何去管理数据中心的时候,很多用户考虑到第一次的设备投入,也就是用来第一次购买原始设备的投入,而没有考虑到今后数据中心运营所花费的成本。我们算总体TCO的时候要考虑到管理的成本,因为这是非常大的组成部分,这里我们下一步会谈到功耗和供电的部分,也是构成管理成本增加的最重要的一部分。

大家可以看到数据中心的增长,服务器的增长对于数据中心的影响是巨大的。我们这里有很多数字大家可以看到。我们做过一个统计,全球目前有1700亿服务器,指的是所有价值加在一起有1700亿的数值,还包括存储和网络设备。如何管理服务器和这些设备是非常重要的。

第二在创建和建设数据中心的时候,我们要衡量很多的因素,因为数据中心的数量和规模在不断的扩大。到目前为止,大的规模数据中心到企业级和一般企业内部的数据中心加在一起全球有差不多500万个数据中心。500万个数据中心从大到小,从几十万的数据中心到几台数据中心,差别是非常大的。所以大型的数据中心在建设成本的投入方面,每年大概有100万到200万美金的投入,这是非常巨大的数字。

和大家分享一点,英特尔在全球和数据中心的客户有紧密的合作。我们发现目前已经在持续购买的数据中心中,最大的客户大家能猜到是谁吗?Google,是作为信息互联网应用数据中心,每一年采购新的服务器的数量大概是30-40万台。如果除以每年365天的话,平均差不多一天要增加1千台服务器,这个数字是非常惊人的。Google的数据中心我们自己也有幸参观过,它的数据中心构建是非常先进的,包括考虑到总体的布线、冷却以及散热,另外还有一个最大的因素是供电的部分。我们称Google的数据中心就像移动的船一样,每个地方在构建新的发电厂或者电价、电力供应更好的时候就会迁移到那个地方去,所以也是非常灵活的,这是我们探讨的第三点在电力的供应方面。我们也做过一个统计,在2005年的时候,全球服务器的数据中心在总体用电成本上是73亿美金,差不多有14座10万亿发电厂才能供应这么多的数据中心来使用。

数据中心的能效也是非常重要的。谈到能效的时候,我们会谈到四个话题,首先是供应和管理的部分。第二点是怎么去优化系统的平台以及服务器整合方面;第三点是我们所说的服务器的大规模整合,包括战略中心的构建和一般服务器数据中心的整合。最后一点是虚拟化,刚才IDC的同事也讲过了。我们看到虚拟化是降低数据中心运营成本,目前是最有效的途径,一会儿也会谈到。

大家可以看一下这个图,是昨天晚上从一个实验室拿到的数据,这是对全球和美国两个不同的区域作为服务器数据中心的一个电力和冷却成本的分析。大家从这张图中可以看到,左边两个部分是2000年和2005年在美国用于服务器在数据中心部署的时候所需要的花费。大家可以看到美国差不多2005年的时候花了27亿美金,相当于全美供应电量1.2%。全球的数字更惊人了。2005年的时候是72亿美金。大家可以看到另外一个数字,有两个圆圈,上下两个不同的圆圈是服务器供电所需要的成本,另外是指由此产生需要作冷却和散热的成本,服务器的供电相当于供电的一半,另外50%是用于整个数据中心的冷却或者作散热使用的。差不多各占50%。假如美国1.2%的话,中国比这个数字要高一些。我们相对于其他的产业,比如工厂或者制造业,这个数字并不高。我们知道数据中心的运营是7X24小时从来不间断的,需要每一天每一时刻运行的,电力的成本也是非常惊人的。上个礼拜和信息产业部曾经参加过节能减排的研讨会,重点谈到了在信息产业内部我们怎么去节能减排,这是在全球包括国内我们公司非常关注的一个话题。

另外考虑到数据中心整体散热和功耗的趋势也是非常明确的,横轴讲的是我们的时间,纵轴是是每个单位平方英尺的设备所需要的供电量,大家看到随着90年代末期到现在,供电量的需求是呈一个迅猛的上升趋势,从而产生这么多能耗的一个最重要的原因。这些功耗来自于网络设备、存储设备和相应的一些管理设备等等。

谈到数据中心计算系统能效的时候,我们还需要说明一些概念。指的能效是完成某项工作负载的时候使用最少的能量,工作负载的活跃状况或者是不活跃的状况,两个不同状态下,处于活跃的工作状态或者不处于工作状态,或者闲置状态加在一起,整合在一起的一系列的任务。这里面给大家举个例子,我们在衡量能效的时候,到底能效的定义是什么。

大家从底下这张图可以看到,无论是服务器还是PC机等等设备都包括四个状态,关机状态、休眠状态、闲置状态、实际工作的状态。这里面大家以前的概念是说我们怎样衡量一个功耗的范围,功耗的范围通常指的是闲置、休眠和关机这三个状态加在一起,没有考虑实际工作的时候功耗的范围是多少。

现在我们做一个重新的定义就可以看到,前三个状态,其实整个系统包括计算机系统并没有在做工作,而都处于空闲的状态,也就是在实际工作状态下才完成真正的工作。所以,我们要强调的是,功率是你完成这项工作负载所除以你所要花费的能耗,能耗的很大一部分是花费在最后一个部分,也就是实际完成工作这部分产生的。

我们的能量大家都知道,用功率乘以时间再求合这样的标准。我们重新定义能效之后,会发现最大限度的降低工作负载所产生的能耗才是最重要的节能降耗的一个途径。所以,能效不仅仅指功率本身,而是指完成有效的工作状态所需要的能耗。

这里面大家可以看到这个例子,比如我们有两个单机,左边和右边,大家看到空闲状态的功率是65瓦,休闲是7瓦,待机是3瓦,峰值是195瓦。右边是分别是80瓦、10瓦、5瓦、250瓦,从这个数字大家可以看到,第一感觉是右边的机器肯定是更耗电,因为每一个值都高,无论是空闲、休眠以及峰值的工作状态。刚才讲了实际的能耗是完成有效工作时所产生的能量。大家看完成工作时的表现是怎样。这里可以举一个例子,同时完成了视频编辑的工作,同样都是40段,左边需要1.6个小时,右边需要半个小时就完成了。如果这个机器是一个单机系统,每天工作8小时的话,会发现按右边的机器每一天能耗是125瓦,左边是325瓦,所以看到的不是左边的机器省电,相反是右边这台能效更好。我们判断能效的时候,要看实际工作时完成工作的效率以及产生的能效是怎样。

我们举一个系统,上一页讲的单机。这个系统是中小规模的数据中心。这个系统有不同的使用功率以及空闲的功率,分别是系统A和系统B。数据中心所需要完成的工作是处理一个40万亿次的业务运算,理解为银行的一个批处理的业务。左边的系统A所需要的是9台机器,所能够完成的工作量是40.5万亿次,这是能够满足需求的。最大功率是2925瓦,空闲的功率是1440瓦。右边完成同样的工作,只需要5个系统,每秒钟完成41万次,也可以满足这个需求。但是最大的功率预算只有1250瓦,空闲状态是775瓦。所以很容易得出结论,系统B是更高效和节能的,每年节省的能耗差不多是5800瓦/时和1.17万千瓦小时的量。我们在计算服务器能效的时候,一定要考虑支持相应工作量的最低容量是多少。

我们总结能耗的时候要注意一点,不要一味的关注系统的空闲以及闲置状态的能量,而要考虑系统真实的完成工作的时间以及它在单位时间内所产生的能量是多少。我们尽可能的要去压缩它在工作状态的时间,因为这个时间是最耗电的,如果我们压缩了这个能耗,也就意味着这个系统会节省更多能量。

所以降低能耗需要包括一些工作负载,在时间上的削减才能真正降低能耗。

支持数据中心的优化,这是第二个话题,在这里面英特尔做了很多的工作,包括我们提供更高性能以及更低效能的组件,组件像处理器和芯片的级别。英特尔四核处理器在每一个CPU的能耗方面只有50瓦,这是刀片式的服务器。如果它是4个内核的话,每个内核有25瓦,50瓦的能耗比台式机要低,在服务器实施这么低能耗的处理器。

第二是提高效率。提高效率的话像IDC的崔小姐刚才讲到的,怎么样实施PC的虚拟化技术来降低成本,来做服务器的整合和更多的应用。这里还包括按需配电的技术。这个技术就像人的心跳一样,走路的时候心跳是六七十次,跑步的时候会上升到一百次以上,这和服务器的供电是一样的。快速运行实际工作的时候能耗要高,不处理大规模数据的时候能耗会自动降低,这就是按需配电。这里可以有效的降低整个系统的能效的部分。

第三,在整个服务器机架的优化方面以及优化的工具、散热、布线、冷却等很多部分。

第四是服务器整个数据的中心的管理,包括管理部件的构成以及在虚拟化平衡状态下怎样实施到更多服务器上。

我们加入了绿色网络组的计划,目的是倡导高效能、低功耗的策略。

英特尔这两年推出了很多产品,包括从单核到双核到四核的产品,随着多核技术的事实,大家知道性能有一个飞跃。我们可以保证的是在服务器系统的功耗方面不会有增长。大家通过左边的散热图可以看到,无论是单核、双核、四核,我们在服务器的系统功耗上基本上是没有变的,都是维持在同一个水平线上。通过多核技术、多线程技术以及在整机方面的优化,使整个系统有一个大幅度的飞跃。双核的系统比单核系统在性能上提高了4倍,而四核比双核提高了1.5倍。

大家注意到最佳性能功耗比,随着时间的延迟,我们可以降低服务器的功耗,同时可以提高在单位面积上所部署的能量。多核技术在同一个服务器内,以前只能部署一个服务器,或者是一个单核服务器,现在可以布置到四核,性能有四倍的提升,但是单位的面积,我们所采用的占用面积并没有提升,无形中提高了单位面积计算的密度,这也是提升性能优化功耗比的一个有利的途径。

还有一点给大家介绍一下我们在两个礼拜之前,11月12日英特尔发布了第二代四核基于45纳米容积的处理器,这个处理器是在去年11月份发布的四核的第二代产品,也就是第一代45纳米的采用金属栅级的工艺所产生的新一代的介质的处理器。这个产品会比以前的产品有更高的性能,同时有更低的功耗的表现。大家可以看到晶体管的密度会有2倍的提升,同时晶体管的切换速度大概是提升了20%,漏电率降低了降低了10倍。

这里给大家做一个解释就是说,这是我们在传统的工艺里面第一次采用V2氧化硅的介质来生成的产品。大家知道以前我们都是采用传统的二氧化硅材料,现在采用新一代金属介质,是新一代高科技栅级的技术,通过这个技术可以使晶体管的密度增加,从5.82亿的晶体管提升到8.2亿。另外,在晶体管密度增加的同时降低整个晶体管的面积,提高缓存,这是45纳米和老的45纳米的比较。

还有一个在平台的兼容性方面,平台的兼容性指的是我们现有的四核产品可以兼容于以前的四代产品,包括两代双核和两代四核。也就是我们构建数据中心的时候,用户会肯定会考虑长期的投入回报,不希望每年都有新的产品不兼容。我们所保证的是这样同样一个服务器的平台可以兼容四代产品,从双核到四核的时候只要更换处理器,在同一个服务器上都可以工作,不需要做其他的更改。

性能方面的提高也是非常明显的,在性能指标方面,新的四核产品比老的四核大概有38%的提升,无论是数据库的应用还是服务器Web  Server都有一个大的幅度提升。

另外我们再对比四核和新的45纳米的四核和65纳米以及双核产品的时候,大家可以看到从在线业务处理方面,包括ERP处理系统和整机方面系统的提升都是非常明显的。还有一点是功耗的部分。在多核技术实现的同时,性能有飞跃提升的,系统的功耗没有提高,我们的功耗保持在同样的水平。但是性能的提升是非常明显的。新的四核产品比单核产品提高了5.85倍,这是非常高的性能提升。衡量性能功耗比的话提高了6.33倍,这是非常大的提升。

另外,有很多用户关心价格,我们购买这么多产品价格是否会有变化。英特尔的策略是把技术第一时间推到市场上去,老的和新的产品的价格是一样的,无形中会获得更高的性能,成本并没有提升的解决方案。

我们看一下英特尔在构建数据中心的时候,我们采用的策略,第一点是服务器的整合。大家知道大的企业在不同国家和不同区域都有构建数据中心,在亚洲、北美、欧洲,每个数据中心就像HUB一样,可以自动连接。每个数据中心之间也有相应的机制,包括数据同步、统一管理等等。还有一点是我们所谓的整合也是要采用灵活的模块化的构建方式。模块化的构建方式像Google的数据中心一样,灵活程度不仅限于单位数据中心,更细微到数据中心不同模块部分。同样一个数据部分,有一个组群做一个应用的,另外一个组群做另外一个应用,所以每个族群之间也是灵活的模块化设计的,包括单位的类却降温,因为每个模块之间所消耗的能量也不一样,所以在降温、能耗、冷却等方面也是灵活组合的。这样做的目的是要及时的交付以及即插即用的方式。比如某项应用,一下子膨胀起来了,我们快速的可以部署数据中心。同时马上你可以使用到相应的能源的供给和冷却的使用部分,以及保持灵活性,这是非常重要的。

英特尔现在最新的数据中心的目标,在每个平方英尺单位面积之内,功耗可以做到525瓦,这是非常新的数据。

还有一点是在构建数据中心方面,在应用方面很多的厂商包括英特尔内部采用Linux集群的方案,这种方案保证无缝执行设计的时候有无缝的迁移,可以做到虚拟化的整合以及虚拟化的迁移,我们自己切身的体会是非常明显的,通过虚拟化的整合,我们在去年节省了差不多2亿美金,通过虚拟化的方案。2亿美金差不多有1.1亿万美金节省在服务器成本。另外一方面有8千万美金用于降低服务的成本以及支持的成本,这是非常有效的数字。大家可以做一个参考。

还有一点是四核和虚拟化之间是有一种无缝的整合,因为多核技术最大的优势是提升性能,同时可以承载更多的虚拟机。这里面可以和大家分享更多的数字,比如在性能方面,大家可以通过左下角的图看到部署很多应用,包括E-mail、Web  Server,在性能方面提升了60%,在性价比方面提升30%左右,在性能功耗比是20%左右,包括性能提升和功耗降低以及由此带来成本的节省。

我们做了一个总结之后,可以发现通过现有的四核技术,可以在节省总体应用成本降低30%左右。所以,这是一个对数据中心来讲,我们在节省到30%左右的话,每年的投入是非常巨大的。总体应用成本的降低,包括服务器的成本、人员、员工的成本,也包括数据中心的构建、实施以及网络的布置、网络的连接、存储的连接等很多部分。

最后,我们给大家做一个总结,英特尔所分享的一些经验和一些数据,其目的是整合数据中心的时候有四个方面是非常重要的,第一点是在控制,控制相当于控制成本的投入,控制供电的主体部分。整合是指数据中心的整合,这里也包括功耗、散热以及相应的战略数据中心模块化的实施等,这是非常重要的

第三点是优化,优化体现在平台的优化、系统的优化以及整个数据中心设计时的优化的着眼点。

最后一点是通过虚拟化的技术来提升性能,同时降低成本,降低计算复杂性,并提高利用率。

另外,在四核"至强"的处理器提供给大家一个非常好的平台来实施服务器的构建,新的纳米工艺进一步提升了性能。

今天讲的内容表达了英特尔在未来数据中心构建的时候,英特尔会不遗余力坚持数据的创新,提供给大家高性能、低功耗,并且是坚实可靠的服务器平台用于广大用户去构建下一代数据中心。

谢谢各位。