CSF2009:英特尔Seth Bobroff谈数据中心

由DOIT传媒集团,存储在线网站主办的存储中国2009峰会12月10日在北京召开,大会诠释了“观存储”的意义,DOSTOR指出存储正在企业IT系统中发挥着核心作用,并成为提升企业竞争力的重点手段。此外,DOSTOR还认为在未来很长久的时间里,存储将更加深刻地影响着中国企业和经济社会,并直接影响我们身边的每一个人。

英特尔公司数据中心事业部,存储部总经理Seth Bobroff现身峰会现场,我们带来“打破瓶颈 提高数据中心性能”的主题演讲(以下内容为现场速记整理稿)。

大家好早上好!我今天非常高兴能够来参加这次存储中国峰会,我的名字叫Seth Bobroff,我是英特尔公司存储事业部的总经理,在开始之前讲两点在中国英特尔公司的发展。英特尔相信中国代表一个巨大的机会,尤其是对于创新和IT的基础架构而言,英特尔一直在中国进行投资,我们在中国也有一些公司的分布,比如在成都,大连,在大连我们的投资是25亿美元,同时我们还有一个7亿美元英特尔中国科技基金,这主要是投资于中国的一些创新公司。

英特尔是非常紧密和中国政府合作来对于中国IT基础设施进行投资和创新进行投资,我作为一个存储部门的总经理,我主要关注是企业,中小企业,还有正在不断出现的云以及家庭使用的存储。所以现在在我正式来跟大家做今天的发言之前,我们首先来看一下短的视频。

这个视频主要是我们的速度越来越快,车越来越多,我们就慢慢的停下来,最后就走不动在存储的时间也是同样,现在每天存储量有非常之多,所以每隔18个月就会增长2倍,所以我们需要现在有更加高效的存储方式,要使得我们这些车重新运作起来。

同时还需要满足快速、高效和安全,所以怎么样才能实现这一点呢?怎么样才能使你的存储变得更加绿色、更加高效呢?所以我们需要寻找更好的解决方案,你有没有准备好来突破这些存储的瓶颈,有没有准备好来突破?

这是非常令人振奋人心,就像你刚才所看到,不管你在什么样的高速公路要解决突破瓶颈的问题也是非常重要,这也是我今天要跟大家来分享的。大家都知道我是英特尔公司的,我们公司特别喜欢解决特别困难的问题,今天我想讲一个真正困难问题,就是要使得我们的数据中心更加有效,更加敏捷。

我们怎么来解决今天这些问题呢?而未来我们的数据中心将会是什么模样,这就是今天我要讲的。未来一个数据中心,我们可以想象一下它是一个动态的数据中心,这个数据中心它可以自我进行动态的平和,并且能够保证可以升级的性能,同时也是总成本可以降低,我们怎么才能实现这一点。

我们开始要改变我们的想法,我们的态度,从历史上来说我们会将计算、网络和存储看作是各不相关的东西,单独的东西,我们总是单独去看这三样东西,但是我们现在来看数据中心把它作为一个平台整体去观察,所以这是一种新的思维方式。

我刚才就谈到动态的数据中心,什么是一个动态的数据中心呢?你需要的时候就可以做计算,如果你需要的时候它就可以为你接上网,你需要就可以给你提供存储的IO的性能,所以它是一个虚拟的技术设施,听起来非常伟大,我们将会实现这一点,我们接下来考虑怎么实现这一点。

我们在今天的数据存储当中存在什么样的问题,大多数的人还是面向数据中心的瓶颈,所以我将在之后的20分钟之内我跟大家讲一下你怎么做来突破这些瓶颈。主要在数据中心当中就三个瓶颈,第一个就是计算的瓶颈,使得没有把计算性能最大化,另外是网络的瓶颈,使得我们不能够很好的来做这样一个网络的连接。

然后是存储的瓶颈,存储的瓶颈它会增加我们很多的成本。所以,要是能克服这样一些瓶颈,就会使得我们更好的能够接近我们所谓的动态数据中心,怎么突破呢?

我们首先来谈计算,大家可以在这张图表上看到,我们在2006年我们进入了多核的时代,我们现在就是计算的能力大幅度的提高,而且我们现在计算能力比5年之前提高了10倍。而且还大量的降低了电子消耗,能源消耗,这样一种不断的创新对于你的服务器,或者你的存储系统都是非常重要的。

那么,对于我们的这样一个数据中心他对于我们的能源,对于存储空间都会有这样一个上线的要求,如果你能利用最新的技术对你肯定很有好处。像我们英特尔多核的技术可以保证大家得到更好的利用回报,而且还能够有最小的成本。所以,随着技术的发展,我们认为计算的突破在今天并不是什么太大的问题,而且它是行在正常的轨道之上。

下面看一下网络的瓶颈,我们采用了虚拟化的部署。所以,每一个服务器的复杂性都急需很大的提高。现在一个物理的服务器大概能够支持8或者10,有的时候20个虚拟的机器。所有的这些虚拟的机器他们都要争夺IO的资源,所以就导致了非常重大的瓶颈。所以,今天我们怎么做来解决这样的瓶颈呢?

所以,今天我们怎么做来解决这样的瓶颈呢?首先我们需要去去除在这个服务器IO的瓶颈,我们现在正在开发一些技术来解决这些问题。比如我们现在有一个的机制可以通过降低我们CPU的管理成本,另外我们还可以有非常先进的IO虚拟化技术,这样就可以为每一个虚拟机器提供一个直接的路径,以便能够让它实现最大的性能。

下面我们看一下数据中心的网络,今天你是会部署多个网络来做不同的流量,比如说典型的一个TCP/IP是一种。另外iSCSI是另外一种,FCoE又是另外一种,这样就导致你的成本非常高,而且复杂性越来越高。我们要想去除这样的瓶颈就需要把所有这样一些流量都整合到一个共同的网络,就是一个以太网我们认为以太网将是一个更好的交通层。

这样一个整合将使你降低整体拥有成本,你的资本成本,还有你的运营成本。所以,虚拟化就像我刚才所提要求我们有更大的带宽,今天很多IT经理都在用每一个服务器6到8G的接口,这是非常昂贵,我们必须要有非常好的办法来做这个事情。

所以10G的以太网可以让你整合许多的GBE的接口到一个单一的接口,所以有了一个实际你就可以存储流量来使用EFG,这样使你硬件和管理的成本都可以降低。我们还可以看到未来下一个改进将会是40G的以太网。将我们有了这样一个带宽的时候,就可以向你们聚合的网络全部整合在以太网上、英特网上。

所以,英特尔的IT部门也做过一个分析来比较这样一个融合的网络和没有融合的网络他们之间的区别,下面我们来看一下使用统一网络的评估,所以英特尔的IT部门也看了我们怎么把这些不同的网络整合起来,所以我们去估计他们的性能,他们的成本。

首先看带有FCoE实际的网络,我们会选择这样一个情境,这个情景我们的目的就是要把9个接口变成2个实际的接口,所以最后的结果我们每个机箱可以节约大概3.8万美元,因为我们对这样一个网络进行这样一个整合之后,我们降低了光缆、开关、IHC和SBC的成本,这里还没有说在管理方面成本的降低。

我们所认为对于这样一些CIO和IT经理来说,先看一下你们的网络,然后看看你们怎么增加你的带宽,同时又能够降低你的成本和管理的复杂性。

下面我们来看存储的瓶颈,怎么样来改变这个存储的瓶颈呢?这个比以前更加重要了,因为现在有很多非结构性的数据,还有很多不同出现的需求,他们的发展非常快,我们的存储系统也必须跟得上。今天传统的存储架构已经是过度承受不了这样新的需求了。实际上根据平均存储利用率现在只有35%,非常之低。

IDC就告诉我们大概有50%以上的服务器工作负载都是以I/O为基础,英特尔会看这些工作量,同时发现有40%其实是有存储为基础的。所以,这里就包括你的主要能够产生利润的这些应用,它对于你公司的发展还有你竞争力都非常重要,因此存储它的性能和表现是你的一个竞争优势。

最后,服务器的虚拟也是产生了我们对于传统存储系统不足的认识。所以,现在由于虚拟机器不断的发展,而且我们这个实际的光缆变得越来越宽,所以我们现在就需要有更好可扩展性,以及更好的性能。

下面我们更进一步来看一下存储的瓶颈,主要有两种瓶颈。一个是成本,还有一个是它可扩展性的性能,我们首先看一下成本。这里我们来看一下TPC-C的数据,一直就是从2001年开始的数据,这里是一个很好的基准,因为它包括成本,而且可以看到从这个图上每一个单元的性能这样一个成本下降了100倍,这是服务器的。

但是,这个存储成本在同样的时间内只下降了10倍,所以我们得知道为什么?存储同时也占到你基准支出的75%,这种降低很好但是还不是足够来降低你的资本效率。同时你还需要更好去增强你的效率,更好去增强你存储能力,所以好消息是我们这个行业现在正在回应,而且我会给大家看一下我们做出什么样的进步和进展。

我们这样一些存储销售商他们也用了一些嵌入式的智能,我们需要把一些技术和管理的能力,把更多的智能放在嵌入式的当中,他要求有更高的计算性能。所以,下面我们来看一下在存储上面这样一种计算的性能,我们必须要改变我们传统的这样一种广泛式。比如我们应该从以前内嵌式的处理器转向更加标准服务器计算的组成。

另外我们的性能应该更高,同时我们应该有更好,更快的创新能力,同时我们还要实现规模的经济。

下面我们来看一下,对多系统组合这样一种成本的瓶颈,IT为了拓展他的能力,他的性能不断的加更多的存储进去,而且你现在有更大的能力,有的时候可以有更好的性能,但是确实有一个限制,也就是说他会创造出其他的一些问题,他会创造出存储的孤岛你的信息被隔绝了,这样就使得成本更高,复杂性更高。再加上我刚才所提到能源还有空间限制的问题,所以非常令人头疼,我们有没有更好的办法呢?

那么,存储的虚拟化,在跨越多系统存储虚拟化是一个非常好的技术。但是,不同组合这样一种虚拟化可以使你把不同销售商的产品、存储能够整合到你这样一个虚拟化的平台上,那么这样可以对它进行集中的管理,这是一个非常好的技术。所以,存储的虚拟化可以给我们更好的资源利用,更好对于环境的积极性,另外使你整个数据中心的过程数据化。所以,这个确实是一个成本的问题,我怎么解决这个成本的问题。

下面来谈一谈性能的瓶颈。这个也是最难解决的一个问题,最有挑战性的一个问题,到底是什么导致了这种性能的瓶颈呢?就像我前面所说的那样,大概有40%的IDC的工作量都是以存储为基础的,这张图表可以看到是以以存储为基础的工作流,工作量,这些东西很多公司核心的商业程序,这是核心竞争力所在。这里面会有他的角色支持,合作和应用开发,还有网络和IT的基础设施,所以存储必须要能够满足这个需求。

我再说一下更加复杂的是,现在我们出现很多IO输出设备的阻塞,这是由于在虚拟服务器的增加所导致的。另外还得去解决这样一个IT的消费化的问题,也就是说你的内容应该是任何时候,任何地方和任何设备上都可以得到的。

同时他也可以为你提供更好的服务器和存储的平台融合,这对你来说意味着什么呢?他意味着我们有一个模块化的框架,他可以给你使得更高的能力,还有更好的一个可拓展性,同时可以从摩尔定律当中得到很多的好处,可以有很好的创新,更低的成本。

所以,这种需求非常高,现在对于IT来说我们的底线,我们的服务水平,还有我们用户的生产力是在不断降低,同时你的复杂度和成本也在不断的升高,怎么办?我们的答案要去做一个统一的存储框架,在这个框架上它是可以把计算,网络,还有你存储结合到一个平台上来。

下面我们来看一下这样一个统一的存储框架它的存储类型。我们使用这个存储的类型,它其实是有那些要求高的数据流、工作量所要求的,这里面就包括非结构的数据,另外还有一些医学的研究和影像,还有金融的服务,还有Web2.0,还有云的需求,还有数码的内容创造,这些都是我们今天所面临最重要的工作流,工作量。

什么是统一的存储架构呢?之前我们考虑了一个传统的方式和架构,他们都在试图不断去满足不断变化数据中心的需求,所以要想能够拓展你性能,你需要在一个节点上,单个节点上拓展他的能力,就导致了带宽的问题。这就是把IO和硬盘的能力加到同一个节点上去,要想进一步做这个存储就可以加另外一个节点上去,就可以使很动态去拓展你的性能。

英特尔的IT部门也来看这样一种存储的结构,我们来看英特尔给你们提供了什么。在我们CPU的设计环境中间,就像我们的摩尔定律一样的增长速度,我们有5TB的数据,我们有900个文件服务器,而且我们每年的增长率达到40%,我们的开发证实还有我们的测试,我们是在全世界30个场地做出来,同时我们的复杂性也越来越多。

我们的性能的可拓展性使我们有很多并行的工作,因为他们有很多时候要使用相同的数据,所以我们的存储性能以及可拓展性成为了关键的瓶颈。目前我们的解决方案,就是说我们只能够支持400个积极客户,以及400G的容量。现在我们需要一个解决方案,这个解决方案能够支持至少四千个客户在全世界的,而且容量达到3个TB。

如果用当前的解决方案,就是说我们至少要加上10个存储服务器的机架来满足这样一些机构,满足这样一个需求。这样给我们地面占用,还有能源,我们散热成本上来讲带来很大的挑战,所以我们做的是什么呢?

在这个过程中间我们看到有20多个解决方案,最终我们选择了一个高性能,向外拓展的并行存储的集群,在这个过程中间我们整个性能增加了3倍,可拓展性我们把整个整合变成了10个整合成1个,是10:1的比例,这中间给我们带来很好的结果。我们有标准的服务器,在过去的3年里面有2300万美元,这是非常好的结果。

我们下面重新总结一下,什么叫统一的存储架构呢?服务器和存储的架构在互相的融合,我们英特尔会把更多存储技术架到我们服务器的CPU里面去,这是一个整合。另外把存储网络还有数据中心基于10G以太网,最后能够推动到40个G的以太网,在过去10年里面我们作为计算还有在网络上面我们一直提到高性能,这个中间在整个需要让存储和我们性能能够取得一个平衡。

最后一点有了统一的存储解决方案,我们的服务还有我们的软件、硬件创新会得到加速,我们从这方面来做。我们在这里也给大家讲如何去解决今天这些瓶颈,那就是说一个平衡、统一的存储架构,所以我们需要继续往前行,达到动态数据中心的概念,这就是我今天开始给大家提出来一个愿景,也是一个理念。

下面,我们来看一下动态数据中心是什么样子呢?我刚才也说了这样一个数据中心是高度虚拟化的架构,而且是一个统一的架构,有运算、网络、存储。

大家都知道在基础架构有很多服务,存储、应用、管理、安全、参数管理等等,它有能力能够自动和动态去配置资源来去满足工作负荷的需要,365天每周7天24小时,这是我们行业一个愿景。

每天我们都离那个目标越来越近了,我们的硬件和软件公司,他们做出了很多的努力,最终我们要得到这样一个未来是非常令人激动的,而且我们会一起走向未来的愿景,我们下一步是什么呢?首先要看看你的瓶颈在哪里,是运算,存储还是网络,想一想我今天讲的是什么内容,怎么去去除这些瓶颈。

另外要部署统一的存储解决方案,最后要不断的进行推动,然后朝动态数据中心的愿景前进,我想感谢大家今天听我演讲,也希望大家能够过个非常有收获的时光。