主题演讲:构建统一管理的数据中心基础架构

主题演讲:构建统一管理、调度、分发的数据中心基础架构 H3C 褚亚军

各位尊敬的来宾大家上午好,我来自H3C华三通信公司,今天非常高兴有机会在这里和大家一起分享一下H3C对于下一代数据中心的理解。在这里主要是基于UDDC的模型,这个模型为整个数据中心统一的管理、统一资源的调度进行了一些阐述。

首先给大家展示看一下数据中心发展的历程。数据中心的发展历程和IT信息化发展其实是同步的,大家都知道从诺兰模型以及ITCMM模型3、4级,IT信息化发展到目前阶段已经是数据整合的阶段。

在整个数据中心发展阶段当中从大型机为中心,到以服务器为中心以及到网络为中心,一直到现在以数据为中心的四个阶段。那么在以数据为中心的阶段面向的主要是数据,数据本身就是应用,也就是应用本身。像我们CIO更多希望数据中心作为核心部门向外提供服务,对内的IT资源并不应该放很多的精力去关注。所以在以数据中心为模型下一切的IT资源都看作是为数据服务的一些资源。

在四个阶段的发展中其实每个阶段的发展都是基于前一个阶段存在的问题,为了解决这个问题而引起的。比如说在服务器阶段是由于什么?是由于物理资源的分享储存导致的数据的大集中。到现在以数据为中心的阶段依然面临很多问题和挑战,比如说第一个挑战就是非常严重的挑战就是资源的异构。

在每个阶段都有虚拟应用以及虚拟应用对这个资源新的需求,由于在建设过程当中采用了不同的技术、不同的设备、不同的标准,从而在逐渐庞大的IT资源信息里面,异构现象大量存在,面对这些异构现象就会导致非常严重的问题,主要来自于无法进行端到端的部署,无法做到端到端的管理。基于这个异构我们CIO应该关注什么呢?就是对异构资源进行整合。所以我们应该把资源的异构看作是现在数据中心最重要的挑战。

第二大挑战来自于管理的挑战。这里是一张典型的数据中心的模型图,从左到右就是LAN到服务器,从资源的管理必须要有两套标准的管理系统。当然大家都知道目前计算、储存、通信三大资源的隔离无法实现端到端的部署和调度。

第三个挑战来自于数据的动态增长。数据中心大家都知道不是一个静态的,它的业务会越来越多,旧的系统会产生大量的数据,随着这些数据的增长,从现在来看18个月的数据中心顶上以前产生所有的数据总量。这个数据可以看出在数据爆炸时代我们的数据中心作为一个资源如何能够去完好的适应数据爆炸的增长以及灵活的调度呢?所以这是应对第三个挑战,即动态的数据增长。

第四个核心关注就是绿色的概念,即数据中心的能耗。我这里列的两张表,左边是能耗的增长趋势,大家可以看到在2005年2010年整个数据中心的能耗都是一种增长的关系。

面对如上的四个挑战应该以怎样的模型解决这些挑战和问题呢?H3C将以数据中心为基础提出UDDC我们分成三个层次:第一个层次就是业务层即数据层最底层,在资源层和业务层之间有一个调度分发层,在这个层次里面最核心就是中间的调度分发层,它主要是完成对资源的分解以及对下级资源的统一调度。接下来我会根据这三个层次的定义给大家逐步阐述一下。

首先我们看一下资源层,UDDC的资源层是作为整个数据中心最基础的架构,在资源层里面我们定义了两个最重要的特性。第一个,在上面的图表里面可以看到,最底层叫做能耗设计。在能耗设计部分我们主要是强调设备的绿色设计,包括节能、减排以及可回收利用。

第二个就是资源虚拟化,虚拟化完成对计算资源对储存资源以及网络资源的统一管理。

接下来我给大家展示的就是端到端的虚拟化概念。虚拟化大家都很熟悉,尤其是在计算虚拟化这一部分很多人都理解,但是我这里提到的虚拟化是端到端的虚拟化,也就是整个数据中心我虚拟的是什么?

应该是对应用的虚拟以及应用的访问者以及物理逻辑的隔离通道。从这里可以看到A、B两个部门有不同的访问者、访问群体,比如说一个是财务部门一个是办公部门,他们访问的服务器有可能在物理上是统一的服务器,但是业务上是相互隔离,也就是在计算虚拟化在同一个虚拟化提供不同的应用。由上而下在物理的网络资源上也是能够保证完全虚拟的通道。

对于虚拟化我们有两个理解,一个是对于资源异构的问题,表现的尤为突出。在储存里面首先是异构的储存如何融合。第二,我们访问服务器是IP网络,有可能采用FC的接口,这样两种网络如何融合,再加上我们先前在数据中心应用的操作时候通常采用资源静态绑定的过程,对于静态绑定的过程如何分解呢?

在储存虚拟化里面我们提倡在上网络和IP储存当中采用虚拟化设备完成对底层异构化的介入,对上层进行统一的资源,这样使网络统一,在整个网络里面进行端到端的部署以及管理都带来了方便

第二个虚拟化的概念并不是为了解决异构,它实际上是为了能够在同一个硬件架构下提供逻辑隔离的资源,进行隔离的访问。在这里主要是在网络虚拟化这一层进行阐述。网络虚拟化在这里有两大主要的特性:

第一,我们通过同一套网络能够虚拟划分成很多逻辑的资源,这些资源之间是相互隔离,但是和应用相关。

第二,这些资源已经有了逻辑隔离以后,还有一个问题就是访问是否可靠,访问是否允许。我们通常建议在介入的时候使用C&D,访问者和访问资源是完全可靠的。

第三,安全的虚拟化。安全虚拟化是一到多的概念最好阐释。因为在安全虚拟化里面使用同一台的安全物理设备,在这个物理设备支撑虚拟化出很多逻辑,具有相同功能的安全产品。为什么要虚拟化这么多产品出来呢?

因为大家都知道在数据中心分区里面通常会分很多区,比如说英特来特服务,这些区的安全策略是不一样的,比如说对外界的英特来特服务有很多,我们有一台物理设备上虚拟处多台逻辑上的安全设备,并且在逻辑设备商上置安全的策略,而这些策略是相互不影响的。

所以H3C认为在整个虚拟化过程当中,应该是一个端到端的虚拟化,应该包含了安全、储存、网络以及我们的面向应用的端到端的整体化的虚拟过程。

那么在UDDC的资源层除了虚拟化以外还有一个概念就是针对绿色环保设计的理念。绿色的能耗设计不仅仅是一个节能过程应该包含节能减排、可回收利用这三大部分。节能很好理解,是对设备的一个考量。

第一个是风扇的设计用自动调速、低能耗自然散热。第二个是采用节能的器件比如说节能的硬盘。

节能这一块H3C在2004年加入了标准工作组,保障设备产生的污染是最小的。第三个在可回收利用,使用了同一种类的材料避免不同材料的混合。通过以上三种,也就是节能、减排以及可回收利用这三大技术已经实现了整个设备的能耗,降低到原来的80%,这也是比较可观的。在能耗方面H3C和国际组织一直合作,并且参与一些标准的制定。

以上阐述是对于资源层虚拟化以及绿色能耗这方面的阐述。资源是我整个UDDC架构的基础,那UDDC的灵魂在哪里呢?

接下来我给大家讲一下UDDC的调度分发层是连接应用层和资源层之间的核心部件,也是整个UDDC架构的灵魂。UDDC里面分成三大模块,先讲左边这个模块即资源统一管理,也就是在UDDC架构下我们认为所有资源只是为数据服务,所有的管理像CIO关注的不应该放在资源管理上,而应该放在核心业务提供的服务上,而这些管理可以让系统自动的完成或者少量的人为配置,所以这是资源统一管理层。

第二层就是分发平台。分发平台可以做到对上层应用的理解,根据上层应用进行资源分解,通过内部的调度完成对底层资源的统一调度,通过调度分发可以完好建立起应用层和资源层之间的互动。

我们看一下原有的数据架构和现有的数据架构在调度统一管理方面的差异,有两大主要的差异:第一,我们可以看到IP的融合。第二个差异在整个融合以后整个资源的调度可以看到下面这个图片,所谓的调度经过UDDC的调度分发层,对于整个数据中心IT资源进行统一分配、管理,统一的部署。所以在UDDC架构核心里面,我们建议标准化是其一,融合是其二。第三点通过资源统一调配减少资源负担。

我们可以看到资源管理平台的组建能够动态的了解到在我虚拟化以后所有资源目前使用和未使用的情况。

在现有业务发生变化的时候,会主动向我的分发平台提供一个资源请求,这个资源请求用可能非常准确,比如说硬盘要多大,需要多少计算资源,需要多少的计算能力等等,通过这个我在分发平台了解到资源分配的要求,同时会把这个要求传递到调度平台,由调度平台通过对如下资源的统一调度进行资源分配,对于业务来讲是无需关注这个储存资源放在哪个网络上,以及我计算资源是哪一个服务器,这是他不需要关注的。

谈到调度和分发以后不得不谈就是它的基础,要能够很好完成调度分发必然的基础就是对于资源统一了解,统一了解从哪里来,就是我们提到的IP的统一管理。从如上图片可以看到在H3C管理理念里面我们认为它的管理是全方位的管理,不单单只是指设备的管理,不是说我看一下服务器配置是怎么样的,我的网络应该配什么样的规则,这是非常单层面的,我们的管理一直认为是全局的管理,是以应用为导向的。

首先可以看到一个新的应用它的性能对于安全、服务、储存都有资源要求的请求。同时他还更关注对于访问者是哪个部门访问、哪个人来访问这是有要求的。所以以应用为核心的话可以关注两点,一个是人如何管理,第二IT资源如何管理。我们可以看到整个统一管理包括IT应用、IT使用者以及IT资源,并且整个资源统一调度之后能够提供给客户最好的调度平台,并且能够降低整个企业的TCO。

在这里我们做一个总结,大家都知道在UDDC架构下面定义了三个层次,第一个层次就是我们的应用层,在应用层主要包括我们有些定制业务比如说web应用比如说ERP OA系统。第二个层次资源层,在最下面一层是整个UDDC的基础,在这个基础上我们强调的核心基础,第一个是低能耗设计,要绿色设计。

第二个,在整个UDDC最基础的环节,就是虚拟化,它的虚拟化是端到端的虚拟化,包括计算、储存、网络、安全所有资源的虚拟化。通过虚拟化以后提供给上层、调度分发层是一个完好的资源分配情况,而不是单某个设备。那么在整个UDDC的核心部位也就是调度分发层主要完成对上层请求应用的分解,能够把上层应用的请求分解成对资源层的详细描述。调度平台就通过资源统一管理之后对资源现状的重新再分配。

从这里可以看出UDDC架构实际上是以虚拟化为基础的,我必须要有一个虚拟资源为平台。同时它的目标就是整个数据中心的资源化,也就是说以后我的关注点可以只放在数据上而不需要关注支撑数据的IT架构。

我们来看一下UDDC架构对现有数据中心有哪些影响呢?在左边可以看到是我们典型数据中心的图。在这里可以看到首先第一个问题异构,各种各样的储存设备、各种各样的服务器、各种各样的操作系统,异构的架构又是各种各样,我们经过虚拟化进行储存的整合,通过虚拟化乱网络和散网络的统一。我们强调在应用层和调度分发层也就是前两层之间通过统一的标准。

第二,对于繁杂的网络,就是网线乱布,整个网络没有层次感,这种情况下怎么做?还是虚拟化,即端到端的虚拟化,在同一个网络的资源下虚拟处多个逻辑通道保证业务的隔离。

第三,兼容性问题突出,以及总体成本高昂以及管理维护困难方面,我都做了阐述。我使用了UDDC架构以后网络层次非常明显,分为三个层次,在第二个层次我们还有基于OA架构的描述,也就是说我们开发了开放的OA平台,可以给第三方提供很多开放的接口,完成其他一些服务器资源比如说计算资源,可能我们公司不是很擅长的,在这一部分可以有第三方的公司参与进来一起进行开发。所以从整个架构来讲UDDC架构能够给我现有的数据中心能带来投资的降低以及投资回报率的提升。

最后我对整个数据中心做一下展望,刚才讲过了UDDC是以虚拟化为基础,以资源化为最终目标的,但是对于资源化的管理仍然有很多工作是停留在人工处理上面。那么整个数据中心将来是什么发展方向?

我们一直在研究,我们认为数据中心将来的发展必然是以资源化为发展的架构,资源化的架构会突破现有人工管理一些烦琐的流程,会提供人工的引入以及动态改进的引入,通过引入改善资源的适应,比如说我所有资源是动态的、所有的资源可以按照业务的需求,并且在业务进行增加的时候可以自动的分配。另外在资源出现故障的时候可以提供一些"治愈"的功能。

从今天和大家一起交流的情况来看,我们所展示给大家的就是我们H3C在下一代数据中心当中我们认为UDDC是一个从虚拟化到资源化发展的必经阶段,在今后所有新的数据中心以及数据中心进行扩容的情况下,在UDDC架构下可以为大家带来投资回报率的极大提高,以及管理调度非常便利的工具。希望UDDC模型在以后为大家在数据中心建设当中带来帮助。

谢谢大家!