技术演讲:以服务为导向的平台架构数据中心

技术演讲:以服务为导向的平台架构–新一代数据中心 富士通 周一平

非常高兴能够参加这次新一代数据中心2008论坛,我叫周一平是负责亚太地区咨询跟售前这一块,担任中国富士通信息有限公司首席技术总监。我今天演讲的主题是以服务为导向的平台架构。这也是我们一直努力要做的事情,因为我们富士通中国信息技术有限公司是一个平台产品销售跟服务为主的公司。富士通因为是一个集团也有做等离子、空调,但我们是专门做平台产品的销售服务公司。

首先我们想看一看数据中心的市场跟挑战以及趋势。实际上在目前来看在日本市场跟全球市场我们从IDC的统计表上看到,绿色代表数据中心包括客户自由的数据中心发展趋势,还有我们下面这一栏是托管服务的数据中心发展趋势。数据式服务器市场增长非常快,到2010年的时候大约要增长30%左右。

富士通在全球数据中心服务的相关业务在中国由于法律上的原因外商不允许经营数据中心的,因为我工作在澳大利亚,我们拥有了亚太第二大数据中心,是富士通自己拥有的。最近在日本50个数据中心承建过程当中,富士通给每一个数据中心达到50%的节能效率,这个消息非常震惊,当时很多记者打电话到富士通中国公司来问,你们是怎么达到50%的节能效果。

实际上ITO经理在数据建设所面临的挑战大家都可以看到,数据中心由于空间建设,很多数据中心都是建立在非常昂贵的CBD,CBD大楼里面的数据中心昂贵以及数据中心的能源开销,数据中心数据存储器的利用,等等这些就给我们一个如何建立优化、动态的数据中心。

数据中心管理方式的演进大家可以看到,从监测角度不管你是热能的监测器呀,大家会感觉到在数据中心达到优化的目的一定是按需配备资源的过程。

第三,基于策略的自动化,大家都知道资源能够配备的话如果还是停留在人工的配备资源的水平上还是不够的。

当然最后还是要基于效率安全的技术,最后达到数据中心的高效性、灵活性和可靠性。新一代数据中心创建这一大趋势就是SOP,整个数据中心在建造过程中就考虑这样的问题,就可以达到几个好的目的,就是平台架构的最大共享。因为你的数据中心不可能为某一个部门而建,肯定为很多部门或者很多很多应用系统来建的,这个平台架构的最大共享是第一个想达到的目的。

第二,平台资源有效的细分和虚拟化。因为你要让大家共享,让各个不同部门、不同应用都来共享你的资源,有序的共享和虚拟化是必需的。

第三,平台资源调配最大程度的自动化。现在每个厂商都加大研究这个问题,怎么达到资源最大程度的自动化。

我们能够对业务解决方案的贡献,SOP对业务肯定是高效能。

第二,流程的易变和易组合,现在业务不是静态而是在不断的变化当中,我们需要有一个平台架构能够适应这样的变化,当然作为一个数据中心一旦要讲到共享肯定有一个运用的连续和高可靠性,这就是以服务为导向SOP的平台架构,我们所要努力的一个方向。我下面要讲一讲富士通在构建数据中心的一些策略、方法以及技术,还有我们的产品。

富士通在优化IT架构我们有自己的策略,实际上这是富士通西门子共同制定的,大家如果熟悉音乐里面德语有一句叫做"TRIOLE"(三分音)的意思,我们分成三个步骤:第一,更具成本效益的解决方案,高效的数据中心。第二,更灵活的IT基础架构,达到灵活的数据中心。

第三,支持关键业务的领先技术。也就是数据中心业务不断增长的情况下,我们要考虑的是对外部环境的影响,这个策略的具体体现就是这个方法,大家以前所面临的应用程序对于某一个业务的应用就买一套存储买一套服务器满足你应用的需要。然后这个数据中心的整个架构就越来越来复杂。这就体现IT技术架构的复杂性,它的管理成本肯定是成这样的趋势,就是一下子提高非常高。

那么我们第一步如何做的呢?我们首先要把资源进行细化跟分类。大家从左边这张图来看,实际上这么复杂的架构实际上可以分成计算资源,一个存储资源一个网络资源,细分还没有用,因为你只是做到第一步,第二步富士通自己开发了资源协调器,就是用富士通资源管理动态管理计算、存储功能,不是为某一个应用服务,就是动态的管理资源。

来做这个事情也就是我上面讲的资源管理核心技术就是这三个,第一个就是虚拟化,第二个自动化,还有一个集成化。为什么要讲到虚拟化,大家都知道你要把一个应用程序运行到不同的服务器上面,现在目前来讲实际上是有相当大的难度,你说我今天在这里运行一个服务器,我今天在IBM上面,明天转到富士通上面肯定有很多问题。

这个问题就是我们厂商要解决的问题,你这个应用程序怎么动都可以,在不同的厂商上面或者你不同型号的服务器上面进行不同动态的移动,这就是虚拟化。

那么自动化的意思就是说,当我有这样一个负载上面的问题或者是有一个高可用性上发生问题我怎么根据资源的调配。集成化就体现我们在构建过程中怎么用现成的技术,自己已经测试过技术应用。这就是我们富士通的三个核心技术。

我们有这样的核心技术我们的产品有这些,首先我们有一个中间件。我们硬件产品比如说富士通的服务器家族,这些上面的管理软件非常重要,因为我刚才讲了资源要动态调配一定要有管理,有SSM,跟我们物理服务器跟虚拟服务器怎么统一管理,P2P,物理服务器到物理服务器P2V,怎么调配都是由RCVE来做。

你在存储家族里面我们也有ETERNUS SF,富士通在优化过程当中叫做Sytemwalker,这有是我们所有管理软件产品从应用中间件到管理中间件整个架构。如果说数据中心要讲绿色和环保,高可靠还是数据中心压倒一切的基础,要为不同部门服务,万一一个服务平台出问题,实际上也是不能达到我们这个目的。所以高可靠是数据中心压倒一切的要求。

富士通大型机技术是我们公司的一个DNA,就是我们的遗传基因,这个遗传基因在小型机或者服务存储器上面都把这些高可靠技术用上去,主要在这几个方面,因为我们是世界上能够造芯片只有这几家,英特尔、富士通、IBM。

我们在部件级,你要说到可靠性,我们CPU是SPARC64有2200个检测点,这些都为可靠性提供了非常好的基础。当然我们在系统这一级我们有系统方面,我们有15000个检测点,当然大型机无电缆、智能冷却设计也保证了可靠性。

这就是富士通特有的硬件分区技术,富士通硬件分区技术跟其他厂商最大特点大家都知道,下面有两块板每个厂商都能做到板级的分区,一个板上有4个CPU,富士通可以做就是在右边把硬件分区到板上,就是一个CPU分区的力度是我们最高,也就是说这样细化的资源你调配的进度就越高。

当然你分区还不行,因为这是我们硬件分区技术,硬件分区技术跟软件分区技术最大的区别,当你分区就自动运行,当你管理系统拿掉还在那边工作,等于是几台分割开来的机器。你有了硬件分割技术一定要有硬件智能的调配,才能达到资源管理的目的。

讲到高可靠还有一个容错,这是富士通唯一一家采用的准硬件容错技术,也就是有两个概念在里面,一个叫做双同步系统镜像架构,一个人有两个心、两个肺、两个肝,大家知道硬件容错机非常贵,还软件叫做集群软件,大家记住一点集群软件不是同步而是异步的。

大家记住如果是一个双同步系统镜像架构的话一个部件坏掉另一个根本没有感觉到,它继续运行,因为是双备份的机器,这样一个大机器这样就提高非常大的,都不是企业级的操作系统,但是在平台架构上进一步可操作性,所以现在真正进入银行、证券行业,这是我们在这个行业最最成功的一台,就是开放系统下的准硬件服务器。

富士通全系列企业级服务器,我们有X86服务器还有UNIX服务器等。这是我们富士通全系列企业的成熟系统,我们一共有四个,一个2000、4000、5000、8000,达到世界上单机容量最大,都是具有大型机技术的平台产品。当然我们也有自己的磁带库系统,因为它是绿色系统里面不可少的一个东西,它不耗电,存储介质又不大。

最后当你有了这样资源的细化和分区之后资源的优化和动态管理就是我们新一代数据中心的特征,大家都知道现在目前我们所有的软件系统的趋势是用所谓SOA架构,把服务组建做成一个库,然后用一个ESB连接其,达到一个动态业务处理的目的。实际上我们在硬件平台要符合这样一个软件发展的趋势的话,我们提出了ROA,也就是我们把硬件资源也做成一个库,把我们富士通的资源管理真正打造一个动态平台架构的目的。

那么说到底你这个数据中心负载均衡跟容错的话是业务上每天都碰到的问题,也就是说如果你是负载出现问题的话,我怎么来自动把资源调配过去,当然自动化是必须,也就是我要解决的问题就是负载均衡和容错一定要制度化,这样才能真正达到资源上面的共享目的。

现在来看一看我们把各个部门或者各个部门的应用运用到这个小机器上就可以应用,如果某一个应用缺少CPU怎么样,动态把CPU切入到这个静区里面能力就加大了,这是我们系统根据需求进行调节的,这是一个用硬件分区技术加上自动的系统资源调配,这是一个非常非常可靠的虚拟化技术。

也就是说你虚拟化带来了很多问题,但是我们用硬件分区化可以很好解决这个问题,当我们富士通还有一个资源横向的扩展,也就是说当你一个计算机不能完成任务的时候,刀片要一起加上完成这个任务叫做资源横向发展,那么怎么把任务分配到这么多服务器上面,我们目前国内开发的软件里面支持的还是比较少。

大家科技看一看这上面列出了几个,比如说像Web服务器是可以的,第二个是SAP也支持的,Oracle也支持的,富士通的Interstage。刚才讲的资源纵向扩展的话,一般来讲现在操作系统已经基本上能够智能,也就是说我原来运行4个CPU,再加4个CPU都可以自动识别。

富士通专门为SAP开发了资源横向扩展,这样是一个灵活架构,完全可以达到跟软件配合一起,达到动态的资源调配。这就是一个举例,意思是什么呢?你负载均衡的意思我应用程序原来了5个服务器,应用服务器用了3个,如果我想达到这样的目的我能不能做到呢?

目前我可以告诉你,web服务器可以做、SAP可以做、Oracle可以做的,否则我把资源横向扩展就不能达到这个目的,一定要注意这一点。

那么数据中心负载均衡跟容错的自动化我们目前所处的位置还是在动态优化还是可以做的,但实际上真正要走到第二步,任何应用在任何时候运行在任何平台,也就是我在演讲开始讲,原来你这个应用程序在IBM上,现在在某一个时刻要运行在HP或者富士通的服务器上面,这是我们大家想要做的第二步。

我们厂商都是想要达到这样的目的,任何应用、任何时候,运行在任何平台上,那么真正我们还要达到是一个Utility 一样,达到像我们用水、用电一样的方便。