从云计算谈IT建设的新思路和新方法

云计算严格意义上来说是一个新名词,它既不是一项新技术,也不是一个新概念。甚至,云计算这个词本身就是值得商榷的,云的含义绝不仅仅是针对计算,而是IT系统建设的一个总体方针和大势所趋。云代表的是一个崭新的IT时代。

早在二十一世纪初,IBM就提出过On Demand随需应变,HP也提出过Utility Computing效用计算,H3C提出了IToIP。甚至在更早的上个世纪90年代中,全球各地就出现过一批以ASP(应用服务商)、SSP(存储服务商)为运营模式的商业探索者,他们都是云计算的先驱和实践者。上述概念或商业构想与今天的云计算并没有本质的差异,都是对同一个IT发展愿景进行的不同角度表述。

那么,这个愿景究竟是什么呢?就是希望IT资源能够有一天像今天使用的电力、自来水一样"即插即用"。这些IT资源包括应用、软件、硬件设施等。我们从未听说过"云电力"或者"云自来水"。因为从来不需要关心发电、输电设备的技术和管理就可以轻松使用电力资源;从来不需要关心水的抽取、净化和输送,就可以使用清洁的自来水资源。云代表的就是资源的社会化、服务化和专业化的大趋势。

我们要讨论的问题是:有没有哪些IT领域已经实现了资源化,或者说"云化"?是什么原因阻碍了IT"云"的实现?要拥抱"云",我们需要做些什么?

如果谈到广义的IT,把话音通信也归入IT范畴,那么我们无论在固定电话还是移动电话方面,都早已实现了"云电话"。我们只需要按消费需求向运营商申请服务,就可以按喜好购买终端接入使用通讯服务。如果回到20-30年前,我们同样可以看到每个政府机关或者企业,都在购买程控交换机,甚至设置话务员部门负责通讯联络。大规模数字程控交换机和电信运营商的出现,使这样的自耕农式通信建设,进入了社会化协作的"云通讯"时代。

我们所熟知的Internet更是以与生俱来的全球化分工协作精神,从一开始就是以网络资源服务的姿态打造了一张"云网络"。即便我们某些行业部门还在乐此不疲地建一张张内部使用的独立纵向网,至少从来没有人想去建一个"自己的"Internet。

云在IT世界从来不是一件新鲜事,在发展最迅速的语音和数据通信领域,我们天天都在使用着这样的云。从人类发展历史来看,不断深化的社会化、专业化分工是社会发展的大势所趋,在IT行业同样也不例外。所以,我们对于这朵飘然而至的"云",不应该从"新技术"或"新概念"的角度去看,而是应该看作 IT系统的建设大趋势。

现在回答第二个问题,是什么因素阻碍了"云"的实现?有两个主要原因:

一是传统管理体系对信息资源的分割占据,人为地阻碍了信息的流通和共享。没有"水"的流动循环,"云"自然也就无法生成。

二是IT发展过程中的群雄割据和利益导向,导致标准林立。很多厂商都在纷纷定义私有的应用标准和数据格式,诱使或迫使用户在IT系统建设时,不得不按照不同厂商产品设定的框架装入自己的业务。最终导致业务割裂,系统混乱。

一个简单的假设,如果一个用户的机房中,同时运行着4到5个不同厂商的服务器、操作系统、数据库、存储设备、网络设备和安全设备,应用软件有3到4个不同的开发商且各自为战,从未按照全局信息规范标准进行信息定义和系统开发,数据中心也仅仅是完成了把数据从物理上堆到了一个机房中,业务仍旧是条块分割,风马牛不相及,那么,当这个用户面临着越来越严峻的业务连续性、安全等级保护、跨业务整合、应急指挥等等新的业务主题考验时,陷入疲于奔命的救火状态很难避免,业务自然也就很难更上一层楼。

因此,云对于我们反思IT建设历程,从系统化、集约化、整合化、社会化专业分工角度重新思考未来的IT之路,有着重要的现实意义和价值。我们可以不需要"云计算"的帽子,却可以据此审视我们的建设思路:什么才是符合发展潮流的做法?不再打着信息化的旗号,做着把信息锁进箱子底的事。

对于管理方面的问题,应该认识到:充分信息化的前提和结果之一是管理的扁平化,是管理的客户导向或服务对象导向。我们欣喜地看到,继运营商 BOSS系统整合、金融数据大集中等企业业务整合行动取得显著成效之后,政府很多部门也都正在努力进行管理流程变革和IT系统整合。从公安部门的警务综合系统,到学校的数字化校园;从社会征信系统,到政府网站一站式服务整合。越来越多的政府和企业信息系统,不再着眼于个别功能的实现,而是着眼于大系统大业务,打破内部部门分工障碍,甚至打破不同行业或企业间的"数字鸿沟",正积极向着信息的标准化、信息交换与共享,业务流程整合的方向迈进。

在管理优化和业务整合的基础上,技术和系统的重构和整合就成为第二个需要面对的问题。前面分析过,软硬件技术标准、数据格式标准的厂商纷争和利益纠葛,是造成今天系统割裂整合困难的根本原因。从目前阶段进入到类似通讯和网络的"云时代",从技术上至少还需要跨越三个大的台阶,自底向上分别是:计算和存储设备在硬件技术和管理技术上的充分标准化;操作系统的充分标准化,具备高度的互操作和应用随需部署能力;主要应用的数据格式充分标准化和高度互操作能力。

三个台阶的跨越过程,需要大量的中间件、虚拟化技术将原本死死绑在一起的软硬件结构打破,透明化为逐层向上提供服务的资源化IT体系结构,这就是云计算中经常提到的PaaS(Platform as a Service)/SaaS(Storage or Software as a Service)/IaaS(Infrastructure as a Sevice)的价值所在。

想象这样一幅场景:一个业务机构,早上9点上班,员工忙于收发邮件,这时,可以调集100个计算节点中的80个集中服务于邮件业务;10点之后,随着终端客户逐渐进入营业场所,营业系统开始步入高峰,邮件业务开始下降。系统管理员甚至是系统能够自动将邮件系统使用的80个计算节点释放出70个迅速用于业务系统的支撑。所有的计算资源像一个可以动态调配的水池,随时为一尾尾不同应用要求的鱼提供着适时的支撑和灵活的服务。

再想象这样一幅场景:在一个数据中心,管理着约10PB的数据(10PB=10,000TB),其中实时在线交易数据占100TB,数据仓库和决策支持系统数据达到1,000TB,包含图片、视频和文本文件的常用数据约2,000TB,其他近7,000TB是计划存放30年的各种历史数据。

由于充分实现了存储的标准化、智能化、虚拟化、服务化,数据资源的管理异常轻松。每一台服务器根本无需进行预设的空间分配,只需要向存储服务平台发送数据读写需求,存储平台能够根据前端数千个计算节点提出的不同的数据读写需求,智能化地决定数据服务策略:

1、具有高性能要求在线交易数据,存储系统自动存放到由固态硬盘组成的容量池,提供高性能的数据读写服务和高可靠的RAID10保护服务,同时该容量池已自动设置了备份、同城、异地多级灾难备份的数据保护功能;同时分配了足够的IOPS能力服务于数据的读写操作。

2、对于数据仓库和决策支持系统,存储系统自动将数据分配到配置了较高性能的SAS硬盘区,用RAID5进行较低成本的配置和数据存储,只对其中的重要元数据进行高级别备份和容灾保护,过程性数据仅做简单近线备份保护。

3、对于近2000TB的各种非结构化数据,按照数据本身描述中的数据格式、时效性要求、传输带宽要求等,存储系统自动分门别类将数据分配到不同介质区,提供不同带宽条件、不同数据备份和灾备保护能力应对不同的数据访问需求。

4、根据业务规则,存储系统自动将一年以上访问频率小于10次的数据自动归档到有MAID(大规模非活动磁盘阵列)技术支持的绿色数据归档区,硬盘平时处于下电状态,大幅度节省归档能耗,仅在有访问或新写入时,自动加电相关的介质提供服务。如果数据超过1年没有访问,存储系统还将把这部分数据自动归档到磁带中进行离线保存。

5、任何时候,存储系统能够根据访问特征和数据特征,自动组合和分配存储资源,并源源不断地向管理员提供各种数据区的使用特征和记录分析。一旦某数据区达到容量、性能或安全临界阈值,只需要按照标准化规程加入标准化的介质、性能处理单元等,存储系统就能够自动把新的资源加入资源池。