北京云计算中心主任曾宇:一朵绚丽的“北京云”

2009年10月13日,北京市计算中心与Platform在北京宣布共建联合实验室,大力推进北京云计算平台的建设和发展

2009年10月13日,北京市计算中心与Platform在北京宣布共建联合实验室,大力推进北京云计算平台的建设和发展。北京云计算平台投资1000 多万元,建成了计算规模达20万亿次每秒的系统,主要定位于工业计算,支持北京市区域经济发展。

对于北京云计算平台的详细情况,很多网友都非常感兴趣。比特网(Chinabyte)"戈友会"栏目主持人–中国计算机用户协会副理事长蔡红戈女士就有幸邀请到北京计算中心主任曾宇博士,来和大家聊聊北京公共云计算平台。

北京云计算平台的特点与应用

蔡红戈:云计算数据中心与传统计算中心有什么不同?有什么业务特点?请您介绍一下北京市计算中心的规模和业务定位?

曾宇:云计算可能大家还不熟悉,云计算是沿着服务计算、网络计算这样发展而来的。可能大家对超级计算比较熟悉,我们着力打造云计算平台就是基于超级计算的平台,再加上一些云计算的服务形态,比如IaaS,SaaS,PaaS,赋予用户一种新兴的商业形态和技术形态。

北京市计算中心是1973年成立的,是我们国家最高的,以计算服务为宗旨的计算中心,做了大量的计算、仿真工作。

从2000年开始,因为个人PC技术的兴起,我们慢慢的转入到别的战线领域。从去年开始,我们继续把服务宗旨、服务的目标聚焦在以工业计算为主体的云计算服务模式,并开始筹建北京市工业云计算中心,去年我们构建的是20万亿次平台,今年已经开始打造百万亿次平台,预期在今年10月份完成平台构建。他将是中国最大的以工业计算为主体的云计算服务平台。

同时,我们计划从明年开始打造一个500万亿次的大规模工业云计算平台,希望是能够服务于目前北京区域经济的发展。以云计算推动工业计算的发展,可能是一种可行的、有效的途径。我们也希望在未来的几年里面,在这样一条路上面去做一个有意的探索。

蔡红戈:北京市计算中心云计算应用于工业企业,创新产品的仿真模拟计算。您能不能给大家介绍一下,目前都有哪些企业在应用我们的云计算平台?

曾宇:目前我们主要提供两种服务,一种是SaaS服务,就是以SaaS的形态提供工业设计能力。目前我们常用的一些工业设计软件动不动就是上千万,甚至有些多核的版本可能还禁止在中国销售。我们除了要花大量的经费去购买软件和硬件平台,同时还要面临买断制作软件,还不能满足大规模设计和开发这样的需求。解决了经费的问题,构建了软件和硬件的平台,还面临设计人员缺失的问题。

我们国家的工业设计能力,目前来说还是有一定不足,其中最主要的就是在工业设计领域技术设计和人才团队的缺失。

假如我们现在整合资源,集中优势去针对工业设计的特点,购买设备平台、软件平台。同时,整合专家团队就有可能解决目前大量工业企业创新问题,提升工业设计能力。通过前期的试运行,我们感觉非常有效。

我们希望今年能服务一百家工业企业,到现在为止已经扶服了28家。在北京的工业设计的需求非常旺盛、潜力非常大,我们有信心能够在今年形成一百家规模的工业计算服务。明年希望能够形成五百家左右的工业计算服务,最终我们希望能够在未来的三年,能够形成大概一千家工业用户服务的规模和能力。

云计算数据中心的特别之处

蔡红戈:能提供这么大规模的计算能力的数据中心,他的面积有多大呢?

曾宇:我们目前机房的面积是300平米左右。采用混合异构结构,包括通用处理器、CPU加速。在二期我们还会采用其包括像龙芯处理器等其它设备。因为采用混合异构结构,所以每U的计算密度特别高,基本可以聚合百万亿次计算能力。

蔡红戈:实际百亿次的计算需要一个更大的数据中心基础设施。

曾宇:对,我们最正在规划明年的五百亿次扩容。在场地选择上,目前我们正在规划在亦庄、密云建立大规模的工业设计的服务平台。明年可能会考虑将目前的机房搬走,换一个更大面积的机房。

蔡红戈:计算型数据中心或云计算数据中心,与传统、常规的数据中心有什么不同吗?

曾宇:我认为云计算有几种服务形态。我们说计算机提供三种能力:计算能力、I/O能力和网络能力。我个人认为云计算,无论是一种技术或商业模式,它最终提供也是两种服务。一种叫做计算服务,包括今天我们所倡导的工业计算和传统的高性能计算,包括SaaS、PaaS提供的计算服务能力。

还有一种比较常规的,大家谈论比较多的数据服务。国外的一些云计算厂商,像亚马逊,和国内的一些厂商,像上海电信,提供的就是这种数据的服务。

从这两个方面来说,云计算能力更像传统超算,我们说是超算在云计算中,包括工程计算和工业计算。第二种服务形态–数据服务,其实就是我们以前所说的商业计算的细分,包括数据的存储、融灾和备份。

从这两种服务的形态来看,他们有一些不同的地方。假如我们最终构建的是HPC云或者是工程计算云,那么强调的是计算能力。

我们目前构建的"工业云"强调有一定计算规模。不追求世界上最快的机器,我们强调能够帮助大规模工业应用对计算能力的需求。通过对北京区域结构的研究百万亿次就能够满足前期的需求。

同时,我们发现工业计算有前端处理和后端处理,对网络、 I/O也有一定的要求。目前所构建的北京云工业计算中心,还是比较偏以计算能力和I/O能力为主。

构建一个以促进服务为宗旨的云计算中心,可能更多是偏向于存储,他需要大规模的存储,可能需要非常多的这样的存储资源,对存储进行统一的管理、监控。而对我们的以计算服务为载体的这样一种云计算,可能他更多强调的是不同的应用之间,我们怎么样去进行调度,怎么样去进行数据的安全的这种隔离,怎么样去保障我们资源有效的统一的部署,他是从这个角度来说。

国内云计算发展趋势

蔡红戈:云计算中心为不同企业在数据计算或存储方面提供服务,那么对数据或业务的保密性和安全性要求应该是非常高的。

国内目前建成或在建的有很多家云计算中心,比如,广州政府的云计算中心、成都新建成的商业云计算中心,而且是企业投资、运营、管理,政府购买服务的形式。另外,还有IBM在无锡建立的大中华区云计算中心,还有曙光在西北地区建的云计算中心。您对这方面情况应该比较了解,国内到底有多少家云计算中心?

曾宇:今年三、四月份北京市开始规划是否要构建一个大规模的云计算中心,定位于政务、商业,还是工业一直在讨论,现在仍在进行中,具体细节可能在几个月后政府会公布一些相关计划。

从云计算目前的产业规模来看,目前云计算产业基本属于发展的成长阶段。大家已经看到的云计算带来了资源整合、效率提升,成本降低和创新优势。但对云计算服务的有效性、可靠性和安全性还存在一定疑虑。我们预期大约五年后云计算才会真正进入成熟期。实际上云计算为我们提供了三种最常见的服务形态SaaS、PaaS、IaaS,之前看到的数据显示SaaS在去年为中国整个市场供献了300多亿人民币的产值,其中以网游和中小企业信息化软件服务为主。我相信整个云计算今年实现百分之二十几的增涨是完全可能。

在新加坡、欧盟、美国,无论是从政府层面,还是企业层面,都有一系列的云计算计划出台。云计算发展的前身是超值计算,超值计算的前身是服务计算,再往前推可能就是计算服务中心–这种基于小机提供的简单单机计算服务。所以说云计算应理解为一种商业模式的创新,云计算是基于虚拟化技术存储、网络等资源的整合,最终实现资源按需所得。

云计算目前在国内方兴未艾。基本上分为两大类:"企业云"和"公有云"。"企业云"是企业建设的云计算平台,国内有很多企业正在构建自己的私有云,这块我不加以评论。因为不同的企业构建云计算都有他自己的考虑,比如提升信息化能力,进行信息化资源整合。我想重点评论的是"公有云"平台,也就是由政府或企、事业单位打造的公用云计算平台。客观说这些"公有云"平台还存在着一些不足之处。

首先,我们刚才谈到云计算是一种商业模式,它的服务对象是谁?这种商业模式产生利润、效益的途径是什么?有一些区域构建的云计算中心服务对象并不是非常明确,又像是超算中心,又像数据中心。

其次,盈利模式不清晰。是完全由政府承担费用,还是成立一个事业单位核算?有些自己还没有想明白就开张了。甚至有些区域原来建设的超算中心,现在也准备改名叫云计算中心。

目前在美国云计算基本上是作为一种商业模式来推动,而不是说作为一种技术创新,或者说还没作为一种影响到国家整体战略规划的技术去进行突破。虚拟化技术、网络技术和其它的一些硬件技术早就存在了,而我们是通过云计算这样一种商业形态把这些技术做了有机的整合,应该强调的是服务,而不是技术。

我们所说的SaaS、PaaS、IaaS重点在于服务,而并不是技术本身,所以我们认为目前的区域云计算中心有必要在定义上更加明确。比如,北京地区强调是工业计算,有些省份农业比较发达,可以成立面向农业的云计算中心,还有一些省份旅游比较发达。我认为可根据不同区域的经济结构,去定位区域云计算中心的主要服务模式、商业模式和服务对象

蔡红戈:国内现有的公用云计算中心,或者规划中的公用云计算中心比较多,但是他们的定位不是很清晰,并不是针对某一个行业的需求。

除此以外我想了解一下,根据您的经验什么样的企业适合建立私有云计算中心呢?很多企业都是有自己多计算中心,或者数据中心,是不是增加一些设备和软件就有可能改造成为私有云计算中心呢?

曾宇:我也一直在思考一个问题:我们讲工业和信息化融合,到底怎么融合?信息化可以提升工业企业的管理效率,这是融合,我们也看到很多企业这么做了。但从另一方面讲,工业化和信息化在技术创新的角度上怎么融合?我感觉大家关注的不够,其实信息化它是可以去促进工业创新能力的提升。

在谈工业化和信息化融合时我们首先看一个问题,我国的工业创新到底是由谁在推动?我个人认为这个咱们国家的工业创新能力应该由工业大企业、工业龙头企业推动。这些企业如果不能承载这一重任,整个国家的工业创新能力,我觉得是不可能得到一个有效的提升的。毫无疑问假如各个领域的龙头企业能够整合自己的力量,大规模投入建设一些计平台,我觉得将是一件非常好的事情。

但恰恰我们可能会发现,一些大型企业、龙头企业这一方面是缺失的,并没有去投入力量去做大规模的设计平台构建,研发力量的投入。这可能就会导致企业本身创新能力并不是非常强,而其它中型企业更没有实力去构建这样一个平台。

我想假如能够通过政府、企事业单位或者像我们这样的单位,去采购满足中小型工业或者大型工业专业设备,再配备以专业团队,就可能有效拉动工业化创新水平。我们通过前期的努力也的确提升了一些企业的创新能力。我们再看美国,在八十年代由美国国家超算提出了一个私营企业计划,这个计划是自然基金会支持,采购大规模的计算机设备,并配备专家团队去满足美国的世界TOP 500的工业企业的创新能力需求。

那么在我们这样一个年代,在以企业创新为主题的模式里,如果辅助公共计算手段来提升工业设计能力,我觉得是可行的。

蔡红戈:刚才您提到在三年内要建成计算能力达到500万亿次的云计算中心,这个中心的服务范围还只限于北京吗?另外,按这个发展规模来看,我们国家的工业云计算平台需求量应该不止一两个吧。

曾宇:目前我们想先解决北京区域需求,再慢慢覆盖到别的省,乃至全国。

其实工业计算它是很大的范畴,我们也希望能够从工业计算里面几个领域开始,逐步拓宽工业计算服务对象。我们刚才提到服务一千家工业企业用户,其实还远远不够,我国的工业企业实在太多了。我们希望先通过这一千家用户的尝试,归纳去总结出一套行之有效的方法,能不能再推广到别的领域云计算中心或者超算中心,让它有效服务不同区域、行业的发展。

蔡红戈:目前,北京市云计算中心还只是服务于北京市的工业企业是吧,可能随着云计算商业模式的认识越来越清晰,会有一些企业级云计算中心来对不同行业提供服务。

曾宇:我有一个个人观点想跟大家分享一下,刚才提到云计算还处于成长阶段,要进入到成熟阶段,需要进行大规模应用。

我们要发展云计算这样一种商业形态,有几个问题。第一、云计算需要大量的硬件设备,成本十分昂贵的,一般的企业做这样的投入可能会有所考量。企业讲求投资回报率或投资周期,而服务器生命周期是五年,而云计算发展到成熟阶段大约也需要五年,企业是否愿意投这么多钱去供应云计算平台?这是制约云计算发展的第一个因素。

第二、安全可靠性。我们说云计算是一种商业服务形态,无论是面向计算,还是面向数据存储,都存在着保密性,可靠性的问题。到底什么样的企业能够具备高可信度和安全度?这应从两方面考虑,在云计算的发展阶段可能政府及政府下属的事业单位是云计算发展的主流。经过发展可能就春会有大型互联网企业、电信企业加入,最后将扩展到大、中型企业也能够提供这方面的服务。目前看来以政府为主导成立的云计算中心应该是主流模式。

云计算中心的运维与管理

蔡红戈:结合您对北京市计算中心的管理经验,介绍一下云计算中心在运维管理上有什么特别的要求吗?

曾宇:其实目前在我们这几个月的试运行中,对云计算机房的管理其实我们强调的是几点:

第一、安全性,包括物理安全、系统安全和数据安全。那么我们采取了很多手段,用计算机身份认证和文件系统加密等各种管理手段来保证数据在北京计算中心的存放安全。安全方面的工作我们还做了很多,包括技术和管理方面的探索。

第二、资源获取的警觉性,云计算作为一种全新的服务形态,对于企业和个人用户还有认识的过程,这要求我们在提供用户服务时更要强调资源获取的警觉性。我们开发了很多工具可以方便工业企业用户通过非常有效的手段进行前端处理和后端处理,包括数据的获取等。

第三、北京市计算中心主要面向工业服务,并把云计算作为工业服务中的重要一个环节。不同的工业企业对计算服务的需求是不一样的,为了提供好以云计算为手段的专业服务,北京市计算中心做了大量调研,并根据用户的需求提供北京云计算平台资源、软件资源和专家团队资源,希望在工业计算领域,不只是提供简单的机房设备管理,而是提供对业务流的专业管理。

我们可能会采取匹兹堡中心的服务模式:专家团队、公共计算平台和销售中心。从流程上规范如何挖掘用户需求,如何整合硬件和软件资源,同时配合专家团队,以及为一些细分的工业领域所购买的设备,完成对用户服务的过程。这也是工业计算与传统计算管理不一样的地方,其中涉及到流程管理、客户关系管理和技术管理。

蔡红戈:能透露一下目前云计算中心专家团队的规模吗?

曾宇:我们是从去年开始打造我们的专家团队,目前有30几位专家,但这远远不够,我们最终希望能打造150人左右这样的专家团队。

如果说不能建设这样规模的一个团队,云计算想服务某个领域是不太可行的。