2014年10月28日,由中国工程院、美国国家工程院、EMC公司、VMware公司、浪潮集团及联想集团共同举办的以云计算和大数据为主题的IT行业学术研讨会——IT 2020高端论坛在京举行,此次论坛聚焦未来数年内影响中国乃至全球行业和经济发展的大数据、云计算和新兴IT趋势,来自中国、美国及全球各地的学术界和产业界的领导者及专家学者参与了此次盛会。
会上,浪潮集团高级副总裁王恩东先生为大家带来题为《融合架构云数据中心》的主题演讲,以下是演讲实录:
王恩东:尊敬各位领导,各位来宾,女士们,先生们,大家上午好!非常高兴有机会在中国工程院跟大家交流,我今天演讲的题目是“融合架构的云数据中心”。
三个方面,首先看一下云数据中心的发展需求和一些挑战,由于云计算和大数据兴起,整个对计算、存储、网络这种需求增长非常快,同样数据中心的发展也非常快。PPT给大家列出了IDC做出的一个统计,全球整个IDC增长当中,中国保持最快的增长。同样看一下在数据中心里面核心的设备之一服务器,服务器增长同样也是中国最快。这个统计数据是今年上半年的一个数据,从这个数据可以看出,全球的增长整体上是比较缓慢的,美国是负增长,亚太整体增长是10%左右,中国接近20%的增长,可以说是整个服务器市场增长的主要着力点。
从这个角度来看,IDC数据中心,无论整体数据中心建设还是这里面核心设备,中国的这种增长速度是非常快的。数据中心的增长快的主要因素,可能来自于两个方面,一个是中国互联网这种需求,第二个是中国传统行业的需求。中国互联网发展速度之快。刚才王坚先生已经介绍了阿里巴巴的情况,除了阿里巴巴之外,像腾讯、百度增长同样也是非常快。目前中国智能手机数量,中国上网的用户数量等等这些数据都是全球第一的,在这样一个数据后面显然需要更多的信息服务来支撑。
在传统行业同样发展需求也是非常快的,像金融,中国银行卡的数量,已经占全球40%,超过了VISA,电信数量超过10亿,电表数量美国3倍,传统行业发展需求也是很快,以后全球最大用户来自美国等发达国家,现在全球最大用户可能更多的是在中国。这样一个巨大的用户规模情况下,我们再来看我们的消费能力。
刚才在Pat先生报告当中,他讲中国的购买能力已经是超过美国,但是我想可能更多的是买一些看得见东西,看不见的东西,信息消费、旅游等等这些方面,我们可能与发达国家相比,还有很大的差距。在信息消费方面,中国与美国、日本相比,可能还不及它的1/10,一方面这里面看出差距很大,同时也展示出中国在这一方面发展的空间也是非常大的。
要支撑更大的信息消费发展,显然后台的这种大规模的数据中心是非常必要的。除了大的需求之外,在技术上的这种变化,也是同样促进了这种数据中心建设的一种发展,尤其像云计算、物联网、大数据、移动互联网等等这些,根据有一个统计,就是在2020年,单一数据中心的规模,可能就会超过50万台的这种计算机。
另外,各种数据中心越来越规模化、基准化,可能会到2020年的时候,超过五千台,一个数据中心超过五千个计算节点的数据中心,服务器保有量可能会超过整个服务器市场保有量的70%。从这个角度来看的话,应当说这样一种趋势,也跟数据中心的一种发展,数据中心核心设备、核心技术产品发展,带来了很多挑战。这种挑战的话,可能第一个首先是效率挑战。各种计算、存储网络设备的效率,应当说一直是在IT产业研究的核心。
我们现在通过这种虚拟化技术,VMware虚拟化技术做得很好,通过虚拟化技术一定程度上提高了设备利用效率,这种提高还是有限的,在一个设备之内,虚拟成几个设备,这个设备之内进行虚拟、迁移,效率还是比较高。通过这样手段,把服务器或者存储使用效率由原来10%提升到60%,几台服务器之间,或者几台存储之间,进行虚拟机迁移,效率大幅度下降。一个虚拟机迁移,由设备之内迁移秒级,一旦跨设备到了分钟级,因此这种虚拟化的技术,跨设备的时候,效率表现得还不是非常好。
同样还看到另外一种效率可能需要我们关注的。就是我们现在计算设备、存储设备、网络设备,实际上每一个设备都是一台计算机,里面都有计算、存储、网络,这些设备之间资源是不共享的。在不同的阶段,在不同的任务之间,实际上它的资源利用率差距是很大的。显然如果能够打破他们之间的界限,能够使不同设备之间的计算资源、网络资源、存储资源能够共享。能够进行均衡的这种利用,那么这方面效率的提升空间,同样是非常巨大的。
跟效率相关,另外一个就是能耗问题。现在这种能耗问题已经成为IT产业发展非常大的一个问题,尤其随着半导体工艺越来越接近摩尔定律的极限,能耗的问题挑战性越来越大。现在一个十万台服务器数据中心,一年耗电量大概4亿人民币左右,要买十万台服务器的话,大概需要12、13亿到15亿,一年的电费大概需要4亿,也就是三五年电费,基本上可以把设备重新买一遍,4个亿电费基本上可以消耗掉一个中型规模的水力发电厂的这样一个能量。
我们现在通过各种技术,在降低这种IT设备的耗电量,尤其在PUE方面追求,使更多电能消耗在IT设备,不是消耗在制冷等这些设备,现在PUE设备大部分2.0以上,二点几、三点几都有,这几年很多降到2.0以下,有些互联网数据中心能够做到1.1、1.2。关注PUE同时,关注另外能耗问题,大量计算任务通过通用设备或者通过通用CPU完成,让一个人能够做所有的事情,即使把所有的饭都给一个人吃了,做事情效率不一定高,没有用专业的人做专业的事情。图象处理,一个CPU卡,能耗都是通用CPU1/4、1/3,通过技术优化,专用CPU计算设备研制、研发应该是一种趋势。
大规模数据中心或者云计算挑战就是安全问题,行业CIO关心问题,以前没有上云计算,出了问题是局部问题,现在上了云,相当于所有鸡蛋放到一个篮子再出问题不是一次性问题,甚至全面的或者影响力巨大的问题。举一个例子,前些年香港艳照门跟好莱坞艳照门显然不一样,香港艳照门只是围观,其他艺人都是围观状态。今天好莱坞艳照门出现的时候,好莱坞所有艺人,甚至所有用苹果手机的人,心里面在想,我的隐私是否泄漏了,因为已经用云计算,使用环境发生了变化。这只是公有云方面问题。在一些政府或者行业里面数据更有私密性、安全要求更高,这方面挑战问题更大。
围绕着以上的这种发展需求和这种挑战,以浪潮为例,下面介绍一下中国企业在这方面做了大量探索和尝试,云计算和大数据方面做了很好推动工作。作为浪潮来讲,首先来看对于云计算和大数据发展的一个观点,我们讲云计算,可能目前体会最多的是这种公有云,用手机搜索之类,除了公有云,另外云计算巨大需求叫做行业云,在美国的定义,分了三类,除了公有云和私有云之外,其他都叫混合云。我们认为尤其在中国云计算发展里面,行业云是巨大需求。定义为每个行业或者每个区域组织建立和维护云计算,以有偿或者无偿方式提供服务,私秘垄断性具有私有云特点,垄断性具有公有云特点,很多行业有这样一种需求,目前国内绝大多数企业提供云计算服务,基本按照行业云模式来做。今天下午三个报告,都是讲行业方面的需求。围绕这种需求,提供了产品和服务,围绕用户云计算中心建设,应用开发,提供云平台,同时保障云计算的基本安全。
简单介绍一下我们做的一些工作,基础的数据中心,关键应用主机,满足行业需求,目前全球只有几家公司做这样产品,具有非常可靠性、可用性,主要行业里银行、通讯得到大量应用。公有云计算和存储设备,我们与中国百度、阿里有很好合作,围绕他们的需求,设计开发整机柜计算存储系统,模块化、集中化,具有非常高的可用性、灵活性。百度阳泉数据中心是十万台,通过这样设施,一天部署4500个计算节点,原来部署三百到二百个不错了,用这样一种方式,一天部署4500个,能够非常好满足互联网客户爆发式的业务增长。比如像阿里,大量服务人员已经在阿里驻扎,为接下来双十一备战,又会有巨大的增长,满足云计算产品架构,市场占有率非常高,超过60%。同时我们也在为行业云客户来提供基本的数据中心的关联系统,包括虚拟化的技术,包括计算存储网络设备的整合技术,包括整体的统一管理的平台。
关于这一方面云的管理系统,可能公有云并不需要,Industry Cloud不需要,核心技术是竞争力,大量行业客户需要成熟的产品和方案,提供这样异构虚拟化平台,不仅支持浪潮自己,也支持主流虚拟化技术,包括VMware。同时给用户提供应用软件开发平台,既给用户提供,也合作伙伴提供,给亚马逊公众云地方不同在于,不仅给开发者提供应用软件开发平台,同时提供为用户整合后台数据的平台。因为以前很多用户它的数据、业务系统都是分离的,把它的数据进行整合是第一步要做的事情,没有数据整合,进行云计算和大数据开展不可能。IOP平台,整合用户各个平台数据,同时提供应用开发平台。这样就会非常好地让用户能够联系这种云计算和大数据技术,开展业务,进行业务创新。同时安全问题是我们所有用户,尤其是我们行业客户、政府客户最关心,安全问题,应当说不是纯粹某一个技术问题,所以在这方面,我们提供了这样一个完整的解决方案。这个方案包括云基础设施安全、云平台安全、应用安全和安全管理四个部分。
这样一个平台是机遇一种可信计算为基础、安全架构为支撑来构建,这样平台,我们讲云计算安全不安全,目前没有任何机构可以对庞大的云计算数据中心或者安全系统进行评测,以前评测一个机构,或者评测单一、操作系统、服务器、数据库是否安全,但评测巨大的系统是否安全,没有评测结果,这方面进行了非常好尝试,组织这种国内的,首先模拟用户的这种真实需求,搭建了这样一个云的应用环境,然后组织国内的这种安全方面,各个安全公司,我们一起来做了一个攻防演练,搭建了渗透实验的环境,通过渗透实验来验证这个东西是否安全、可控。通过这种七天模拟,这个系统一共是发现和阻止了,来自网络层、应用层和系统层八万多次攻击,每个层面上当然最外层发现最多,最底层发现最少,当然有些攻击已经渗透进来了。我想通过这样一些东西可以给用户提供一个相对比较可信的云计算的方案。
下面再讲一个案例,行业云建设必须要做的事情,第一步上云,首先把原来平台整合,把原来烟囱打破,在打破的基础之上进行数据整合,形成数据标准,能够标准之上进行数据挖掘、应用,然后进行创新。我们这里有一个案例给公安做的,类似于反恐方面应用,多点碰撞的应用。讲一下类似反恐方面应用。我们以前的时候,大街上看到比较可疑,没有办法验证这个人干什么。现在比较简单,通过警务前度比较综合的平台识别,通过照片进行数据库里比对,找到相似的人是谁,这些人都有什么样的社会关系。相似的人有几个,这几个人最近跟哪些人交往,进过什么网吧、酒店,是否有钱科,这样是否有比较快地锁定这个人,是否需要特别关注的,或者需要马上控制的。所以在这些方面,云计算和大数据,可以提高原来社会治理的效率,当然如果能够把这些数据进一步转换为服务,为老百姓提供服务的话,还可以提高社会服务的质量。
同时我们也看到,未来的数据中心,由于云计算和大数据发展,还面临很多的挑战。在这些方面,我们认为要解决这些问题,可能尤其在数据中心建设方面,需要融合架构来解决它。以前讲软件定义,仅仅有软件定义是不够的,还需要硬件方面的支持,因此融合架构叫做硬件重构和软件定义。为了大家便于理解这个问题,我这有一个视频,请大家看一下。
刚才通过一个视频看了一下,如何架构,未来什么样,支撑如何架构发展,我们认为同样还需要很多技术来支撑,我发现我讲的这些未来支撑如何架构的基础,似乎跟Pat讲的比较相似,这里有微观互联基础。通过硅光互联,变成可重组、灵活分配一种架构。可重构计算,3D工艺发展,半导体产业,可能会按照摩尔定律再发展一段时间,尤其像这样的一些技术的话,性能以及晶体管数量越来越多,这样我们在CPU之外,可能就会使通用、专用能够很好地结合起来。非易失存储技术发展,计算机内部存储结构发生变化,使存储的层次进一步扁平化,只有越扁平、越简单,才能使硬件重构越容易。第三个就是大容量内存,使内存容量由原来几十GB、几百GB到几十TB,这样把业务里面所有数据放进来,尤其关键业务数据可以放进来,通过内存计算可以大大提升计算的效率,第三个就是业务感知。除了硬件方面可重构之外,软件定义,硬件能够比较好感知这种业务需求,通过这种积极学习的方式,能够使这种架构按照业务进行重组,这些应当是真正提升计算效率。所以从我们来看,未来的这种融合架构的数据中心,在硬件方面可以重构,软件方面可以定义,通过这种软件定义使它更灵活,通过硬件重构,把原来虚拟化技术低效率,能够比较好地解决,融合架构的数据中心的话,会使业务更加敏捷、高效、智能,满足未来大数据应用的这样一种需求。
我的报告就这么多,谢谢大家!
关于IT 2020:
IT 2020高端论坛是由中国工程院、美国国家工程院、EMC公司、VMware公司、浪潮集团及联想集团共同举办的一场仅面向受邀人员的世界级的高端论坛。论坛聚焦未来数年内影响中国乃至全球行业和经济发展的大数据、云计算和新兴IT趋势。来自中国、美国及全球各地的学术界和产业界的领导者及专家学者都将参与此次盛会。
本届论坛将进一步探索云计算和大数据的架构、应用和对主要行业的影响。届时中国工程院和美国国家工程院的顶尖科学家、学术界的知名专家以及产业界著名的思想领袖将汇聚一堂,与您共同探讨宏观IT趋势的话题。聚焦云计算和大数据的基础架构,两者对中国IT策略、经济发展和城市可持续化发展的影响,以及大数据在中国可持续化发展进程中至关重要的三个行业中的应用:医疗、能源变革和综合交通。