探秘英特尔上海数据中心:云计算的践行者

位于紫竹科学园区英特尔SHZ1楼的英特尔上海数据中心,一直是一块神秘的“飞地”。即使是在英特尔中国公司工作了多年的员工,也很难有机会进到内部一探究竟,更不用说媒体记者了。所以该数据中心自2005年建成以来,对外界而言一向是披着神秘的面纱。

前不久,DOSERV记者有幸进入数据中心机房一睹真容,并和当初参与建设的英特尔IT工程结算团队信息技术经理、云计算和数据中心专家周翔先生有了一番深入的交流,对英特尔在新一代数据中心上的技术创新以及云计算的实践,有了全新的认识。

多项创新:数据中心的实际标准

英特尔上海数据中心面积为3650平方英尺,里面部署了330台服务器。从规模上看,英特尔上海数据中心属于中型数据中心,在英特尔全球91个数据中心中定位为区域数据中心。然而,由于其在数据中心新技术和设计方面的探索,使得上海数据中心当初的多项创新,已经成为当前许多数据中心事实上的标准。

英特尔IT工程结算团队信息技术经理、云计算和数据中心专家周翔

记者通过身份验证进入数据中心机房后,第一感觉是屋子有点暗。周翔解释说,由于机房目前采用无人值守,因此机房只开一小部分灯,以节约能源。

第二感觉是机房里面不像有些机房那样特别冷。一般机房温度在摄氏18度左右,突然进入的话会有进入“冰箱”的感觉。周翔告诉记者,原来数据中心也将温度定在摄氏18度,后来经过测算,发现摄氏22度也不影响数据中心的正常工作,因而现在就将温度调整为摄氏22度。此外,数据中心在冬天更是关掉了制冷设备,直接抽取户外的冷空气用于数据中心的降温。

数据中心内部

如果说上述方法只是一些节能的小技巧的话,英特尔数据中心冷区和热区的分开,以及网线的排线方法,则是从设计上将节能进行到底。记者看到,英特尔上海数据中心机房内部隔成了3排小房间,形成3个大的风道。冷风从镂空的地板下面上来,服务器的风扇则吸入冷空气,输送到服务器内部,然后从另一边出去。因而记者进入小房间,明显感觉要比外边热。当然,假如有些服务器撤架了,工程师就会用挡板封起,以避免冷区和热区混合在一起。

?网络排线方面,英特尔的技术工程师发现,传统的排线方式往往将服务器的风道挡住了,因而上海数据中心采用集束排线的方式,有效地避免了服务器风道被挡。

正是由于采用了上述措施,英特尔上海数据中心的耗电量为每月90K千瓦,大大低于同类数据中心的水平。上海数据中心的这些创新,日后亦被应用到俄勒冈数据中心和马来西亚数据中心的建设中。周翔先生也因为在数据中心创新方面的努力和成绩,成为了2010—2011英特尔IT部门业绩报告上的封面人物。

数据中心战略:平衡法则下的三部曲

英特尔上海数据中心只是英特尔全球91个数据中心之一,英特尔位于不同地域的数据中心承担着不同的任务,扮演着不同的角色。

周翔告诉记者,英特尔的数据中心可用“D、O、M、E、F、D”5个字母缩写来表示其承担的不同功能,其中D指设计,主要用于设计计算;O指办公,运行一些通用的应用;M指制造,主要用于晶圆/封装测试;E指企业应用,包括电子商务、供应链等,F则指承担的对外服务。“目前英特尔数据中心70%的服务器用于‘D’,由此可见设计对于英特尔公司的重要性。”周翔说。

事实上,从上世纪90年代到现在,英特尔数据中心经历了十几年的发展,期间出现了高速增长、重新定位、垂直整合等不同阶段的发展思路。针对不同数据中心的定位和发展,目前英特尔有数据中心规划部门专门来做规划和管理,一方面是统筹资源,另一方面是鼓励各地的数据中心自我创新。

英特尔数据中心发展历程

英特尔最新的服务器也是以4年左右为一个周期,不断将新品应用于数据中心的实践,包括固态存储和万兆以太网等新技术和新产品。同时为了减少人工值守的工作量,英特尔在马来西亚和以色列建立了全球监控中心, 7*24小时全程监控各地数据中心的运行情况。一旦某地数据中心出现服务器宕机后,先是由监控中心进行远程重启,一般这样能解决70%左右的问题,其余远程解决不了的问题,就通知数据中心当地的工程师来处理。

“有了这套新的值班和管理机制,上海中心的工程师轻松多了。我最近也是3个月没进去了。原来是三天两头往里跑。”周翔自豪地说。

谈到新一代数据中心的发展,周翔认为,一定要在平衡法则下实现三个战略。所谓平衡法则,就是做到改良计算负荷与减少资源消耗、管理和计划需求与尽量减少资本投资、墨守成规与注意行业发展提高竞争力之间做到平衡。

三大战略首先是优化数据中心,包括在存储和广域网方面注重数据生命周期管理,优化采购策略,采用前瞻的技术和解决方案,并有效地利用带宽;服务器方面采用主动更新策略、虚拟化技术和远程分布式计算,同时清晰地定义好应用目标。而在基础设施方面,周翔建议要制定长期规划,并且数据中心规划和应用要相匹配,同时提高数据中心利用率,包括用电、面积、制冷以及承重,还要优化数据中心的温度。

战略之二就是提高数据中心使用率。周翔谈到,英特尔数据中心就是通过业务优化和采用新技术,尽量减少资产投入,尽量利用已有的基础设施。包括面积、承重、用电以及制冷在内,都是数据中心使用率的必不可分的组成部分。

战略之三就是增长和区域策略。英特尔在建设数据中心时,其增长策略是模块化和可扩展,以便数据中心需要扩大时很方便地就能实现。而对于区域数据中心,英特尔的策略是合并数据中心但同时兼顾本地需求。在垂直整合数据中心大趋势下,英特尔继续保留了大连和成都工厂的数据中心,就是为了兼顾本地设计和生产的效率。

云计算之旅:自内向外推动发展

去年英特尔发布了2015年云愿景,并指出新一代数据中心将在云计算的落地中扮演重要角色。那么上海数据中心又在英特尔的云战略中扮演什么样的角色呢?

周翔告诉记者,英特尔数据中心正全力支持英特尔的云愿景,目前50%左右的资源都在支持开发或者生产云。上海数据中心目前不是跟随者,而是走在了英特尔公司内部的前列,成为了英特尔云计算创新的源泉,当前有2个云计算项目由中国团队来开发。

英特尔IT部门的云路线

在云计算业务驱动因素下,英特尔IT部门正在全力践行企业私有云架构,其目标是“灵活、高效、数据安全和可用”,内容包括了借助按需自助服务,将部署时间从几天缩短到几小时;通过资源池和整合,提高利用率;计量服务,支持虚拟机利用、健康状态及IT 能力管理;利用一致的灾难恢复架构,支持关键应用等等。

得益于前几年设计网格计算的经验,比如硬件抽象化、地点抽象化、服务管理、提高服务部署速度等实践,英特尔IT部门在内部云实践方面进展顺利。以中国团队开发的按需自助式服务站点为例,它具备计算资源自动化部署功能,业务端从自助申请到开通,3个小时就能解决。英特尔IT部门的目标是在2011年将这个时间缩短到1小时之内。而目前已经运行的平台验证云则更加快捷,设计工程师从申请资源到开通,只需要3至5分钟。“生产环境会谨慎些,因为还要考虑容灾等因素。而平台验证更多是做实验,所以必须更快地响应。”周翔解释说。

正是秉持基础设施即服务(IaaS)的理念且成效显著,英特尔IT部门在办公和企业应用领域复制了同样的做法。虚拟化作为IaaS的重要一环,2010年初英特尔实现了12%的环境虚拟化,截止到2010年末,虚拟化程度提高了3.5倍多,达到42%。在未来的几年内,英特尔将实现75%的环境虚拟化。由于数据中心利用率的提升,英特尔IT部门给公司带来了约2亿美元的商业价值。而通过服务器更新和数据中心整合等一些项目,英特尔IT部门期待到2014年能创造6.5亿美元的业务价值。