CIO该如何部署数据中心的“云”

随着数据中心必须不断满足企业日益增长的计算需求,数据中心本身的建设也日渐变得更加复杂、设施也日趋昂贵。

上周,作者参加了一次特别的关于云计算的研讨会。Datacenter Dynamics研讨会集中讨论了关于的数据中心设施、计算基础设施、以及运行的业务团队等方面的问题,并谈到了关于“作为新的云服务提供商的IT技术”的议题,觉得整个会议使我深受启发。

在大多数云计算会议上,能接触到的最多的硬件服务商便是服务器供应商;但这次会议上却很少有服务器的公司的代表出席,取而代之的是大量的不间断电源(UPS)公司代表、电缆制造商、空调安装服务商,甚至建筑公司。

其实,与会者们脑海里都有非常具体的话题希望进行探讨。例如,在我的发言之前的演讲《关于扩大温度和湿度的限制问题的重申》,这一议题绝对相当热门。我从来没有在云计算会议上听到过关于数据中心温度的话题。与大多数会议不同,在本次研讨会上,云计算的议题即不算前沿,也不算核心。而且,除了我的发言之外,只有两位发言人的发言稿的标题中涉及到了“云”的概念,一位是Zynga的首席技术官AllanLeinwand;另一位是埃森哲(Accenture)的代表讨论该公司的IT经理的调查。

然而,尽管很少有专门的讨论,但云计算就像幽灵一样贯穿所有的讨论场合。

Leinwand的演讲相当吸引人,尤其是当他概述了他所在的公司如何开发了《FarmVille》农场游戏以及其他网络游戏的时候,他的公司已经使用亚马逊网络服务建立了一个内部云。Zynga公司在公共云环境下推出的游戏,然后将真正有把握的游戏项目调回公司的私有云。正如你所想象的,Zynga公司的游戏的增长绝对可谓是爆炸性的,因此,可以说迅速提供基础设施的能力是至关重要的。Leinwand介绍了Zynga公司如何在不到24小时的时间内,将一千台服务器上的资源转移到了其云计算。

埃森哲的SeanPeterson先生提出的观点是我从来没有考虑过的:他的讨论涉及到了成本分配的问题。他观察成本分配,特别是扣款,是一个企业的云计算环境的重要组成部分,以确保其适当使用计算资源。没有扣款就没有反馈机制,以引导用户行为。

他的建议是,扣款之前,应先通过一段时期的“showback”,在这其中没有任何企图进行成本分配、资源使用,提供给用户企业。用户企业通常并不知道他们的应用程序使用了多少计算资源,并立即切换到扣款可能造成实际成本转嫁风险。而如果从showback开始,就为使用前评估提供了机会,可以避免一些非常激烈的讨论。我们始终建议我们的客户采用扣款机制,因为我们觉得价格信号对于企业来说是最有效的资源配给机制,但展望未来,我们将在一段时期内推荐showback,以缓解过渡。

几乎所有的研讨会都或多或少的要涉及到关于能源效率的问题。在我的发言中,我介绍了领先的互联网和云服务公司,如Facebook、亚马逊、谷歌、微软和雅虎都在积极推动数据中心的效率。在另一篇演示文稿上,我谈到如何建立一个高效的数据中心,而无需建立一个“鸡笼”。鸡笼指的是雅虎建造的位于布法罗的形状类似于一个鸡笼的数据中心狭长的建筑物,引用外部空气进行数据中心的自然冷却。雅虎的这个数据中心电源使用率(PUE)达到1.08。雅虎还使用了一个中央网络操作中心(NOC)来管理这五幢鸡笼建筑物。换句话说,他们通过基础设施环境的大量重复使用,提高了整个数据中心的劳动生产率和电源使用率。

午餐时,我正好坐在一位来自Mortenson大型建筑公司的代表的旁边,该公司主要负责数据中心工程建设项目。他与我分享了一些他们公司关于提供这种日渐复杂的建筑类型时的实际做法。他们的公司采用的是虚拟设计和建筑软件,创建一个三维设计数据中心,可以在施工前模拟各种设计冲突(例如,通过管道进行布线)。

显然,把那些机架放置在未使用的办公空间的日子已经一去不复返了。尽管被贴上“鸡舍”的标签,但实际上,今天的数据中心的设计环境相当复杂,标准非常的高。这同时也为许多企业带来了一个问题:资本投资。建造如此复杂性和高效率的数据中心所需要的资金远远超出一般企业所能负担得起的。根据Mortenson公司的调查,他的公司目前只承建大型数据中心,5000到25000平方英尺的项目已完全没有市场了,他告诉我。

最后一天的议题主要是关于互联网公司和云服务公司如何降低数据中心的成本。雅虎、Facebook和谷歌的现任或前任数据中心大师们分享了他们运行他们公司计算环境的经验。一位小组成员介绍了他的公司坚持每三年更换一次服务器。虽然这种做法导致了一定的额外资本投资,但他指出,三年代表两代“摩尔定律”,即在三年后的时间里您的服务器所提供的计算效率只有新机器的25%,这也就意味着75%能源浪费。

另一位小组成员讨论了较高温度下使用数据中心环境的问题。虽然ASHRAE标准建议考虑将数据中心的温度适当调高几度,但这位与会发言者则建议考虑一个更高温度环境:高达104华氏度!而当提到可能遇到OSHA标准的质疑时,他说,一旦安装了一组服务器,其实这些服务器与人接触的时间是很少的,直到这些服务器真正退役。而且任何接触都可能被限制在10分钟或更少的时间内。事实上,他说,如果一家企业的工作人员需要频繁的与硬件打交道,很多时候只能说明他们很可能某些地方做错了。

这次会议带给我的启发是,IT已经日渐成为一个专家领域。从数据中心的运营到基础设施的支持乃至应用程序的开发和交付,该领域的每一个方面,都已经不再被中等或者良好等得过且过的标准应付。由于预算有限,IT企业必须弄清楚大型投资和最佳实践方案的专门产品供应商的商业可用性,以及供应商们可以提供的独特的差异化服务。正确的策略是找出IT技术在具体领域的价值,同时在其他方面充分利用外部IT资源。