在最近一次采访中,Platform Computing公司的CEO周松年回答了我们有关网格技术的各种疑问。
网格计算可以说是IT届最含糊的一个专业术语了,不同的企业对它有不同的称呼,比如效用计算(utility computing)、按需计算(on-demand)、自律计算(autonomic computing)等。虽然如此含糊,但是由于这是一个新鲜的技术,我想大家还是会对网格计算有很大的兴趣。
当讲解网格计算时,最常用到的一个例子就是SETI@home项目,它通过下载一个类似于屏保的小程序实现数千万台电脑分担计算任务的目的。不过该项目的组织者更喜欢将这种技术叫做“公众分布计算(Public distributed computing)”。
由于没有明确的规范和说明,网格计算虽然具有诸多优点,但是实际部署还并不理想。IBM最近公布了一个计划,针对医学和环境研究实施The World Community Grid项目,不过该项目的实施范围并不像计划中那么宏伟。
据专家表示,网格技术的发展会经历三次大的浪潮:第一次浪潮发起于学院以及研究所中;第二次浪潮也就是现在,由一些大型企业推动网格技术的进步;而最终的浪潮则是建立一个可以与目前的Web规模相比拟的网络,那时候才可以简单的被称为“网格”。
为了获得有关网格技术的更精确的信息,ZDNet UK采访了Platform Computing公司的CEO周松年博士。他的博士论文内容就是有关分布式资源管理的,这也是网格理念的基础。
问:关于到底什么是网格计算,现在有很多看似不同的讲法,那么您是怎么定义网格计算技术的,还是说根本没有一个明确的定义?
答:明确的理解网格技术是非常重要的,但是当我们试图对这个技术下定义时,总是太短视或者太偏于学院派了。在2002年,当时我和Ian Foster一同工作,他试图为网格技术进行定义,最终得到了三个我认为还合理的标准解释。
如果你让我用最简单的方式解释网格技术,那么我可以告诉你,网格计算是一个集成了多站点,支持应用、支持协作的分布式计算技术。
问:你认为网格的概念对于非专业人员来说,能不能很快接受呢?
答:不能,它起步时就比较混乱,到现在还是如此。
比如我们之前提到的 SETI@home项目就是网格计算的一个极端例子。因为网格计算的焦点主要集中在服务器电脑上,而不是桌面系统,另外网格计算多针对现有的程序,而不是针对新开发的程序。有些人问我:“网格的杀手级应用是什么?”,答案很简单,现有的大多数程序都有可能成为网格技术的杀手程序,只是我们还没有察觉到尔已。(killer app是计算机领域中的一个术语,它是一个应用程序,要使用这个程序就必须去购买这个程序运行的系统。)
问:网格标准还要多久才能制定完成呢?广泛应用的时候到来了么?
答:标准问题是比较主要的问题,但是并不是制约发展的唯一因素,因为你必须首先具有理解网格技术的基础知识才可以对标准进一步理解。当你具有了一定的经验和专业知识,才会对网格有一个更清晰的认识。我认为对于业界来说,现在谈及标准还为时过早,不过有关标准建立的竞赛已经开始了。
问:网格技术真的距离企业的IT技术人员来说只有一步之遥吗?难道服务供应商不应该多关注一下网格技术?
答:这个问题实际上是把网格技术和按需或效用计算搞混了。这三者是有联系的,但是网格计算是真正针对架构的。从我超过十二年的市场经验看,网格技术发展的关键是企业是否认可这种技术,以及企业是否会大面积采用这种技术。网格计算可以帮助企业更好的集成IT资源,比如硬件、软件、数据、网络等,以便使IT成为能够更好的为业务服务的高效工具。
大多数的企业级客户所面对的企业网格不仅仅是100个Linux系统的集群,还包括大量的应用,这也许分布在多个部门,多个团队甚至多个地区。
我们可以看看JP Morgan公司的情况(Platform Computing的客户之一),作为一个较早采用新技术的企业,他们希望建立一个基于工业标准技术的可共享的IT架构,最终他们成功的建立了一个虚拟大型机。这个企业从中获得了巨大的好处,比如资源的充分利用,其资源利用率从以往的20%飙升到80%。他们同时也从工业标准的服务器中获得了好处,不过要实现这样大规模的网格系统(数千台机器),你需要操作系统具有一个专门的软件管理层来管理资源。
问:不过有些较真的人会说,如果网格技术只局限于企业内部网络,那么它不能算是真正的网格,只能算是内部网格。您对此是怎么看的呢?
答:内部网格?呵呵,内部网格就不算网格了么?这实际上是一个和技术没什么关系的文字问题。网格实际上是一个大型的分布计算架构,它集成了多种标准资源,多个域环境,它们可能是位于同一地点,但更多情况是位于不同地点的,它支持多种应用用来实现资源共享,以及促进协作。
这一段关于网格计算的定义和我上面提到的例子并没有什么冲突,不论是Pfizer 还是 JP Morgan 或者 Texas Instruments,同样是使用了这样的计算技术。最开始,这些企业都是在企业内部进行实践,随着使用的深入,网格技术被证明是有效的,因此企业会逐渐将该架构推广到合作企业以及外部的数据中心。
这是一种进化。如果你认为“网格存在于企业之间,”这在不远的将来肯定会实现。如果你认为“网格是集群,”则有点太局限了,因为这只是通向真正的分布计算的第一步。
问:有些专家认为,当建立起一个真正的“网格”后,网格技术就走到发展的尽头了。这个真正的“网格”就是一个类似于现在的Web网络的全球化的数据处理网络。
答:这是一种比较主流的观点,并且也是很自然的发展趋势,我在1999年就提出过这个观点。你可以看一下现在的Web网络,它具有非常人性化的界面,其首要任务就是为人们提高一个访问信息和数据的渠道。但是在一段时间后,人们就会开始有更多的要求,比如希望增加数据的价值,提高网络的智能化以及容量。为此你需要增加更多的应用程序,这也就是网格架构上场的时候了。网格会成为所有应用程序的支持架构,而这些程序则是在整个互联网范围上活动的组件。
问:那么这种真正的“网格”距离我们还有多远呢?
答:如果你希望网格和现在的Web一样成熟,那么还需要等待至少十年。因为和Web相比较,网格架构的复杂性要高很多。网格关系到应用程序、商业逻辑的架构,企业的业务需要经过一段时间进行转换,才能适应网格架构。这对于计算技术来说,相当于从中世纪进化到了文艺复兴时期。在网格成熟的时期,我们不会再讨论CPU或者其它硬件的性能,甚至也不再讨论应用程序的功能和效率了,唯一要讨论的就是服务。
问:因此你赞成由像SUN这样的大企业推动效用计算概念,也就是将计算资源像电话网络那样联系起来?
答:是的,IT正在变得越来越复杂,企业在日后也不必自己建立所有的解决方案,这也是不现实的。
问:效用计算目前更多的还是纸上谈兵,为什么没有多少企业愿意采用呢?
答:一方面是由于客户并没有做好准备,更重要的原因是服务商还没有准备好。现在和未来几年的情况是,如果客户一直不采用这项技术,那么就没有机会接受来自供应商的服务。另一方面,服务商也无法为企业提供相应的服务,因为服务商甚至不知道客户的需求。他们甚至连企业所需的技术都不具备,因为服务商都将精力用来讨论什么是网格了。