20世纪90年代末和21世纪初,网格计算的概念–一种利用多台计算机处理大型计算任务的分布数计算技术–非常盛行,至少在那些与高性能计算需求的机构中是很流行的。其中,最著名的网格计算应用项目之一就是SETI@home,一项利用全球联网的计算机共同搜寻地外文明的科学实验计划。
尽管有网格计算做保证,有Sun、IBM和惠普等主要厂商的共同努力,但是网格计算却并没有获得主流企业的青睐,仍然主要被那些有数据密集型存储和计算需求且用户较少的地方政府和科研机构所使用。企业用户的想法更多是针对研发和数据密集型财务模拟,而不是网格计算支持者最初打算赢得的主流数据中心。
现在企业正在拥抱另外一项类似的技术:云计算和近似于Amazon S3的服务–这种服务以具有吸引力的价位为企业提供了可扩展且高速的数据存储和服务。
那么云计算是否能在网格失败的地方取得胜利,并在企业数据中心获得普及?在云计算兴起的今天,是否还有网格计算的立足之地?我们采访了一些网格计算的先驱者,来听听他们对这些问题的看法。
云和网格的区别
虽然网格和云计算有诸多相似住处,但是两者之间的区别是非常重要的。网格计算更适合于有少量用户请求访问大量数据的企业机构,而云计算则更适合于那些有大量用户请求访问少量数据的环境。
Wolfgang Gentzsch曾任Sun公司网格计算总监、现为Open Grid Forum董事会成员以及EU DEISA的项目顾问。他表示:"网格非常适合于虚拟机构中的复杂科学任务。"而另一方面,云很适合于多个短期工作这样的简单任务。
云和网络的另外一个主要区别是:网格要求批量作业规划或者对任务分配制订周密的策略,而云不需要。同时,就其特性而言,云不需要大量的前端投资,因为有云提供商负责运行和维护服务器。
美国阿贡国家实验室数学和计算机科学部的科学家Kate Keahey表示:"如果你的计算任务规模很大并且是可移动的……有苛刻的性能要求,尽最大努力可以完成,那么我会说,传统的网格计算正是你所需要的。"Keahey经常撰写关于网格和云计算的文章,他所在的阿贡国家实验室是网格计算以及Globus网格计算标准项目的发源地。
她说:"另一方面,如果你的计算需求很小,或者需求很大但只是偶尔发生,或者不规律/突发,或者不可预测,或者呈现快速而不规律的增长,那么我会说选择云计算吧,因为这些类型的计算需求要么会让你的数据中心不时地处于空闲状态,要么让你无法将因经营规模扩大而得到的经济节约抵消运营数据中心的投资。"
不过她表示:"如果你有一个稳定且可预测的计算流,不会大幅度波动……那么忘掉云或者网格计算吧,投资一座大型数据中心,然后不断添加计算任务。你将有足够的经济规模来支持数据中心。"
然而,针对那些拥有敏感数据、希望在保持数据专有性的同时节约成本的企业来说,另一种选择就是混合模式。Keahey表示:"运行一座数据中心,用云来覆盖。"她认为将会有越来越多的机构采购这种模式。
系统工程师和架构师Judith Myerson经常撰写关于分布式系统的文章。他认为,企业还必须就决定到底是需要大型问题解决方案(网格)还是临时性的扩展资源解决方案(云)。另外还要考虑你的预算、避免延迟性的需求以及数据敏感性等问题。
虽然云计算有很多优点,最突出的就是成本,但是Myerson警告说"将敏感数据保存在公共云中并不是一个好办法",因为这样更容易受到黑客的攻击。
同样地,虽然表面上看云计算要比运行你自己的数据中心或者运行数十台内部服务器的成本更低,但是她警告CIO们注意隐性成本,例如服务提供商会对那些包含有TB级或者PB级数据的应用收入更高的网络费用,以及高峰时段可能存在的延迟问题。
互操作性也是云计算存在的一个问题。她指出:"例如,如果你的公司将数据外包给一家云计算厂商,然后转向另外一家不同的计算厂商,由于向公共云中输入和输出数据需要专门的API,因此你会碰到不断变化的难题。"
全球网格?
虽然云很盛行,但是Myerson认为网格仍然有发展的空间。
Myerson表示:"未来将会出现数千台计算机工作站需要计算密集型操作的情况,"因为在云中完成这些工作的成本太高了(至少就目前来说)。
Gentzsch也表示认同。他说:"云不会取代网格,正如网格在过去十年中没有取代HPC的功能一样。"他认为,这三项技术都有他们自己不可替代的位置。"未来两年我们将会看到,不同的计算节点会随着全球网和因特网而增加,最终所有这些资源将变成一个信息、知识、计算和通信的全球基础架构,也就是全球网格。"
不过Keahey则给出了一个不太一样的预测。她说:"我认为网格更有可能成为改头换面的云计算或者干脆融入到云计算中。网格计算帮助让云变成一种现实。对于IaaS来说,我认为未来五年我们现在运行的计算中80%~90%都将变成基于云的计算。"