低端服务器性能的改进和可靠性让IT经理以新的角度看待集群技术,系统厂商和软件开发商则在推动这一趋势的发展。
Datavantage的尝试
IT经理在低迷时期中对购买低端服务器变得非常习惯。
Datavantage是一家零售服务公司,去年当它准备上一套礼品卡服务系统从而为零售商提供保存和管理零售信用信息的交易平台时,最主要的考虑因素有两个,一是这个系统的后台不能经受任何停机时间,二是不让系统运行在Unix平台上,因为那需要花费较多的资金。
因此,Datavantage淘汰了原来的老平台:一台运行Oracle软件的Sun E450,开发部经理Ian Amit选择了一个运行Linux和Oracle 9i Real Application Cluster数据库的HP ProLiant服务器集群来代替了老系统。
其实,像Datavantage这样关注基于低端服务器的集群系统的公司正在越来越多,它们希望通过集群系统来取得相当于或优于昂贵的高端设备的性能与可靠性。
建立服务器集群并不是什么新事物。多年来,大型机一直用所谓的Parallel Sysplex Clusters技术连接在一起,使工作负载分布到所有可供使用的资源上。在厂商提供专有软件的情况下,Unix系统也具有集群能力,如Sun的Sun Cluster和IBM的高可用性集群多处理技术。但是,分析人士说,低端服务器性能的改进和可靠性让IT经理以新的角度看待集群技术。
系统厂商和软件开发商则在推动这一趋势的发展。例如,去年Dell和Oracle透露,正在推动低成本、基于标准的系统集群,以便为企业客户提供以前只在昂贵的高端机器上才有的处理能力。找到可以运行在这种分布式环境中的应用程序是个障碍,但是软件厂商开始推出这方面的产品。例如,Oracle的9i RAC就是专门为在集群服务器上运行而设计的。分析人士说企业客户可以期待着更多应用程序的出现。
分析人士说,发生这种变化的部分原因是最近几年被迫少花钱多办事的IT经理们开始购买更多的低端服务器,实际上这类服务器的功能变得越来越强大。据IDC说,在过去几年里中档和高端市场中的服务器收入下滑的同时,低端服务器(价格低于25000美元的服务器)销售却在整个低迷时期中不断增加。
IDC全球企业服务器解决方案副总裁Jean Bozman说:“IT经理在低迷时期中变得对购买低端服务器非常习惯,我认为这对于使他们形成‘让我看看未来如何利用这种计算技术’的态度起到了耳濡目染的作用。”
集群带给Amit的惊喜
使用集群的情况下,服务器协作承担负载,使停机时间变得可以忽视不计。
对于Amit来说,低端Linux集群服务器带来了可观的费用节省和更好的性能。Sun基础设施的费用大约为1百万美元,而Amit以大约25万美元的费用,建立了一种包括由两台运行Oracle软件的双处理器ProLiant DL580服务器构成的集群。
他说:“我们不喜欢老平台。它的停机时间超过了我们打算提供给客户的服务水平协议。我们在管理Oracle实例上遇到了问题,而且由于你根本不能拆卸系统,数据本身变成了一场噩梦。系统发生的每一个小毛病,就意味着停机时间。”
Amit说,在使用集群和Oracle 9i RAC的情况下,服务器协作承担负载,使停机时间变得可以忽视不计。如果一台服务器停机或过载,另一台服务器自动承担它的工作。利用这种集群配置,Amit可以很容易地扩展容量。这对于这家预期礼品卡应用程序将在今后一两年内将工作负载增加一倍的公司来说,可是个重要的因素。
他说:“我可以水平和垂直扩展。我可以向目前的服务器添加更多的马力,可以向配置中增加更多的服务器。整个设计必须使所有东西完全可以进行扩展,并且不造成一秒钟的停机时间。我们在扩展老设备时希望解决的问题就是停机时间和费用。”
Bozman说,IDC去年一次对使用集群的325位IT经理的调查发现,大约80%的Windows和Unix集群将被部署在高可用性环境中。不过,她说,向运行工作负载平衡集群(如Amit部署的集群)的发展趋势正在增长,尤其在Linux环境中,80%的集群的重点放在资源共享上。
从头开发软件
将软件移植到集群环境是打算部署集群的公司面临的挑战。
通过Internet提供卫星图像和空中摄影的GlobeXplorer,今年初进行了第一次尝试,部署了一个由40多台运行Red Hat Linux的Dell服务器组成的集群。这些服务器帮助GlobeXplorer提供和管理必须定位和解压缩的图像。
这家公司的CEO Rob Shanks说,GlobeXplorer每天处理1百多万幅图像,因此处理能力和可靠性至关重要。他说,如果没有这个集群,公司就必须投入数百万美元部署更大型的机器。
他说:“替代技术将是比数百万美元的Sun Fires还要大的某种机器,例如,一台高端Sun Fire E25K系统在4处理器配置时起价为1百万美元左右。但是由于我们从头开发软件,因此我们围绕集群技术开发软件。”
将软件移植到集群环境是打算部署集群的公司面临的挑战。华盛顿州Kent市户外服装与设备零售商Recreational Equipment公司基础设施服务经理Jim Knight说,移植软件是公司两年前在IBM Unix服务器上部署Oracle 9i RAC集群时遇到的最大的障碍。
REI过去一直在一台配备热备份服务器的Unix服务器上运行Oracle数据库,但当公司在线销售网站上的销售额由每小时约25000美元猛增至假日季节的每小时95000美元时,它没得到所需要的可靠性,而且还要为待机的空闲硬件花费很多的钱。
Knight说,在使用Oracle 9i RAC集群后,REI避免了停机时间,不过,让应用开发人员熟悉编写用于分布式环境的软件用了很多时间。
他说:“我们的程序最初是设计用于具有热备份的单数据库服务器的,因此所有人都在为一台特定的服务器编写程序。在使用RAC时,你不需要做这样的工作。你是为一个数据库编程,你让服务器相互通信。因此,我们遇到的挑战是重新教育我们的开发人员。同时跨多台服务器运行一个数据库是以前从来没有听说过的。”
部署集群时的另一个挑战可能是设计存储和备份系统,以确保数据可跨多台服务器共享。
密歇根州Dearborn市Oakwood Healthcare高级系统程序员Jim Hammelef说:“在使用Microsoft集群时,更大的挑战是让备份系统与集群配合??在集群中发生故障切换时重新组织和腾出地方。”
为何采用集群?
用户正在考虑采用低端服务器集群的方式来获得大型系统的可靠性以及运算能力。去年IDC进行的一项调查(一共有325位IT管理员参与)说明了部署集群的原因及挑战。
部署集群的原因
● 提高可用性
● 提高可靠性
● 提升扩展性
● 提高管理性
部署集群的挑战
● 对集群缺乏了解
● 使部署可操作
● 各种集群配置