2006盘点专稿 集群就是让两台或多台计算机或节点在一个群组内共同工作。与单独工作的计算机相比,集群能够提供更高的可用性和可扩充性。集群中的每个节点通常都拥有自己的资源(处理器、I/O、内存、操作系统、存储器),并对自己的用户集负责。
当一台服务器出现问题,利用故障切换功能就可以将这台服务器负责的运算切换到集群中一个或多个其它节点上,可以很好地保障整个系统的安全运行。并且,通过前瞻性地将一台服务器的功能”切换”到集群中其它服务器上,可以实现升级,停止该服务器的运行以增加组件,然后将其放回到集群中,再将其功能从其它服务器转回该服务器。利用分布式讯息传递(DMP)可提供额外的可扩充性,DMP是一种集群内通信技术,该技术允许应用以对最终用户透明的方式扩展到单个对称多处理(SMP)系统以外。
集群中的每个节点必须运行集群软件以提供服务,如故障检测、恢复和将服务器作为一个系统进行管理的能力。集群中的节点必须以一种知道所有其它节点状态的方式连接。这通常通过一条由于局域网路径相分离的通信路径来实现,并使用专用网卡来确保节点间清楚的通信。这样,如果一个资源发生故障因而无法运行,系统就会开始故障切换过程。实际上,最可靠的配置采用了使用不同通信连接(局域网、SCSI和RS232)的冗余心跳,以确保通信故障不会激活错误的故障切换。
在构建一个集群时,可以有多种不同档次的集群方式,它们能提供广泛的可用性。当然,可用性越高,价格也越高,管理复杂性也越大。