颠覆传统 LanderCluster 6全新智慧高可用系统

DoSTOR存储在线 5月9日报道–2008年,国内核心业务数据安全厂商上海联鼎软件技术有限公司正式发布最新高可用集群软件LanderCluster 6.0版。新版本产品面向企业级用户,与LanderCluster以往版本不同,此次发布的6.0版在传统高可用集群思路的基础上,进行了创新性颠覆,采用全新体系构架,推出了创造性的"系统健康评价体系"、全新智能预警系统、故障分级处理体系、支持虚拟化等特性,令高可用集群系统由单纯的故障切换转向主动的故障预警和提示,极大的提高了核心系统的可用性,扩展了集群软件的应用范围。

LanderCluster 6.0新增以下技术特性

1. 智慧系统健康与可用性评价体系

一个核心业务系统的可用与否的关键因素是整个系统的健康程度,传统高可用系统仅仅简单的认为系统只有"可用"与"不可用"两种状态,这样的判断虽然简单但却仅仅考虑了两种极端的状态,显然无法对系统进行全面保护。LanderCluster 6.0在业界首次提出了创造性的"系统健康评价体系"并加以应用,我们认为对系统的可用性判断必须是持续的,而非极端的,大量的情况证明系统从"可用"转向"不可用"并非是瞬间发生,而存在一个过程,在这个过程中,系统的某些核心指标将会提前显示出异常,虽然此时系统对外表现出的仍然为"可用",但整个系统实际已经处于"亚健康",对客户端的请求反应逐渐变慢,系统出现不稳定的迹象,系统整体可用性逐渐降低,如果不进行任何干预,系统在未来某个时点将有极大可能转化为真正"不可用",从而导致灾难性的后果。通过LanderCluster 6.0的"系统健康评价体系"全新的系统核心指标持续检测功能,用户将及时发现系统的异常状态,有效判断系统目前真正的"健康"程度,并且经过对系统核心指标的综合分析,将能对系统未来可能发生的状况进行"预知",直击造成系统转向"不可用"的原因,提前发现,提前预警,提前解决,令用户从"被动"的解决转向"主动"的发现与处理,让系统的可用性判断从"不可知"转为"可预知"

2. 预警体系

对支撑业务系统稳定运作的重要指标如处理器、内存、LAN介质、存储设备、网卡、进程、服务、应用程序等的实时状态设置监控机制,任意被监控指标超越预警阀值,即可根据用户预设策略做出快速反应,提前预警。

3. 故障分级处理

不同行业、不同用户对故障程度定义有所不同,LanderCluster独特的故障分级处理体系以用户标准为导向,提供用户自定义故障阀值,以此建立不同的故障评价标准,并对每一类故障进行自定义操作,提供最大的灵活性。同时系统提供丰富插件,为用户提供精准的故障分析。

4. 支持虚拟化环境

虚拟化浪潮已经袭来,在节约空间成本的同时也为系统软硬件增加了更大的负荷,LanderCluster的虚拟化环境支持形式多样,支持物理虚拟混合模式物理环境内部切换,单一虚拟化系统之间自由切换,虚拟环境物理环境互切等,全方面极力保障用户系统安全。

5. 支持广域网环境集群

新版本增加了CheckPoint,完全支持广域网环境,并能够方便搭建网与广域网共存的复杂环境,为用户提供更可靠的保障。

6. 深度应用侦测代理(User Application Agent

集群保护下的核心业务,是通过代理(Agent)实时采集应用的运行态数据,结合"评价体系"来诊断系统可用性的。可用性指标分为两类:一类是结果类,即模拟客户端访问是否成功,是否获得期望的响应;另一类是风险类,体现的是系统当前运行态的风险指数,如应用的连接数、数据库的存储空间使用率、Web的访问迟延、网络的流量、CPU的负载、系统内存的余量等等,这些因素都是系统能否正常工作的潜在风险,是进行故障预警的重要预测依据。

LanderCluster 6.0提供常用软件的侦测代理,如Oracle、MS-Sql以及Web等,这些监控对象的接口及方法,被灵活保存在XML配置文件中。集群提供开放的应用代理接口,用户可根据开发模板,自定义监控对象的指标采集方法,就可以让集群系统实时监控这些指标,触发相关的事件。

LanderCluster 6.0增强以下一系列功能

1. 集群单组支持节点及任务增至64

LanderCluster每个分组内可支持多达64个节点,并可同时管理64个任务,可以满足大型企业级用户需求,为用户的系统扩展提供了充足的空间。

2. 更丰富的集群备援模式

支持单机高可用、主从、对等、多备一、一备多、多备多、多机互备,双存储备援,纯软环境集群,远程高可用,虚拟环境高可用等各类灵活备援方式

3. 增强的跨平台集群系统集中管理

通过集中管理平台统一管理整个集群,用户能够全面集中监控及管理资源组内各台服务器的存储资源,网络负载,系统进程,系统服务,并可对目标服务器的进程及服务进行操作,从而极大简化分散管理的复杂度,实现合理资源配置。

4. 更高级别的监测准确度,更快速的切换速度

应用最多5层链路侦测,确保集群监测准确可靠,避免"脑裂"现象,并应用快速故障侦测及处理技术将系统切换时间缩短到以"秒"计算的范围,最大程度降低系统停机时间,提升系统可用性。