3.4.1 HP新ECC内存技术

3.4.1  HP新ECC内存技术

为了加强对内存数据的保护,HP于1996年引入了新ECC技术(Advanced ECC Technology),它类似于IBM的Chipkill内存技术。

标准的带有ECC技术的设备在从DIMM中读数据的时候可以同时纠正数据中出现的单比特错误,而新的ECC技术可以纠正DRAM中发生的多比特错误,保证DRAM芯片上的数据全部有效。在带有新的4位ECC技术的内存中,每一个芯片提供4比特的数据给数据字。从每个芯片中出来的这4比特数据被平均分配给4个带有ECC技术的设备,每个设备一比特,这样一来,每个芯片上发生的错误可以分解为4个独立的单比特错误。其工作原理如图3-15所示。在改进之前,每一个ECC设备可以纠正单比特错误,而改进后的ECC设备可以纠正一个DRAM芯片中发生的多比特错误,因此新的ECC技术为整个设备提供了更高级别的内存故障保护。

与IBM的Chipkill技术一样,新ECC技术在具有一定优势的同时,也仍存在一些不足,保护级别仍较低。虽然改进后的新ECC可以保护数据避免出现错误,但是它只能纠正发生在单个DRAM芯片中的数据错误,而不具备故障恢复和热插拔能力,对于长时间不间断运行的商用软件而言,要实现其软件功能,就要求系统具备这两种能力。否则,当内存出现问题的时候,系统只能关机,等待更换新的内存。最新一代的HP ProLiant服务器提供3级AMP(Advanced Memory Protection,高级内存保护)技术,拥有更强的容错能力,能够满足应用软件对高可靠性的要求。