内存会出错
计算机中使用的内存储设备主要有两种类型:静态随机存储器(SRAM)和动态随机存储器(DRAM)。其中SRAM作为缓存使用,这是因为它的速度快,并可以在关闭电源前一直保存其中的数据;而DRAM芯片装在168脚的DIMM(Dual inline memory modules)上,每一个DRAM芯片以电容行或电容列存储数据,对这些存储单元必须不停地进行充电或者更新否则其中的数据就会丢失。一个充电的电容器由数据“1”表示,一个放电的电容器由数据“0”表示。充电或放是由存储设备的电压决定的。当电容器中的电荷受到外界的影响发生变化时,读数就会出现偏差,则服务器中使用的内存模块就会出现存储错误。
一、内存的通用技术
◆奇偶校验技术 比特(bit)是内存中的最小单元。比特是通过“1”和“0”来表示数据高、低电平信号的。8个连续的比特叫做一个字节(byte),在不带“奇偶检验”的内存中如果某个字节数据有一个比特出错,那么数据将出错。可以在每个字节数据后增加一个奇偶检验位。
◆ECC内存查纠错技术 ECC是Error Checking and Correcting(错误检查和纠正)的缩写。ECC纠错技术也需要额外的空间来储存校正码。
二、IBM服务器内存技术
◆Chipkill内存技术
◆大容量高速度技术
◆内存保护
◆内存镜像技术
内存镜像(Memory Mirroring)是IBM的另一种更高级的防止因内存错误而导致整个服务器不稳定性事件发生的技术。内存镜像的工作原理很像磁盘镜像,就是将数据同时写入到两个独立的内存卡中(两个内存卡的配置是一样的),平时的内存数据读取只在激活的内存卡中进行。
三、HP的服务器内存技术
◆新ECC内存技术
为了加强对内存数据的保护,HP于1996年引入了新ECC技术(Advanced ECC technology),它类似于IBM的Chipkill内存技术。
◆在线备份内存模式
HP的在线备份内存模式在HP Proliant 300和HP Proliant 500两个系列的服务器中得到应用,但这两个系列的服务器所采用的在线备份内存模式并不完全一样。
◆镜像内存方式
镜像内存方式可以用来保护发生多比特错误的数据。
①单存储板配置——非热插拔方式(Non-Hot Plug)用户可以在服务器自带的存储板上设置镜像内存。这样无论是发生了单比特错误还是多比特错误,系统都可以保数据的安全可靠。用户可以指定两个镜你存储区(C和D)。运行在镜像内存方式下的服务器,其系统内存可以达到4GB。为了保证内存镜像方式的正常运行,存储区C和D的配置必须和存储区A和B的配置一样。如图所示,数据被同时写入系统内存和镜像内存,但只从系统内存中读出。如果系统内存中的某个DIMM出现单比特错误达到错误极限,那么系统会自动将存储区C和D设置成系统内存,将A和B指定为镜像内存,数据仍然会被同时写入系统内存和镜像内存中,但只从系统内存中读数据。
图 一 单存储板配置
②热插拔的镜像内存模式需要扩展存储板(选件,)此模式可以为内存提供比在线备份方式更好的保护。热插拔的镜像内存模式包括在线扩展和在线替换内存。在线扩展是指用户可以在空的插槽上插入DIMM以扩展系统内存容量,在线替换是指用户可以在系统运行中直接将出现故障的DIMM替换掉。为了确保热插拔的镜像内存模式运行正常,两块内存板必须是一样的。一个数据被同时写入两块内存板上,但只从主内存板上读数据。
图二 双存储板配置的镜像内存模式
◆热插拔RAID内存(Hot Plug RAID Memory)技术
HP热插拔RAID内存可以为长时间不断运行的应用程序提供极高的实用性、灵活性和容错能力。即使内存设备彻底地发生故障,内存仍然可以正常工作。
图三 RAID内存原理
四、主要服务器内存模组技术
⑴双倍DIMM面积模组
DIMM(Dual-inline Memory Modules,双列直插式存储模块)
图四 双倍DIMM面积模组
⑵Elpida和Kingston的TSOP双面内存模组
TSOP:Thin Small Outline Package,薄型小尺寸封装。
图五 TSOP封装的内存
图六 叠加的TSOP封装的内存
⑶Elpida的TCP模组
TCP:Tape Carrier Packaging
图七 TCP封装的内存
五、FB-DIMM内存体系架构