DoSERV分析:RAS 技术术语表







































































英特尔® 安腾® 2 处理器


多路英特尔® 至强® 处理器 MP


英特尔®至强® 处理器


 


数据中心支持技术





英特尔® 虚拟化技术为虚拟化技术提供硬件支持,能够将当前的纯软件解决方案变得更加可靠、安全、和可支持。


平台错误处理与容错


+




  机器校验架构为错误记录、报告和处理提供集成能力。


+ 增强型机器校验架构可提供更先进的错误处理能力在硬件、固件和操作系统级别均设有定义详尽的界面。


+


+



数据总线检错和修复


  系统支持对数据总线进行奇偶校验或循环冗余校验CRC以检测错误。


+ 系统支持纠错码ECC且有能力重试该操作。系统支持运行时进行检纠错。





高速缓存 ECC 检纠错能力高速缓存阵列由 ECC 进行保护因此便可检测和纠正内存单元中的软错误。若没有该能力,程序则必须终止,整个系统也很可能因此重启。


处理器水平


a


 


锁步支持同一程序可运行于使用相同数据的两枚处理器上。在每个时钟周期对输出进行校验,以确保数据未损坏。



 


 


数据容错能力系统可跟踪包含损坏数据有时被称为数据中毒”)的内存地位置。损坏数据的影响被限制在当时使用该数据的程序之内,一旦程序结束或重写此位置时,坏数据便会被删除。此项能力极大地降低了数据损坏时重启系统的必要性。




 


高速缓存可靠性英特尔® 高速缓存安全技术):性能优于 ECC,可进一步增强处理器高速缓存的可靠性





内存单一设备纠错SDEC):支持系统在单一 DRAM 设备发生故障时纠正所有内存错误。b





内存重试双位检错ECC 可检测双位错误但只能纠正单位错误。一旦出现双位错误,该功能可支持内存控制器重试读取内存,也许可以纠正错误。





内存备件允许备用设备替换故障内存设备。此举可通过避免 ECC 纠错造成性能损失,来提升性能;同时可通过为内存设备纠正多项软错误(ECC 仅能纠正单位错误),来增强可靠性。


+


+



分区大型计算系统可划分成多个小的分区。每个分区都有专门的资源(可经常在分区间切换),可运行不同的操作系统,并与其它分区的软件或资源错误相隔离。由于每个分区都作为单独的系统来进行管理,因此可降低总拥有成本。


  所有基于英特尔® 处理器的服务器平台都支持采用第三方软件虚拟化解决方案(参见上文中的英特尔® 虚拟化技术的逻辑分区。


+ 多家平台厂商支持硬件分区。




 


电子隔离分区电子隔离可防止一个分区中的硬件故障影响到另一个分区。该功能支持众多应用运行于单一系统,同时又能保持一种在不同系统上运行这些应用的隔离状态。此外,允许在其它分区运行时将资源(如全新处理器主板或内存主板)添加到一个分区也是非常必要的。

 
         a 锁步功能由特定厂商通过支持的芯片组和平台提供支持
         b IBM 称之为“chipkill”