HPC China 2012:3D集成微处理器软错误屏蔽效应

2012年10月29日-31日,由中国计算机学会主办的 “2012年全国高性能计算学术年会”(HPC China 2012)在湖南省张家界阳光酒店召开。本届盛会围绕着高性能计算技术的研究进展与发展趋势、高性能计算的重大应用等主题展开,促进信息化与工业化的深度 融合,为相关领域的学者提供交流合作、发布最前沿科研成果的平台,推动中国高性能计算的发展。

点击查看大会直播专题

第二天下午的高性能计算大会分论坛上,来自国防科大的宋超发表了关于“基于3D集成技术的微处理器软错误屏蔽效应研究”的演讲。

 

首先在计算机系统工作时硬件胡产生各种各养的故障,包括永久故障和瞬时故障,这两者都实现存在于器件之中,只是持续的时间不同。如果包含这些器件的电路不能完成预定功能,则发生了一个错误。与故障不同,错误是一个逻辑概念。当计算机因为某一错误而不能实现计算功能任务,则称之为系统失效。对于用户而言,关心的焦点是计算机系统是否稳定。

硬错误与软错误

再说软错误之前我们先来了解一下硬错误。在高能例子对电路轰击时,硬错误与软错误都可能造成微处理器失效。而硬错误是永久性的错误,可以造成某一电路模块或者功能单元甚至整个芯片永久失效。一般只发生在长期暴露于强辐射照射环境下的芯片。而软错误只会暂时改变芯片的状态,不会造成永久性失效。

那么目前所面临的挑战,主要是来自于工艺技术的发展,包括电压和电容。另外在高端用户中,由软错误问题导致的系统失效引起了的损失巨大。

3D集成

3D集成技术可以将多个传统的二维电路堆叠起来,并且为相邻的电路层提供通孔作为布线通道。

我们通过实验了解到,在其他条件相同的情况下,远离封装材料内层电路知识受到金属布线层的影响,发生软错误的原始错误率只有外层电路的十分之一。