美国加州圣克拉拉,2007年2月11日,英特尔公司的研究人员已经研究出世界上首个具有与超级计算机相似性能的可编程处理器,这一内含80个内核的单芯片,其尺寸并不比一个指甲盖大多少,而耗电量却低于当前绝大多数的家用电器。这是英特尔公司创新性的“万亿级计算”研究项目的成果,该研究项目旨在为未来的个人电脑和服务器提供万亿级浮点运算性能,即每秒运算一万亿次。万亿次浮点运算研究用芯片的详细技术细节,将于本周在美国旧金山举行的国际固态集成电路会议(ISSCC)年会上予以公布。
万亿级计算性能以及传输万亿字节数据的能力,将在今后的随时随地可以接入互联网的计算机中起到关键性的作用,为教育和协同工作创造新的应用,同时推动基于个人电脑、服务器和掌上设备的高分辨率娱乐内容的创新。例如,人工智能、即时视频通信、高逼真游戏、多媒体数据挖掘以及实时语音识别,这些曾在科幻节目中被看作是异想天开的事,都有可能成为现实。
目前,英特尔公司没有计划将这一以浮点运算核心设计的芯片推向市场。但是,英特尔公司这项万亿级计算研究对创新性地探索单一或特制芯片/处理器的新功能,芯片到芯片、芯片到计算机间高速传输数据的方式,以及更为重要的是??应该设计怎样的软件来充分开发利用多个处理器核心有实质性的作用。该万亿次浮点运算研究用芯片对于新的硅设计方法论、高带宽互连以及能耗管理方法,也提供了具体而精确的研究分析。
英特尔公司高级院士、首席技术官贾斯汀 (Justin Rattner)说:“我们的研究人员完成了一项激动人心、具有里程碑意义的研究项目,将多内核和并行计算性能进一步推向前进。这项研究成果为不久的将来普及具有万亿次浮点运算能力的设计指明了方向,从而给计算机、互联网用户带来意想不到的新的应用模式。”
人类首次实现万亿次浮点运算性能是在1996年,当时英特尔公司为Sandia国家实验室建立了ASCI Red超级计算机。该计算机占地2,000平方英尺,装有将近1万颗奔腾®Pro处理器,耗电愈500千瓦。而今天,英特尔的研究用芯片仅在一个多核心芯片上就实现了同样的性能。
同样了不起的是这颗80个内核的研究用芯片,在实现万亿次浮点运算性能的同时,耗电仅62瓦,比现在使用的许多单核处理器耗电量还低。
该芯片的一个显著特点,是创新性地使用“瓷砖片”设计(tile design),小的内核像“瓷砖片”一样重复地平铺开来,这样就较容易设计出多内核的芯片。英特尔发明的新型耐用材料可用来制造下一代的晶体管,而且摩尔定律的效力远未结束,这就为今后制造出具有数十亿个晶体管的许多内核的处理器开辟了更有效的路径。
万亿次浮点运算芯片的另一个特点,是在芯片上具有网格状(mesh-like)的“片上网络”(network-on-a-chip),使内核与内核之间能以超高带宽进行通信,并且能够在芯片内部以每秒万亿位的速度传输数据。该研究项目还对分别打开或者关闭各个内核的方法进行了研究,所以可以根据需要启用那些为完成某项任务而工作的内核,从而极大提高了能效。
万亿级计算研究的下一步,会倾力于将3-D存储器堆叠到芯片上,以及用许多基于英特尔®架构的通用内核来开发更加智能的研究用原型。目前英特尔®万亿级计算研究计划(Intel® Tera-scale Computing Research Program)有100多个项目同时开展,去迎接在架构、软件和系统设计等方面的挑战。
英特尔在国际固态集成电路会议(ISSCC)年会上还提交了另外8篇论文,其中一篇论文涉及英特尔®酷睿™微体系架构及其采用65纳米和具有革命性的45纳米制程技术,在笔记本电脑、台式机和服务器的双核和四核处理器中的应用。其它论文所涉及的课题包括无线射频识别技术(RFID)读卡机收发器芯片、用于移动设备的低功耗缓存,以及除了用于芯片上提供共振抑制功能的新型电路以外的可重新配置的Viterbi加速器,芯片上相位噪音测量,以及变化和衰变的适应性技术等。