在介绍历史上最经典的64位处理器之前,我们首先需要了解,什么是64位处理器?64位处理器与其他处理器有什么区别?在应用领域上是否有特定的要求。
64位处理器是指处理器内部的通用寄存器的宽度为64比特,支持整数为64比特宽度的算术与逻辑运算。历史上出现了4位、8位、12位、16位、32位、以及128位(比如1976年亮相的Comparator)等类型的处理器。
现在我们通常说的64位处理器,常常被用来描述CPU与外部进行通信的数据总线和地址总线为64比特位宽。相比目前广泛使用的32位处理器,64位处理器占用相同的数据会消秏更多的存储器空间(更庞大的指针),从而增加进程对存储器的需求,且可能会影响高性能处理器高速缓存的使用。
然而,由于64位处理器采用的是64比特的位宽,一次可提取64位数据,比32位提高了一倍,拥有更大的寻址能力,性能自然也会提升1倍,而且它还支持更大的内存管理。
当然,这种性能提升和实际应用,是需要借助相应的操作系统和软件系统来支撑的,也即是俗称的64位操作系统。另外,还需要有专门的硬件驱动程序(不同架构需要有不同的驱动),而常见的32位驱动并不能在64位架构平台上进行兼容。
在大家对64位处理器有了初步了解之后,下面,我们来回顾历史上最为经典的64位处理器。
1961年,IBM推出了IBM 7030 Stretch超级计算机,这款超级计算机所搭载的技术仍然被沿用至今,也是1961年至1964年间,全世界运行速度最快的计算机。
这款超级计算机应用领域包括核弹开发、气象、国家安全和阿波罗登月计划的开展。它担负如此重任,当然与其超过的计算性能息息相关。而在当时堪称世界上最快运行速度的这款超级计算机,其实主要得益于采用了大量内存(256000个64位字节)和64位处理器模组。
IBM 7030 Stretch超级计算机
在当时,它可以执行650000的浮点和1秒内完成35万次乘法运算。多达6个指令可被用在索引单元,5个指令专门用在并行运算单元。因此,在某些情况下可提供最多11条指令来执行运算。
IBM 7030 Stretch数据处理系统
IBM 7030 Stretch超级计算机采用的是7101型CPU,它包含有大约169000个晶体管。整个IBM 7030数据处理系统的尺寸为67.5英寸*64.25英寸*29.5英寸(相当于1.7145m*1.63195m*0.7493m)。该系统包含了 7101型CPU、7803功耗分布单元、7302 Core Storage、7619交换通道(提供8个I/O通道)、7620通道扩展、353磁盘存储单元、磁盘控制器、磁带控制器、打印机控制器、以及卡片穿孔机、控制台等模块组成,功耗为21.6KW。
IBM 7030 Stretch数据处理系统一角
为了让如此庞大的数据处理系统能够充分发挥它的动能,该超级计算机配备有Master Control Program(MCP)主控程序,STRAP II assembler(STRetch Assembly Program)延伸汇编程序、FORTRAN IV编译器和Autocoder 2。
刚才介绍的是首开64位计算先河的超级计算机,其搭载的并不是真正意义上的64位处理器。全球首个商用的64位处理器应该属MIPS公司于1991年推出的R4000。
R4000并不是无中生有而被创建出来,而是MIPS早期32位R2000、R3000和R6000的扩展——它们都在处理器发展史上获得突破,但最大不同的地方是,R4000增加了内外部的数据通道带宽,也就是将寻址、寄存器和ALU算术逻辑单元增加到了64位。
NEC D30400RJ-40(40MHz,左)和东芝TC85R4000SC-50(50MHz)
虽然这种扩展带来的处理器面积的增加,但其拥有更加显著的优势。首先,它支持更大的寻址空间,允许操作系统对TB级以上的文件直接进行存入到内存中进行访问。相比之下, 32位寻址空间只能支持不超过4GB的容量。
另外,64位数据通道能够在单个字节组中支持8位长的单精度IEEE浮点数值和字符串。在更为重要的数字加密特定的算法中,更大的数据通道自然会有更好的性能表现。
R4000拥有六种不同的指令——两种非条件转移和4中条件转移——它们又可被称为subroutines子程序。一旦启动执行,这些指令就会返回一个链接或者返回地址。
东芝生产的TC86R4400MC-200 9636YJA(R4400)
另外,MIPS在推出R4000的时候,还兼顾到了之前的32位MIPS架构直接的代码兼容性。在1992年,MIPS在R4000的基础上推出了 R4400处理器,它拥有更高的主频(100MHz、133MHz、150MHz、200MHz和250MHz),而且缓存也从R4000的8KB提升到 16KB,包括230万个晶体管。
上世纪九十年代后,64位处理器发展如火如荼,各大芯片厂商都陆续推出了各自的看家本领,或直接推出64位处理器,或者宣布64位处理器架构加快市场布局。
在MIPS科技公司推出首个纯正版64位处理器之后,DEC、英特尔、Sun、惠普、IBM相继推出了相应的产品和架构方案。DEC公司在1992年,引入纯64位 Alpha 架构,并于次年发布64位OSF/1 AXP 类Unix 操作系统(后来改名为 Tru64 UNIX)和 OpenVMS操作系统给Alpha系统。
1994年,半导体巨头英特尔宣布了64位IA-64 架构的进度表(与HP共同开发)作为其32位IA-32处理器的继承者,路线图定位在1998-1999期间。
IA-32向IA-64架构演进
1995年,Sun推出64位SPARC处理器UltraSPARC。UltraSPARC是一款superscalar超标量体系架构的微处理器,以顺序形式执行指令。
主频为200MH的UltraSPARC处理器
该处理器拥有主次两级缓存,主缓存有两个,分别对应指令和数据,总共容量为16KB。UltraSPARC需要有外部的次级缓存(L2),容量为 512KB至4MB,而且是直接影射(direct-mapped)缓存。外部缓存与同步SRAM(SSRAM)会以处理器的频率进行同步。
1997年,IBM推出了RS64全64位PowerPC处理器,并于次年发布了POWER3全64位PowerPC/POWER处理器。
PowerPC的历史可以追溯到早在1990年随RISC System/6000一起被介绍的IBM POWER架构。该设计是从早期的RISC架构(比如IBM 801)与MIPS架构的处理器得到灵感的。
1990年,IBM、Apple和Motorola开发PowerPC芯片成功,并制造出基于PowerPC的多处理器计算机。PowerPC架构的特点是可伸缩性好、方便灵活。第一代PowerPC采用0.6微米的生产工艺,晶体管的集成度达到单芯片300万个。
IBM PowerPC 601处理器
2000年,IBM开始大批推出采用铜芯片的产品,如RS/6000的X80系列产品。铜技术取代了已经沿用了30年的铝技术,使硅芯片多CPU的生产工艺达到了0.20微米的水平,单芯片集成2亿个晶体管,大大提高了运算性能;而1.8V的低电压操作(原为2.5V)大大降低了芯片的功耗,容易散热,从而提高了系统的稳定性。
IBM PowerPC 604e(主频200MHz)
PowerPC 处理器有广泛的实现范围,包括从诸如 Power4 那样的高端服务器CPU 到嵌入式 CPU 市场(PowerPC 任天堂Gamecube使用了PowerPC)。PowerPC 处理器有非常强的嵌入式表现,因为它具有优异的性能、较低的能量损耗以及较低的散热量。除了象串行和以太网控制器那样的集成 I/O,该嵌入式处理器与台式机CPU 存在非常显著的区别。PowerPC处理模型要从内存检索数据、在寄存器中对其进行操作,然后将其存储到内存中。
早在1994年,英特尔宣布推出64位IA-64架构的进度表(与惠普共同开发)作为其32位IA-32处理器的继承者。并在2001年,正式推出了英特尔自己的64位处理器产品Itanium(安腾)。
Itanium处理器代号为 Merced,是英特尔第一款专门应用在高端企业级64位技术环境中的产品(Intel Architecture 64,简称IA-64架构)。这是为顶级、企业级服务器及工作站设计的,在Itanium处理器中体现了一种全新的设计思想,完全是基于平行并发计算而设计(EPIC) 。对于最苛求性能的企业或者需要高性能运算功能支持的应用(包括电子交易安全处理、超大型数据库、电脑辅助机械引擎、尖端科学运算等)而言,Itanium处理器正是大展身手的好舞台。
Intel Itanium内核
Intel Itanium
2002年,英特尔对Itanium进行了更新,推出Itanium 2。得益于其平行处理架构(Parallel Computing Microarchitecture),在同样工作频率下其效能约为CISC与RISC的八倍。
Itanium 2
Itanium 2处理器专为要求苛刻的企业和技术应用而设计。基于Itanium 2处理器的平台以较低的成本,提供了业界领先的性能 ,以及比专有RISC技术更广泛的选择空间,可帮助企业和机构最大地提高其投资回报。Itanium 2处理器得到了广泛生态系统的 支持,包括由40多家领先硬件厂商的具有出色可扩充的开放标准64位解决方案,诸如Windows Server 2003、HP-UX和Linux等的 超过5款操作系统,以及数百种应用和工具。
Poulson内核
近日,英特尔与惠普宣布推出新一代的安腾9500,该芯片的研发代号为“Poulson”。Itanium 9500的片上内存容量为54MB,包含8 个内核、31亿个晶体管;在4插座配置下,可以支持最高2TB的低电压内存条。
2003年,AMD推出Opteron皓龙处理器。Opteron处理器主要用于多路服务器的领域上。较早期的 Opteron 处理器采用了K8微处理器架构,及至2007年后期逐步过渡至K10微处理器架构。
AMD在64位处理器领域,其实有赖于AMD64位架构的出炉。Opteron和Athlon 64也都属于其64位处理器,后者更倾向于消费级市场。
Opteron六核心处理器透视图
首批Opteron的产品型号使用了三位数字,第一位代表服务器与工作站的路(1路, 2路, 4路和8路),第二和第三位代表处理器的时钟频率速度。其后推出的Socket F及AM2脚位的 产品改用四位数字,开头数字越大代表性能越好。
Opteron 170(早期皓龙产品采用3位数字命名规则)
Opteron的优点是能以正常速度来运行现有的32比特程序,以及能运行新的64位程序,它们当中可直接访问多于4GB的存储器。Opteron集成了存储器控制器,访问RAM的数据不需通过北桥。
Opteron 6300晶圆
前不久,AMD推出了基于下一代"打桩机"核心架构的全新AMD皓龙6300系列服务器处理器。Opteron 6300系列产品线的基频最高达到了3.5GHz,智能超频模式最高可达3.8GHz。全线提供对频率为1866Mhz的四通道内存支持,并且是目前x86架构处理器中仅有的超低压至1.25V的内存支持。所有产品均支持最高达384GB的内存容量,覆盖12条DIMM槽,最多支持4条x16的HyperTransport总线(每条带宽为6.4GT/s)。
在AMD推出64位处理器取得巨大成功后,英特尔公司也不甘示弱,并着手开发AMD64的替代品,也就是称为IA-32e——后来改名为EM64T的处理器产品。
2005年,英特尔公司推出了90纳米Nocona至强处理器,支持EM64T技术的Nocona核心Xeon处理器,这是第一个64位至强处理器核心。它采用Prescott核心,90nm工艺,配备1MB L2缓存。Nocona Xeon频率包括2.8/3.0/3.2/3.4/3.6GHz等几款,能动态调整功率并降低处理器的耗电需求。
Nocona至强处理器
Nocona至强兼容32、64位运算模式,支持市场上所有的基于16位和32位软件,同时对64位架构下开发的应用软件也能够完全兼容。
Opteron与Nocona至强处理器
从内存寻址来说,它打破了以往纯32位架构最大232字节寻址能力的极限,最高可实现近4.5TB的寻址能力,如此大量的内存足以满足当前高端工作站、网络服务器、数据服务器的处理需求以及未来软件应用的需求。
Opteron与Nocona至强处理器针脚
从技术角度来看,Nocona新至强处理器比传统的32位增加了8组寄存器,可减少CPU对L1、L2缓存以及内存的访问次数,从而提高CPU的工作速度;再加上英特尔处理器既有的耗电低、体积小、辐射少、兼容性强等特点,促成了Nocona新至强处理器在计算平台上无可比拟的优势,可为诸如媒体和游戏等应用带来出色的系统响应能力。
至强融核协处理器
作为当今企业级市场上,应用最广的处理器,至强一直深受用户青睐。今年,英特尔进一步更新了SNB架构的至强E5-2600以及IVB架构的至强 E3-1200 V2、SNB-EP架构至强E5-4600。并且,协同去年的至强E7以及今日发布的至强融核产品,为企业计算打造无缝的应用方案。
以上,就是笔者介绍了最为经典的几款64位处理器,当然,在整个64位处理器发展长河中,还有很多其他富有代表意义的产品。这些64位处理器的发展,也需要有相应的操作系统和应用程序的支持,在运算速度方面,以及多任务处理、应力测试、簇等都需要有更宽的算术与逻辑运算,从而更好地支撑这些应用并带来更高的性能。