胡伟武:2010年龙芯3号处理器要做到64核心

    近日,胡伟武在其《龙芯3号多核处理器设计及其挑战》的报告中指出,龙芯3号多核处理器第一个阶段到2008年希望做8~16核,到2010年做32~64核。龙芯3号结构特征是多平台并行虚拟机结构,可伸缩大CMP结构。


    2002年9月28日,龙芯家族首款产品“龙芯1号”正式发布;2005年03月29日,中科院计算技术研究所在北京正式发布“龙芯2号”。龙芯CPU的面世引起中外产业界和广大网友的的广泛关注,而在不知不觉间,“龙芯3号”也距离我们越来越近了。
  
    其实,早在“龙芯2号”发布不久的2005年4月24日,龙芯研发团队负责人胡伟武在接受媒体采访时就表示,龙芯3号将进入预研阶段,十一五期间将完成研发,届时在芯片的结构设计上将有更多的突破。近日,胡伟武在其《龙芯3号多核处理器设计及其挑战》的报告中指出,龙芯3号多核处理器第一个阶段到2008年希望做8~16核,到2010年做32~64核。龙芯3号结构特征是多平台并行虚拟机结构,可伸缩大CMP结构。
  
    面向多内容的服务器应用,可能使用45纳米技术
  
    现在龙芯1号面向IP和嵌入式应用,龙芯2号面向高端的应用,而龙芯3号则面向多内容的服务器应用。胡伟武称:“龙芯3号多核处理器系列主要面向服务器和高性能机应用,部分低端龙芯3号也可以面向部分桌面应用。龙芯3号在策略上伸缩设计、有限实现,比如结合工艺和应用,桌面应用则四核就够了。”
  
   “主频的游戏已经结束了,并行结构我们很有机会。”胡伟武说,“我们设计的方法很正确,有10个核以上,国外厂商更多运用静态电路,不可能把10个100W核集成在一起,不可能为了追求极端的性能牺牲功耗。”
  
    胡伟武指出,多核结构的物理设计方法非常难,如果把16个64位龙芯的核放在一起,反而会成为最大的瓶颈,就像茶壶里倒饺子根本倒不出来的。如果封装1千个核心,真正传递的信号就几百个,需要把I/O做得很快,否则“里面快外面慢”。要建设高速传输的环境,高速缓存的设计等问题非常难。
  
    高性能CPU少不了和代工厂的密切合作。CPU本身的设计还是由中科院计算所具体负责,而根据10月26日中科院计算所和意法半导体签署合作开发多核处理器协议,意法半导体今后会在物理设计方面给于计算所更多的支持,其中便涵盖45纳米技术的合作。
  
    采用多平台并行虚拟机结构 部分兼容x86
  
    由于龙芯1号和2号都不兼容Wintel体系,导致了软件上的相对匮乏,也对它们的产业化应用带来了一定的影响,该问题也对计算所带来了困扰了,去年在计算所内就开了四五次会议进行相关的讨论。目前得出的结论是龙芯2号暂时没有兼容的打算,而龙芯3号则会尝试采取类似全美达处理器的思路去兼容x86,至少部分兼容。
  
    龙芯3号的一个目标是要建设和谐的计算和谐,一是指人机和谐,串行程序并行化的问题;另一个是指机机和谐,就是兼容问题。龙芯3号要做一个多平台并行虚拟机结构,使所有可执行文件可以在龙芯上正确快速地运行。一方面通过进程级虚拟机实现Linux上的X86兼容。另外把虚拟机自动并行化,现在虚拟机使用的热点刚开始软件解释执行,翻译以后是开始并行优化,这样使得串行程序在多核上可以并行。