性能惊人!Cell处理器测试报告

        IBM 之前公布了准备用于 PS3 主机以及科学运算与多媒体运算等领域的新一代高性能微处理器“Cell”的性能测试报告。本次的 Cell 性能测试报告,是首个较为广泛且全面性的测试,比起先前的理论规格数据与个别单项的测试来说,更能展现出 Cell 微处理器实际运算性能的表现。 
  
  Cell 是由索尼、东芝与IBM所共同研发的高性能多核心微处理器,以 IBM 的 PowerPC 微处理器为基础,具备独特的非对称多核心设计与庞大的总线与内存带宽,拥有高性能的浮点数运算性能。 
  
  Cell 将应用于高清晰数字影音家电、游戏机、计算机图形、科学运算等领域的产品上,其中以索尼旗下的SCE将推出的 PS3 主机为相关应用中最受瞩目、规模也最为庞大的产品。第一代的 Cell 微处理器将具备 1 个 PPE 微处理器核心与 8 个 SPE 协同处理器,由 2.5 亿晶体管所构成,PS3 将采用频率 3.2GHz 的版本,并保留 1 个 SPE 作为备用,实际可用的 SPE 为 7 个。 
  
   测试中的 Cell 是以 3.2GHz 的运作频率为基准,部分项目最多以 8 个 SPE 进行协同运算来测试,部分则以单一SPE 进行测试。 
  
  根据报告的资料,在进行 Cell 内部 8 个 SPE 微处理器核心分为 4 对进行两两数据互传时,用来连接内部各处理单元的 EIB 总线,可提供 78~197GBps 的持续传输带宽,约为理论带宽 204.8GBps 的 38 %~96 %,是PS2 微处理器 EE 内部总线理论带宽(2.4GBps)的 32~82 倍之多。 
   
  
  报告中并针对 Cell 进行了高性能计算、图形处理、加解密计算与视频解码等测试,并将测试结果与各种近似规格的泛用微处理器,如 Pentium4、PowerPC G5 等进行比较。在高性能计算部分,当执行矩阵乘法与 LINEPACK 时,于单精度浮点数运算下可得到 6~8 倍的性能,倍精确度下则为 1.3 倍。 
  
  在图形处理方面,当执行 TRE 计算时,可得到 30 倍的性能,执行 3D 图形处理典型的几何转换与光影计算时,单一 SPE 即可得到 1.7 倍的性能;在加解密计算部分,当执行 AES、TDES、DES 与 SHA-1 等加解密计算时,单一 SPE 就能得到 1.1~2.3 倍的性能;在视频编码部分,当执行 18Mbps HDTV 分辨率的 MPEG-2 串流解码时,单一 SPE 即可达到 77fps 的性能,约为同频率泛用微处理器的 0.9 倍, 
  
  在本次测试报告中的各种性能测试项目上,Cell 都展现出优异的性能表现,显示其于高性能计算、图形处理、加解密计算与视频解码等运算需求领域的优势,将可提供未来 PS3 在多媒体影音与游戏数字娱乐领域所需的物理模拟、3D 图形、音效处理、图形识别、加解密、视频解码等运算需求。
  



  PPU的流水线
  



  SPE程序图 
  
  
  MPEG2解码的流程步骤