DOIT原创报道: 在7月16日开幕的中国教育科研网格(ChinaGrid)第五届学术年会上,英特尔公司的工程师金君向与会用户做了题为《以应用为导向的平台搭建、性能优化和技术推进》的演讲,在演讲中,金君提到,英特尔新推出的Knights Ferry众核架构产品将是至强平台的补充,已经作为协处理器提供给用户,虽然其在部分应用上的性能提升十分显著,但应该充分认识到,众核架构只是适合少数应用,如矩阵乘法、FFT等计算模型。
金君详细的介绍了Knights Ferry的情况,据他介绍,Knights Ferry拥有独立的二级缓存,它们之间通过环形链路做到缓存一致性,每一个核心支持3个线程,目前的产品拥有32个核心。英特尔为Knights Ferry增加了向量指令的支持,其最高支持512位的向量指令,一条指令包括16个单精度浮点计算,而Knights Ferry在一个周期内能够运行一条指令。
令人惊奇的是,金君表示,Knights Ferry除了部分出自此前调整的Larabee项目的研究成果,其产品原型实际上来自于奔腾产品。
据金君介绍,Knights Ferry的编程方法包括进程级的并行编程方法以及本身的并行编程方法,且支持不同的线程、OepnMP,并支持128个线程,而第三种编程方法被称之为Vector Paralle,但金君同时提到,编译性能实际上取决于向量化的工作是否完成的足够好。
“做向量化的工作可以采用直接用汇编指令的方式,或者是直接用编译器定义的方法,此外,还可以采用编译器自动向量器进行编译向量化的工作。”但金君同时也表示,做向量化要看系统的处理器、内存、QPI速度等不同的选择组合,用户应当做好充分的应用分析,并了解应用的特征。
而针对应用程序优化这一火热的话题,金君也给出了自己的建议,他建议,用户应当首先做系统本身的性能分析,然后再改善算法应用程序、数据结构或进行线程优化。此外,基于微架构的调整、数据访问效率、缓存利用率以及向量化调整做的是否到位,都将是影响一台HPC未来性能的原因。