近日,NVIDIA发布了新一代Tesla GPU K40加速器。作为NVIDIA的重要OEM合作伙伴,浪潮公司在第一时间对其进行测试,并同步发布了基于Tesla GPU K40的服务器产品。DOIT记者采访了浪潮集团高性能服务器产品部总经理刘军、NVIDIA(英伟达)中国区技术与解决方案高级顾问邓培智、浪潮公司HPC应用技术经理张清。
图1 左起依次为浪潮公司HPC应用技术经理张清、浪潮集团高性能服务器产品部总经理刘军、NVIDIA(英伟达)中国区技术与解决方案高级顾问邓培智
K40亮点:显存空间提升 降低编程难度
从K40的性能指标可以看出,相比之前的K20而言,最大的改进就是显存容量增加了一倍,这对于数据量高的应用是一个很好的改进。其次是,K40新增了GPU Boost的功能,应用可以充分利用GPU Boost功能,提升GPU的能力,GPU Boost最高可以提高10-20%的性能。尽管性能有所提升,但Tesla K40的热设计功耗依然保持在235W,而散热方式除了被动式之外还增加了主动式。
浪潮高性能计算专家张清表示,“Tesla K40性能方面提升了10-30%,更重要的是编程方面的进一步改进,我想CUDA 6.0版本出来之后,对CPU和GPU会建立统一的寻址方式,对编程的难度会有进一步的降低。另外,显存空间的提升,以及PCI-E带宽的提升,对这种大数据量高性能行业应用是一个福音。我们之前做了很多应用,数据搁不下,导致编程难度加大。所以硬件直接升级,将大大降低编程的难度”。
由于Tesla K40和K20的制程工艺没有差别,因此,用户在升级时可以直接用K40加速卡替换K20。对于服务器厂商而言,也无需改变服务器的设计。当然,K20和K40在市场上将会并行存在一段时间,并逐步过渡到K40。
联手推动GPU的应用 关键在应用和人才
理论上,很多其他行业的大数据问题,都可以通过高性能计算机来解决。只是,应用软件的缺乏导致高性能计算机的计算能力没有却办法“动起来”,而应用软件缺乏的主要原因则是人才的缺乏。
用一个不恰当的比喻来理解,高性能计算机就好比是米饭,而应用软件就像是电饭煲,而人才就是会用电饭煲做饭的巧妇。如果空有米饭,却没有电饭煲和会使用电饭煲的巧妇,那我们永远都吃不到香喷喷的米饭。
浪潮和NVIDIA的一致共识就是要从应用端去推动GPU的应用。目前,许多客户在使用的商业软件或是使用国际上比较成熟的计算软件,已经有CUDA的版本,可以利用GPU的加速技术。据了解,在中国一些比较典型的行业应用,比如石油、生命科学、互联网、图像等方面,浪潮通过与软件开发者进行广泛合作,开发了基于Tesla GPU加速器的软件版本。
除了传统的超大型超算中心之外,目前,GPU客户的范围正在不断扩展,还有很多其他新兴行业的客户,比如互联网、通讯、金融等等。从浪潮的销售数据来看,GPU的增长速度已经达到了三倍,超过了NVIDIA统计的两倍的增长速度。未来,GPU在互联网的应用需求将非常大,所以我们也在和NVIDIA一起积极推进互联网行业的应用。据介绍,浪潮和NVIDIA的战略合作中,有一个专门的研究课题,就是针对GPU和大数据结合的研究。
“在互联网领域,目前是采用CPU来做计算,但是互联网的图片搜索,视频、音频的转码分析这一块陆续即将要采用GPU的架构来做,像奇虎和阿里巴巴等互联网企业,都在一起做这一方面的合作,还有在安防行业,也准备采用GPU架构来做这一方面的加速”,张清介绍了互联网领域如何跟GPU相结合。
事实上,浪潮和NVIDIA去年就共同发布了“GPU卓越人才计划”,目前,通过认证的工程师已经达到了100人。双方在人才和应用方面的共同发力,将会对GPU的应用和生态系统的进一步完善,起到非常重要的推动作用。