Tesla在中国:让每个大学生都有GPUCard

NVIDIA大力推广的在CUDA支持下的GPU通用计算已经得到了越来越多普通用户的认知和支持,而在GPU通用计算最擅长的领域高性能计算/超级计算机方面,NVIDIA也在不久前推出了Tesla系列的新品T10。T10基于GT200最新GPU,以单GPU每秒万亿次浮点计算的能力,可以灵活组成单个或多路的GPU并行计算Tesla计算卡/服务器产品,成为科研、密集计算领域最新的选择。

CUDA和Tesla目前在全球范围内有超多250个客户在使用,更有几十家著名大学开设了CUDA编程方面的课程,GPU通用计算开始真正流行起来。NVIDIA Tesla GPU计算事业部高级产品经理Sumit Gupta在7月底来到中国,和国内CUDA学术研究现行者清华大学邓仰东教授一起向我们介绍了Tesla T10和CUDA在国内的最新进展。

  ● NVIDIA CUDA和Tesla

Sumit Gupta表示,目前最为合适的超级计算环境应该是以GPU主导计算、CPU负责控制的异构计算环境;因为在密集计算的典型环境中,单个GPU的并行计算能力就能够媲美现有CPU集群,而多个GPU联合起来则把并行计算能力推到一个前所未有的高度。Sumit Gupta举例GPU和CPU计算差别的核心并行vs顺序时说:"到底什么是顺序,什么是并行?用简单例子说,假设每人手中都有一瓶水,这里有一个桶,我们把这个桶装满,顺序的话,就是一个人来了以后另外一个人再过来; 并行的话,所有人把水同时往桶里倒,这样的话,显然通过并行的方式速度会快很多。"

"这里所提出的并不是一个简单的进化,不是推出一个新的略微好了一点的处理器,这完全是一个革命性的全新的计算方法。"Sumit Gupta强调。

Sumit Gupta举例了一个来自比利时的安惠普大学的项目,此大学原有的CalcUA超级计算机,拥有512个CPU,它的成本是530万美元。大学总共只有一台超级计算机所有人共享来使用的。而这个研究小组他们自己用了一套桌面机,安装了四片GeForce9800 GX2显卡,也就包括有8个GPU,总共花了7000美元。这个只用了7000美元所包含8个GPU的桌面机对于他们的研究来说,性能超过了原来530万美元所搭建的超级计算机。  第二个例子是

Hanweck Associates Volera,这家公司用CUDA+GPU进行期权估值的软件的开发和使用。他们发现,相比较原来使用CPU,从所需要的处理器来看,GPU是12 个,CPU是600个,利用GPU的空间缩减的9倍,硬件成本也有6倍的缩减,每年所缩减的成本,还有冷却、功耗的费用相比于原来也有9倍的缩减。

相同计算目标达到的前提下能够明显降低运营成本是Tesla+CUDA的一个重要优势,而在此基础上的高密度计算能力,则能够在之前占地规模上极大的提升运算能力,这是显而易见的。  以下是Tesla

S1070和Tesla C1060的具体信息,这两款产品目前都已经面世,通过NVIDIA在品牌机方面的合作伙伴向用户出售,比如联想。

  ● CUDA在中国的初步进展

研究电子设计自动化的清华大学微电子研究所副教授邓仰东,在过去几个月中和自己的团队使用CUDA对一系列的硬件应用取得了一系列的结果,这应该是国内首个在研究上使用CUDA的例子。

所谓电子设计自动化就是用软件对集成电路进行设计,简称EDA。集成电路设计自动化是非常复杂的,今天集成电路向45nm转移,设计这个级别的半导体电路,逻辑门数以十亿计,这完全不能靠人工来手动设计,需要依靠软件自动化实现。

1971年发表的Intel第一款微处理器4004,只集成2300个晶体管,而2007年的Intel Coce2 Extreme微处理器已经有将近3亿晶体管,也就是说在过去的36年中,芯片的复杂度超过了10万倍。但是在芯片复杂度这么增加的同时,设计团队的的规模是怎么变化的呢?事实上,如果按规模增加的话,今天Intel可能需要几百万人才能设计一块微处理器,显然其实不是如此:前端设计人员增加不超过5倍,后端设计人员不超过10倍。从这个角度来看,为什么没有变化设计团队规模能够做设计出这样复杂度增加的集成电路呢?就是电子设计自动工具,事实上设计自动化工具给予设计师,就是摩尔定理增加的设计原理,从而使得我们能够征服今天集成电路的复杂度。

邓仰东说:"用CUDA实现EDA之后,结果非常惊人,我们可以实现200倍加速比,以前CPU来做是一周才有结果,现在就只一个小时就可以做同样的事情。或者说因为现在要加速CUDA方针,一般要用集群的方法,现在GPU的话,可以用一片或者几片显卡就可以做到,这既降低了EDA的成本,又环保,当然也是一个非常好的解决方案。"

邓仰东表示,他计划在下一个学年在清华大学开设CUDA编程的课程供学生选修,清华大学将成为国内首个开设CUDA课程的大学。Sumit Gupta笑谈:"我们要让每个中国大学生都有一块自己的GPU Card"。设想我们的大学里的研究团队里面每个人都可以有一台桌面的超级计算机,而不是整个大学共享一台大的超级计算机,这将是多么惬意的一件事。