专访:千万亿次计算时代的挑战与趋势

DOIT多易网 原创报道: 在10月29日公布的报告《2009年中国高性能计算机发展趋势分析与展望》中,中国高性能计算排行榜TOP100的作者张云泉正式公布了2009年度的最新榜单,中国国产高性能计算系统无论是数量、性能和效率上都有所提高,除国防科技大学所设计制造的天河一号以超过千万亿次的性能位居第一,引起媒体的强烈关注之外,国产服务器品牌首次超过国际大厂IBM的上榜系统、中国国产高性能计算系统的比例增高、国产系统总体性能超过国外系统19%等亮点也吸引了人们对中国高性能计算的更大关注。

除高性能计算系统(以下简称HPC)制造商之外,77套基于英特尔处理器的HPC系统的上榜,也引起了业界的诸多关注,这不仅仅在于英特尔为这77套HPC系统提供了核心处理器——尤其是英特尔新一代的Nehalem-EP,至强5500系列处理器,更重要的是,英特尔继续在中国TOP100排行榜上扮演着复杂的角色。

作为全球最主要的微处理器供应商,英特尔在中国的TOP100设计研发过程中,扮演着包括HPC核心微处理器供应商、HPC系统研发设计合作方、基于应用的Linpack基准测试的推动者与设计者以及中国高性能计算个人化、普及化的倡导者等多个角色,而77套基于英特尔技术的HPC系统的上榜,便可说明这一切。

位于长沙星沙区的威尼斯酒店不仅见证了本年度TOP100排行榜的发布,更见证了英特尔与国内服务器厂商、高性能计算学术界的良好合作,以及对中国HPC事业的推动——英特尔与浪潮、曙光、联想及HPC领域的“新人”宝德的五位代表,共同接受了与会媒体的采访。

HPC需求增加 挑战多:要让用户“用得好,跑得快”

接受媒体采访的包括英特尔与OEM合作伙伴的代表——他们几乎代表了中国HPC行业最主流的商业供应商,其中除英特尔(中国)有限公司服务器产品事业部产品经理顾凡之外,来自HPC供应商的代表包括浪潮集团高性能服务器产品部总经理刘军、曙光公司产品部总经理李宁、有中国高性能计算第一人之称的联想首席科学家祝明发以及宝德公司新成立的高性能计算事业部的经理陈齐旺,浪潮、曙光、联想与宝德,四家服务器供应商构成了中国HPC领域商业系统的主要供应商。

浪潮的刘军与曙光的李宁在谈到中国HPC的发展时分别表示,非常高兴看到现在TOP100这样的发展,以及“替国产HPC争了一口气”的态度,并进而表示,这是中国国产厂商经过不懈努力达到的这样一个成就,而宝德的陈齐旺则表示,对于今年仅仅有三台系统上榜,去年才开始大规模做HPC的宝德来说,“基本上今天来是为了学习,”他谈到,中国的国产HPC已经获得了非常大的进步,作为国内的厂商,“宝德会尽全力在HPC做出自己的贡献。”

“像英特尔这样的芯片厂商和系统厂商经过共同努力,现在已经基本集群架构已经成为了主流。”联想首席科学家祝明发教授表示,现在HPC已经更多的偏向X86的集群架构,而英特尔处理器的推出更加快了这一步伐——对此,顾凡表示了赞同,并表示,“现在已经基本没有大型SMP系统的空间了。”

但是,针对中国HPC行业的发展,顾凡还是表达了其对未来发展的看法,他明确提到:“中国未来对HPC的需求未来会越来越大,但是挑战也会是越来越大。”

顾凡表示,中国的HPC与全球的HPC市场一样,基本上现在都处在高速增长的过程中,但是,对于中国的供应商来说,需求的庞大不仅仅代表着更多的商业机会,同样意味着,用户需求的提高——包括对性能、架构、自主知识产权、处理效率、绿色节能等方面的要求都越来越多,而用户已经不仅仅关注Linpack或是Peak值了。

从国外的TOP500能够看到,虽然对于产品的研发设计、市场推广等,各家OEM供应商都有自己的策略和不同的切入角度,但是对于中国高性能计算的未来发展,各家供应商基本上都在表达了对市场充满信心之外,谈到了中国HPC需要“团结求发展”的观点,并都表示,对于中国用户来说,做中国自己的HPC系统将是各家供应商的“重要目标”,但难度和挑战都将越来越大。

因此,作为HPC行业的推动者,英特尔与各家OEM合作伙伴在HPC领域的动向与合作,将是迎接未来发展挑战的最重要的基础,在本次大会上,除了继续推动对基于应用的Linpack测试的推动,以及探讨“如何让专家专于业务而不是HPC专家”等话题之外,顾凡表示,在座的英特尔的OEM合作伙伴是“离行业客户的需求是最近的”,推动HPC迎接挑战的办法最重要就是互相的合作。

“工具要想发挥威力就得走进应用中去,需要专家进去把应用特征找出来进行调优,工具交给OEM合作伙伴去帮助解决,英特尔要去扩展工具的应用范围。”顾凡表示,英特尔与OEM合作伙伴最重要的合作,就是让HPC成为工具,让应用利用好工具,让需要HPC的行业用户与专家的应用用好这个工具——“用得好,跑得快”有在座媒体记者总结道。

英特尔与OEM合作伙伴:解读“CPU+GPU”模式

本次TOP100最耀眼的“明星”当属国防科技大学为天津滨海新区设计制造的天河一号,在天河一号发布的第一时刻,包括新华社、中央电视台、人民日报、科技日报等国内权威媒体都做了大篇幅的报道,而国内的各家电视台、行业媒体的报道更是层出不穷??对于服务器行业的专业媒体来说,天河一号的重要意义并不仅仅仅在于“标志着我国继美国之后第二个迈入千万亿次计算机的大门”,更多的在于此前一直以来在国内颇为流行的“CPU+GPU”模式,已经不仅仅出现在个人HPC或是桌面HPC等应用中。

天河一号一跃而出,即掀起了专业媒体的“CPU+GPU”混合模式的大讨论,当然,媒体提问的焦点也积聚于此。

目前,国内的服务器厂商,如浪潮、曙光、联想和宝德,皆选择与国际上的GPU两大厂商nvdia和ATI进行合作,在个人超级计算机上,普遍采用CPU+GPU的混合计算方式,将GPU作为加速处理器,满足中低端,或称入门级HPC市场的用户需求,而反观英特尔,则在Larrabee推出前几乎很少提及。

针对有媒体记者提问有关国内服务器厂商对这种混合计算模式未来发展的考虑,宝德公司的陈齐旺的回答具有一定的代表性:“CPU+GPU的方案,推出后面向市场还是有评价,比较大的挑战是程序优化和编程方面,可能采用其它的方案。”来自浪潮公司的刘军也同时表示,无论是谁的解决方案,ATI也好,NVdia也罢,主要看使用环境,看编译环境好不好用,此外,他本人“更希望看到英特尔把Larrabee发布出来,桌面超算希望是Larrabee+CT的技术。”

曙光的李宁对于这个问题表示,她希望看到更加开放的环境,所有的使用者都会更在乎使用环境,不希望被另一种环境排至,专有的路会越走越困难,因此,曙光希望能够提供给用户多样化的选择。

一同参加专访的国内高性能计算领域资深专家,来自联想的祝明发教授表示,中科院已经准备推出一批CPU+GPU的桌面系统,他认为在高性能计算领域,中国新的千万亿次计算机天河一号的CPU+GPU模式已经说明,这是一条可以发展的道路。

而对于有关CPU+GPU模式的处理效能问题,在茶歇时服务器在线记者采访了来自中国科学院超级计算中心的专家,有专家表示,这样的模式目前遇到的最大问题是虽然能够将双精度计算量提升很高到PFlops,但问题是,现在包括中科院超算中心在内的很多机构和用户,还都没有适应混合计算模式的应用程序,这成为了CPU+GPU模式发展的最大障碍。

英特尔公司产品经理顾凡针对此问题表示,英特尔最关注的是是否有应用可以完全发挥HPC的性能,以及如何提高应用程序在HPC上的性能,英特尔将会在HPC领域发挥专长,让芯片技术以“可接受”的成本进入市场。

此前,顾凡曾经向媒体多次谈过被外界猜测,很可能与现有的ATI、NVIDIA的“CPU+GPU”混合模式竞争的Larrabee架构,顾凡曾表示,隶属英特尔万亿次计算机计划、英特尔第一款轻量级众核芯片产品Larrabee,单核性能更高,但由于集中在一个芯片上,所造成的能耗很小,再加上编程工具的易用性和兼容性,将充分解决目前困扰HPC的高能耗、高成本、并行难等难题,未来运用众核芯片,可将巨型HPC,缩小至一台冰箱、一台微波炉、甚至台式机那么大。

根据英特尔规划,第一款Larrabee架构的产品将是一块显卡,Larrabee最初的目标是推出一款PC用的高端GPU。通过进入高端图形处理器市场,英特尔希望把其在移动GPU市场中的优势延展到桌面游戏领域。

而外界专家普遍认为,假如英特尔能够实现这一目标,相信它还会进一步把这个平台推向HPC市场。凭借其矢量性能和X86兼容性,Larrabee会成为其他高端加速器产品的重要竞争对手,这些产品包括NVIDIA的Tesla(以及其他支持CUDA编程开发环境的GPU),AMD的FireStream GPU, Cell处理器系统,ClearSpeed协处理器以及FPGA加速器等等。跟其他产品不同,Larrabee由于把CPU的逻辑部件已经整合在了芯片上面,所以不再需要外部的主处理器(host processor )。

在此次采访上,顾凡针对“CPU+GPU”混合模式的话题,结合此前英特尔IDF大会上的“金箍棒”形象的再次做了一次解释,并表示英特尔不担心这样模式的影响,因为英特尔CPU加Infiniband的效率都能够达到80%到90%:“我们关心现在HPC效率有多少,永远没有完美的解决方案,不管是同构还是异构,英特尔已经证明X-Scale是可行的,英特尔希望能够以从小到大,让软件构成‘金箍棒’,让软件能够保证所有IA核心(的性能和效率)”

Windows与HPC架构:两个热门“老”话题

有媒体表示,在前20名中有多个基于工业游戏类的应用,排名非常靠前,从英特尔的角度来说,你觉得这个能不能反应未来一段时间国内高性能计算的趋势。

顾凡表示,与以太网和Infiniband“之争”一样,这两个问题都体现在到底什么是HPC,HPC是什么样的问题上,“我们还是需要界定一下高性能计算的范畴:跑的够快就可以放(到TOP100)上去,把传统的高性能计算的趋势和分布式计算分来来说,现在中国的服务器生意还不错,在金融危机的状况下,游戏手机等增长太快速,这种大规模分布式面临的挑战,能耗和密度都要考虑。”

顾凡表示,传统的HPC和大规模分布式计算是不同的,游戏行业的大规模分布式计算的应用计算起来是“切得很开的”,系统之间的互联分得很开,每个服务器,每个分布的应用之间是没有什么大的联系的,顾凡认为游戏系统更加倾向于性价比,而且应用类型和传统的高性能计算类型不一样。

“(我们还是要)回到传统,中国的高性能计算还有很长的一段路要走。”顾凡谈到。

此外,有媒体谈到有关IDC调查显示很多用linux的人到后来会想要使用Windows的话题,祝明发教授表示,“HPC用户入门从Windows开始是很正常的”但是现在还是要以科研计算为主。

顾凡对Windows在HPC上的发展趋势表达了乐观的看法,“我们可以套一个圈,圈住的都是我们这些做高性能计算的人,现在把这个圈放大,让更多的人加入进去。”顾凡认为,当“这个圈放大”之后,圈住的人自然用Windows的人会更多,英特尔希望用Windows让更多的用户加入到HPC的行列中来,“吸引外面的人进来,Windows门槛低,但应用同样是关键。”他谈到,针对并行程序设计的CT软件是英特尔的一个目标。

曙光公司的李宁同时表示,要更多的关注高效能应用,要突破应用软件的限制。