10月份,在张家界召开的高性能计算学术年会上,公布了中国高性能计算机Top100排行榜。这一届的Top100榜单跟往届有一个十分明显的区别——一些互联网行业的机器也被列入Top100名单。
这意味着什么?对于高性能计算相关的厂商来说,互联网将成为高性能计算的另一片蓝海、兵家必争之地。
作为国内高性能计算的顶级玩家,曙光当然不会错过这场好戏,或者可以说,它早有预谋。高性能计算一直是曙光的支撑性的业务,随着曙光业务目标的不断提升,从10亿到50亿,高性能计算业务的营收当然也不能停留在现有的水平,曙光正在互联网、云计算等新领域探索机会,实现高性能计算新的突破。
“云计算、移动互联网带来的超算的新需求是我们必须要研究的。过去我们总是在想上海超算中心是怎么想的,近一两年来,我们一直在想百度是怎么想的,这也是曙光这两年来很关键的一个变化,”在HPC China 2012大会的采访中,曙光公司副总裁、研发中心总经理邵宗有如是告诉记者。
图1 曙光公司副总裁、研发中心总经理邵宗有
互联网行业到底哪些应用会需要用到高性能计算呢?我们常常认为高性能计算是阳春白雪,是那些传统高端领域的专利。对此,邵宗有表示,“互联网行业中,很多地方都需要对大量的数据处理和分析,比如搜索、电商的交易处理系统等等,这些应用跟传统的股票交易系统其实是不相上下的。高性能计算和分布式处理本身就没有特别严格的界限,互联网企业尽管价格竞争非常激烈,但是其系统的复杂度、精妙程度一点都不比传统的高性能计算差,一些互联网企业的数据中心包含几万台服务器。”
当人们纷纷谈论如何实现“百亿亿次计算”的时候,邵宗有已经把更多的精力投入了高性能计算在互联网行业的应用上,基于整机柜的优化方案、与百度的联合实验室等等。
系统设计新思路:整机柜模块HPC系统
整机柜模块HPC系统的设计灵感源于百度的系统结构,“互联网企业的系统规模相当大,百度现在就有好几万台服务器,着眼一个一个节点,就太细了,做起来就会非常地复杂。我们未来要着眼一个一个的机柜,从增强整个机柜的可靠性、功耗、性能的角度出发,解决这些问题”,邵宗有对记者解释道,这也是计算机领域解决问题经常用到的二叉树的思想,层级越多,树上的叶子也就越多,比如Cache的设计也就是采取了这样的思路,随着Cache容量的增加,Cache从一层Cache演变成三层Cache。
图2 曙光整机柜模块HPC系统
邵宗有也非常坦白地告诉记者,整机柜模块HPC系统的投入非常大,意味着要重做所有的模块,包括交换模块、存储模块、计算模块,一共差不多十来种模块。如果没有用户的支持,很难投入那么大。更重要的是,大数据、云计算给高性能计算机带来了一个非常广阔的市场。
当然,从另一个角度看,新的系统设计思路也让高性能计算向百亿亿次迈出了非常重要的一步。无论是从可靠性、管理,还是功耗方面,都能够得到改善。
除了整机柜模块HPC系统之外,曙光还在跟百度联合建立高性能计算联合实验室,共同研究面向互联网的计算的特殊需求,包括游戏、电子商务等。据悉,联合实验室占地500平米,两三个月后就能够建起来了。邵宗有表示,曙光将会投入大量的人力物力。
超强的定制能力 满足互联网行业的特殊需求
互联网行业对于计算机的定制化需求非常高,通用计算机很难满足互联网巨头的需求,Google、Amazon、FaceBook等都是自己定制的服务器,曙光就是依靠自身超强的定制能力在互联网行业占有一席之地,因为,国外的企业不可能到中国来给它们定制,而国内技术实力不强的企业也定制不出来。
“其实整机柜交付的计算系统其实就是互联网企业的特殊需求,因为只有互联网企业才会部署到上万个节点,没有哪一个超算中心会部署一万个节点”,邵宗有谈道,在机器设计时,就充分考虑到互联网企业的需求,同时定制计算模块、供电方案、交换方案、散热方案等等。对于计算模块来说,传统的超算领域不需要其他的模块,互联网领域可能用到基于ARM处理器,基于MIC处理器,甚至基于国产CPU等等。
“过去我们总是在想上海超算中心是怎么想的,近一两年来,我们一直在想百度是怎么想的,这也是曙光这两年来很关键的一个变化。”
担起民族使命 构建HPC生态系统
“作为HPC领域当之无愧的国产领导企业,曙光的最终目标不是去掠夺市场,而是需要去培育市场,在国内构建一个良好的高性能计算生态系统。”
事实上,国内市场的培育工作往往都是由国外企业来做,高性能计算领域之前就是IBM等厂商做的比较多。从曙光自己办超算大会,到曙光跟大学合作让他们去开设并行编程、CUDA编程的课,包括把超级计算机推进到IDC,推进到云计算,这都是曙光站在行业领军者的位置上,去打造的生态系统。只有这样,才能支撑未来高性能计算机的高速发展。邵宗有强调,“为什么参加SC12比赛?一个队去参赛,至少有一百个队来选拔吧?一个队5个人,这就500个人,这就是未来的500个潜在用户啊。”
除此之外,曙光还有一个任重而道远的目标——提升高性能计算机的国产化比率。“一个高性能计算机几十个亿,光是CPU就买了6、7个亿,这相当于科技部直接把钱拨给了国外,我们辛辛苦苦争取的项目,却不得不把很大一部分收入直接拨给国外。作为一个自主可控的企业,我们会想尽一切办法在保证用户性能、应用前提下,提升国产比率”,邵总的话语简洁却很有力。
据透露,龙芯3C现在正在调试,按照曙光的想法,有望今年做出来。