高性能计算正在走下神坛,大规模应用仍需时日

在“大众创业、万众创新”的趋势下,高性能计算技术的不断发展,也开始影响着更多行业竞争力的提升。

发挥高性能计算的独特价值,落实解决方案并开拓新的发展模式,已经成为各行各业在未来十年中的发展方向及关注热点。

高性能计算凭借其强大的计算能力,将为更多的行业和企业所应用,帮助他们轻松应对不断增长的业务挑战,并以最快的方式在激烈的行业竞争中创造商业价值。

AA

专家聚集,探讨高性能计算技术发展与应用前景。

高性能计算应用日趋广泛

传统的高性能计算主要应用于教育、科研领域,在石油勘探、生命科学和实时金融服务等传统行业也有众多耳熟能详的应用。高性能计算涉及十多个子行业,但无论是在设备规模、用户数、运行量方面,无论是在科研还是实际应用方面,美国、德国和日本每年都垄断了前三名。

国内的应用也在逐步的深入。

大范围影响全国的雾霾正在严重影响公众健康和生产生活质量,是当前我国关注的热点话题之一;如何利用先进的技术手段监测并探索大气污染成因已成为当前最迫切需解决的难题。借助于高性能集群,中国科学院大气物理研究所实现了未来七天的空气质量预报和污染来源解析,为各地环保部门提供可靠的实施方案和经验。

移动终端的普及、社交网络的扩散以及物联网的广泛应用,带来了数据爆炸式的增长与相应的大数据和分析需求压力,高性能计算被越来越多的行业企业采用。

例如,在机器学习领域,科大讯飞取得了突破式进展,在制造业CAE领域,中国商飞大量用于数字模拟,在手机里的扬声器或者耳机研发,或者半导体工艺制程,瑞声科技、中芯国际也是专业级的用户。结合“中国制造2025”和产业升级需求,高性能计算的发展潜力还将与日俱增。

互联网企业青睐高性能计算

值得注意的是,很多互联网企业意识到了高性能计算对他们下一步的发展的价值,Facebook成立了HPC工作组,百度正在计划建造一台性能达7千万亿次)(7Pflops)的超算系统,用于语音助手和图片搜索领域,这方面谷歌已经抢先了一步;京东则正在积极用于机器学习等方面的研究;阿里云基于公共云平台的高性能计算产品也正式对外商用,用户可通过阿里云官网购买GPU服务器实例。

对传统高性能计算行业来说这是个好事,一方说明高性能计算的市场在不断扩大,另一方面也意味着高性能计算正在走下神坛、走向大众化,这样也才能得到更理想和更广泛的应用。

此举将推进高性能计算的发展更加专业和深入。

与传统高性能计算大多是在开源环境运行,关注的是浮点运算值、Linpack以及TOP500的排名位置不同,企业级高性能计算运行于多种环境,或采用商业软件,或自行开发,由于投资主体是企业本身,因此更关心应用的效果、更关注投入产出比。

云上高性能计算平台,前景尚未明朗

由于资投入、使用效率、能耗等的问题,限制了大部分企业对于高性能计算的应用。但对于不差钱的互联网企业而言,这些都不是问题。

而互联网企业往往都是基于云计算的应用,因此他们的高性能计算大都是以云上的架构(HPC in cloud)来提供服务。

例如,刚刚上线的阿里云高性能计算平台,为用户提供专属100%物理机,CPU、GPU不会发生争抢,保证无性能波动,没有虚拟化开销。据测算,假如有200万张图片需要学习,用一台双路E5-2650 v2的服务器训练需要16天时间,而如果用阿里云双GPU物理机仅需要1天。

云上高性能计算的确有不少优势,但这是否意味着将来传统企业不用再投资建设数据中心,而是采用按需收费的方式,结论还为时过早。

大量互联网企业之所以关注和采用高性能计算,是因为云的架构不能解决所有的问题。

撇开数据安全问题,最关键的就是传输的延迟,在数据量巨大的时候,就要考虑是否会影响到业务的正常进行。相比业务受影响,绝大部分用户是不会因为运营成本的降低而放弃传统高能性计算平台的。

另外,传统的高性能计算的服务对象多是科研人员,实时互动对他们来说也非常重要。这也是云平台的一个短板。

普遍认为,云端超算中心是一个创新的业务模式,但具体效果还需要时间来检验。如何提供物超所值的服务,怎样与用户更加密切互动,这是互联网企业正在积极探索解决的问题。

借鉴国外应用,提升国内水平

日本政府鼓励产学研相结合,鼓励企业应用国家级的超算中心,方式是对哪些公开成果的应用收费要低3倍以上。

“国内的超算中心,包括高校的超算中心大多局限于开发领域,应当借鉴美日的发展模式做更多有意义的工作。”上海交通大学高性能计算中心副主任林新华博士表示,一味照搬照抄肯定是不可取的,但以往多年实际上也只是学到一些皮毛,甚至有些走样。

Hisilicon Balong

上海交通大学高性能计算中心副主任林新华博士。

林新华认为,资金、人才、软件的缺乏,拖了我国高性能计算发展的后腿。国外开发运维一体化的趋势短期在国内还很难实现。他建议国家建立长远规划,把分散的硬件、软件、人才以灵活的体制机制像容器一样融合在一起,一方面,发展自主芯片产品,不完全依附于某一家厂商,坚持两条腿走路,另一方面加大投入力度、加快行业应用,效果一定会大大改观。

在运维方面,林新华正尝试采取收费的方式。他解释说收费的目的一是防止滥用,二是适当补贴运维成本。上海交大校级超算中心侧重于校内师生使用,虽然已经面向社会,让他深感不足的是参与者寥寥。

高性能计算和大数据的融合理念最早是日本东京一所高校的教授提出的,但实际上二者还是没有真正融合,林新华也不确定大数据对高性能计算能带来哪些影响。

巩固生态建设,引领产业发展

在高性能计算的实际应用中,计算、存储、网络、软件等不同领域的“短板”却一直在影响着整体系统的计算能力。

作为高性能计算领域的创新引领者和推动者,英特尔近年来推出了英特尔至强处理器,至强融核处理器(Xeon Phi)、3D XPoint全新非易失性存储技术、可扩展系统框架(英特尔SSF)以Omni-Path架构(Intel OPA)等众多创新产品和技术,能够从各个环节优化系统,弥补系统“短板”,真正提升高性能计算系统的整体功效,以满足企业对应用模式和计算效率的急切需求,并推动高性能计算解决方案的创新发展。

上海交大超算中心作为英特尔非常重要的客户及合作伙伴,在教育和科研的层面,市场份额始终处于前三位,为国内众多跃跃欲试的985和211大学做出了非常好的范例。

在英特尔的支持下,上海交大正在致力推动校级平台上的开放和创新,探索未来超算体系新架构,并且加快其与工业界的合作,力图走出一条新路子,产生出世界上最好的、最高水平的成果,让高性能计算走入实际生活中。

“英特尔关注高性能计算在中国的发展,正在努力营造良好的生态系统、提供更好的产品和服务,提升中国未来高性能计算水平。”英特尔相关人士表示,英特尔将协调各个领域的性能并推动创新,推动高性能计算的快速发展和广泛应用。