近日,广州市政协教科文卫体委组在广州“两会”期间就“进一步发挥‘天河二号’超级计算机应用效能”提交了提案。
在《南方日报》名为《广州政协:天河二号资源闲置令人揪心》的报道中,基于天河二号资源闲置问题,广州政协提案分析了国家超算广州中心存在体制、机制、运营等方面的问题,并提出了具体的建议。
广州政协委员的这个提案,从问题分析与解决方案来看,应该说是切中要害的。事实上,关于超算中心资源闲置的问题,此前不断见诸媒体。
其实,如果从国家级超算中心、地方超算中心的整体角度来看,广州政协的这个提案提出了一个基本命题:超算中心到底应该怎么定位?如何平衡超算中心的基本定位与市场化发展?
超算中心到底应该怎么定位
笔者在第一时间联系了中科院计算所研究员,中国计算机学会常务理事,高性能计算专委会秘书长张云泉,他表示:“国家不应该要求国家级超算中心走完全的市场化之路,因为它所支撑的科学计算等服务本身离市场就比较远,需要国家作为战略投入进行投资。超算的主要作用是长期的战略影响。”
笔者以为,这就是对国家级超算中心根本定位的恰当描述。如果超算中心偏离这一定位,走向完全的市场化,势必会影响其基本服务群体的服务质量。比如,当比较拮据的科研计算与商业计算需求撞车时,超算中心如何选择?
关于科学计算,以及高性能计算与云计算的区别与融合发展,这里不做探讨。笔者希望表达的是:超算是国家科技水平与综合国力的标志之一,其研发与应用能力的投入不宜纯粹商业化。如同我国在大飞机(航空)、航天、高铁等领域的长期坚持不懈的投入,才取得今天的成就,带动了相关产业的大发展。
“天河2号的计算能力全世界第一,确实很难在短时间内把它的计算能力全部发挥出来。但是,国家超算中心的运行情况大部分是健康的,都为当地的超算事业的发展和科学工程创新起到了推动和加速器的作用。比如上海超算、天津超算,运营非常饱满。”
国家级超算中心作为国家的战略资源,作为国家的基础设施,应该由国家为主每年拨付运维费用,而不是以市场为主来获取经费。比如,美、欧、日等国家的超算都是主要由国家提供经费运营的。
平衡基本定位与市场化运营
一个超算中心一年的运维(不含升级)费用数千万,恐怕这是超算中心“被逼无奈”想方设法“挣外快”的主要原因。这一点无可非议,这也带来“超算中心的基本定位与市场化运营”这一问题。
比如,当前的互联网公司利用超级计算进行深度学习的加速的应用,由于可以直接改进互联网的用户体验,提高产品的竞争力,超算中心完全可以对接这些需求进行市场化运营。
对于超算中心的运营,张云泉提出如下建议:
一方面,国家应该把国家级的超算中心纳入国家基础设施的范围,给以常年的基本运维费用,进行差额拨款。不足部分,由超算中心通过市场化运营补充。国家不能只提供购买机器的经费而不提供日常的运维和人员费用,把超算中心推向市场就不管不顾了。
另一方面,有很多的超算应用的用户是科研单位的科研人员和高校的教授,他们的科研经费有限,很少部分能用来购买机时费用,但是他们的科学问题又是战略科学问题,对这类用户,国家就应该提供很便宜的有补贴性质的机器时间给他们,鼓励他们把超级计算的能力发挥到极致,提高超计算计算资源的利用率。
“只要机时费用便宜,我相信把超级计算机的资源用满,应该不是很难的事情,难在很少有用户有那么多的经费去购买如此大规模超级计算机的机器时间。”张云泉说。
事实上,据笔者了解,众多超算中心连基本的科研需求支撑运营都没有做到,市场化运营之路也走得太快了吧?舍本逐末不应是超算中心的追求。
国外超算中心的运营经验
据介绍,目前世界上公认的国家级超级计算用的很好的是欧洲,特别是德国的超算中心。他们的经验是在购买超算的预算和设计阶段,就引入大企业作为超算中心的理事单位,由他们和当地政府联合出资建设超级计算机。等机器建成后,这些大企业有权利根据自己的出资情况,来使用超级计算机的资源。
这样,在建设之前,相当于把超算的机器时间提前销售出去,解决了后面再到处寻找用户的难题,而且有利于购买到合理规模的超计算计算机,避免了资源的空转,同时又直接推动了企业的创新。当然,这样做的前提是企业的创新水平要达到一定的高度,才能用到大规模的超级计算机。
再看看美国。美国的超级计算机的运营则采取了由国家完全买单的做法,机器的采购费用和运维,人员费用全部由能源部或NSF(美国国家卫生基金会)来提供,机器拥有者的任务就是把机器发挥到极致,避免资源闲置和浪费。也就是:能源部或NSF不会考核这些超算中心挣了多少机时费,而是考核他们服务了多少用户,产出了多少科研成果。这才是国家投资超算的目的所在。
当然,为了鼓励用户和科研工作者来使用超算,美国的NSF和欧盟的PRACE(欧洲高级计算合作伙伴计划)项目还会给项目申请者提供已经提前购买好的机时,与项目经费一起拨付给科研人员,这样保证了机时费能够用到应该用的地方,对超算中心也是很好的支持。
“这些国外超算的运营经验都值得我我们借鉴。”张云泉说。据介绍,事实上2015年开始,NSFC(中国国家自然科学基金会)也开始与广东省合作,推出了类似的机时基金,鼓励用户使用天河2号。
结束语
截至2015年,我国科技部批准建立的国家超级计算中心共有五家,分别是国家超级计算天津中心、广州中心、深圳中心、长沙中心和济南中心。目前,这些国家级超算中心是否以“运营”的思路,挖掘并服务于区域科学计算,尚不得而知。
事实上,从2002年开始发展的网格计算,陆续催生了一大批地方超算中心。发展到今天,随着云计算的兴起,这些地方超算中心已经基本“云计算”化了。
超算中心悄然转型,与应用需求密不可分。以深圳超算为例,目前深圳超算中心基本上是“以市场为导向”,为政府及企业提供云计算服务成为深圳超算的一大特点。你完全可以理解深圳超算是“超级云计算中心”。
机制、体制,对于超算中心来说,个人认为不是问题,这一点,广州政协委员的“建立企业服务机构”就是解决之道。问题在于:如果国家级超算中心都完全市场化了,那还是“国家级”吗?