“中国天眼”再提速,让FAST更FAST的秘诀何在?

近日,全球最灵敏、最大单口径、具有我国自主知识产权的球面射电望远镜(简称:FAST)–“中国天眼”又迎来新进展:其数据中心已经顺利完成升级。“中国天眼”作为新基建的代表,目的是建立起世界领先的天文研究基础设施,此次数据中心的升级意味着“中国天眼”距构建起观测、科研、数据三大完整科学研究框架又迈进坚实一步。

浪潮存储承载中国天眼的海量数据(图片来源:国家天文台)

中国天眼:新基建的典型代表

“中国天眼”位于贵州平塘县克度镇深山里的“大窝凼”,坐落在几百万年前形成的喀斯特丘陵中,从山顶向下看,就像一口“大锅”,其口径达到500米;其球状反射面相当于30个足球场,从底部到顶部垂直高度138米,超过世界上最大的胡夫金字塔。

作为涉及到天文、力学、材料、机械、无线电、IT等多个领域的科技基础设施,“中国天眼”不仅是中国科学家砥砺奋斗二十余载的成果,更是中国在科技基础设施领域的一次突破。国家发改委近日明确指出新型基础设施的范围,其中创新基础设施是指支撑科学研究、技术开发、产品研制的具有公益属性的基础设施,像“中国天眼”这种重大科技基础设无疑是新基建的典型代表。

自2020年1月11日正式投入运营以来,“中国天眼”已发现132颗优质的脉冲星候选体,其中有93颗已被确认为新发现的脉冲星。中国天眼项目科学家李菂表示,“FAST是目前世界上灵敏度最高的射电望远镜,是美国阿雷西博望远镜的2.5倍以上,巡天速度是阿雷西博的10倍。FAST预计对国际同类设备至少可以保持二十年以上的领先地位。”

更加重要的是,“中国天眼”正在着手建起观测、科研、数据三大完整科学研究框架,将天文学研究与数字化技术紧密结合,对长期运行产生的海量数据进行存储与计算分析,加速我国在天文学前沿科技领域更深层次课题的研究步伐,彻底摆脱我国天文学研究过去借用国外设备、只能研究边缘课题的局面。

科研数据的要素属性日益凸显

数据作为新型生产要素,其重要性正在各行各业凸显。根据最新的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,数据要素成为除土地、劳动力、技术之外的新增要素,数据生产要素不仅在业界形成广泛共识,也从政策上获得了国家背书。

科研数据作为支撑国家科技创新的战略资源,正在成为科学研究与发现的新型驱动力,是科研领域重要的生产要素。科研数据往往具有数据密集型范式的特点,具有不可重复性、高度不确定性、高维、计算高度复杂等特征,科研人员需要利用大量数据的相关性、可取代因果关系和理论与模型,基于数据间的相关性能够获得新知识、新发现。

以“中国天眼”为例,它就是人类认知宇宙万物的一双眼睛,通过不断观测宇宙暗物质、暗能量等各种信息来开展从宇宙起源到星际物质结构的探索。自正式投入科学观测以来,“中国天眼”每天产生约500TB零级未压缩数据,然后通过高速网络将数据传输至数据中心进行存储和处理,支撑起相关的科研工作。中科院国家天文台副台长郑晓年表示,预计FAST未来十年的数据量将超过100PB。

随着数据在科研领域的生产要素属性日渐显现,科研数据的高质量与完整性在“中国天眼”的日常科研工作中已经变得至关重要。数据正在深刻改变“中国天眼”科研模式,引领着现代天文研究的最新发展趋势。

让FAST更FAST的秘诀何在

而随着时间推移和科研任务的深入,“中国天眼”不断产生海量数据,对存储容量、性能的需求也在不断增长。为此,国家天文台近年来持续推进FAST科研数据中心建设。在最近一次升级中,国家天文台携手浪潮存储,以分布式存储AS13000G5构建30PB可用容量、50GB带宽的天文大数据平台,为中国天眼的天文大数据存储、处理和实时分析提供有力支撑。

浪潮存储

此次,浪潮存储的作用不仅是让中国天眼“装得下”数据,更成为天文大数据分析的“加速器”,在宇宙未知领域探索中发挥积极影响。在中国天眼项目中,浪潮存储独创性地在一套分布式存储平台里部署了面向HPC和AI应用的H节点和面向高密度场景的M60两种节点,实现冷热数据分级存储,高性能节点提升天文大数据处理和分析的效率;高密度节点实现单节点容量接近1PB,提供海量存储空间;并且,不同层级存储之间能够根据天文业务需求实现数据自由流动,带来更加快捷的科研体验。

中国天眼数据中心专家表示,“这次和浪潮存储的合作让我们印象深刻,浪潮存储不仅有硬核产品,还有专业生产、交付团队。即使在疫情这样的特殊情况下,浪潮存储仍然能够推进项目提前上线,这超出了我们的预期”。

未来,随着“中国天眼”观测、科研、数据三大完整科学研究框架加速建成,我国的天文科研实力必然会再上一个台阶,在浩瀚宇宙中展现出中国科研的实力。