国家超级计算济南中心(简称:济南超算),于 2011 年 10 月由国家科技部批准成立,落地了国内第一台采用完全自主处理器的超级计算机。
建成全球首个超算科技园的济南超算,也一直积极布局围绕超算应用生态的产业升级,重视对学术科研的平台支撑能力的同时,推动成果转化,比如,与青云科技深度合作,联合算力服务创新。
依托新模式,算力资源随手可得
在资源平台建设上,济南超算主要围绕了五个平台进行规划建设,包括高性能计算、人工智能计算、云计算,与高性能计算紧密相关的工业仿真计算,以及围绕数据构建的数据存储与灾备平台。
整体建设思路遵循多元算力融合、混合异构融合。面向通用应用场景的超级计算集群,整体算力达到 60PFlos,存储容量达到 17PB,数据传输带宽达到 1TB。人工智能计算集群上达到 1000PFlos 规模,目前超过 2500 个节点。云计算集群现在覆盖从 IaaS、PaaS 到 SaaS,超过 60 种云服务。
依托青云 AI 智算平台,济南超算的“山河云”统一纳管了多种架构的服务器,形成资源的统一调度,所有产品与服务都能够在云端使用。在持续丰富超算应用与 AI 场景的同时,青云科技还支持了济南超算超 5,000 台桌面云。在边缘计算上,基于数据中心的物联网平台,济南超算与青云联合打造了边缘推理服务。
在整体网络建设资源方面,对外互联网出口网络带宽已超过 15Gbps。其中,网络接入主要基于青云智能广域网的能力。
最终,依托 AI 智算平台,济南超算实现了不同类型、不同性能的 IT 基础资源的统一纳管,也打破了传统 HPC 和 AI 算力的应用模式,实现了精准的计量计费与用户自助服务,大幅减少管理员的运营运维压力。
推进算力网络建设,支持全场景创新
济南超算自 2019 年起主导了覆盖全省的算力网络建设,到 2023 年底已经构建起山东 16 地市的“山东算网”,并陆续在科研、教育、工业、民生等领域的算力应用做落地、实施和验证,同时计划到 2025 年,打造面向黄河流域的算力平台,构筑 5ms 算力圈。
济南超算的算力服务主要围绕山东省内产业和山东规划建设的“大科学工程”展开。济南超算认为如果应用可以划分成工作流的形式,都是适合使用算力网络的。青云 AI 智算平台不仅支撑底层多元异构的资源调度,也在数据的存储、采集与流转等方面发挥了作用。
2021 年起开始运营的国家生态环境大数据超算云中心,为生态环境部提供各类高性能计算资源,支撑国家环境质量预测预报平台、北京冬奥会专项保障、山东省环保厅空气质量预测预报等。
济南超算支持了传统超算擅长的领域——高铁气动仿真。高速列车模型需要大量计算,如果专门自建高性能计算中心投入大、周期长。基于山河云,就能直接进行数值分析、与前期实车测试对照分析、确定合理仿真模型及优化方法等。
其中,山东电子政务云实现了云计算、高性能计算、人工智能计算集群之间的算力资源的弹性扩展,并且在山河云平台做了租户级的资源隔离,承载了约 30 个省直单位近 300 个政务信息系统上云,提供了超 120 项云服务。
济南超算与国家健康医疗大数据北方中心、省千佛山医院等单位合作,研发在线病理云标注系统、乳腺癌免疫组化 Her2 等级判断系统、病理切片质控系统,以人工智能赋能医养健康产业发展。
济南超算与空天院进行深度合作,建设了济南到北京的遥感专线,专门用于汇聚遥感数据,计算集群同时支撑针对遥感数据的分析处理。
济南超算基于青云 AI 智算的开放 PaaS 平台,打造了“水滴实验营”教学实训云平台,先后为十余家高校提供 10 万课时服务。
济南超算依托青云以及其他合作伙伴正在共同推进自然语言巨量模型训练的相关工作。
青云 AI 智算平台致力于打造算力中心建设运营的新模式,平台具备自主创新、功能完善、智能运维、成熟运营、开源开放、安全合规、中立可靠、灵活部署八大优势,助力济南超算实现了多元异构算力的统一管理,在算力调度、智简运维、生态建设等方面都发挥出了技术价值,济南超算建立并运营了面向全省多行业的算力服务平台,实现了经济价值与社会价值双收获。