曙光ParaStor破解宣武医院海量存储需求

身处信息爆炸时代,海量数据的获取、存储和处理成为科研工作者们面临的第一道坎。专注于神经科学和老年医学领域的研究,首都医科大学宣武医院历经几十年发展,业已成为国家重点神经疾病医学中心和神经病学研究所。然而,传统数据存储和处理已无法满足日益增长的科研需求,科研成本也在逐年上涨。

面对海量数据存算需求,曙光存储积极布局先进存力,打造神经疾病遗传学全基因组数据研究高端计算平台。其中,曙光ParaStor300S分布式存储系统作为专为海量数据存储而设计的高端存储设备,兼具高带宽、低延迟、扩展性强、灵活管理等多重优势。

海量存储,高效访问

在医院神经系统研究过程中,高聚合带宽、高并发、小文件IO带宽等高效数据处理场景时有发生。为确保存储子系统在高负载的情况下仍稳定高带宽和低延时,加速计算任务执行,曙光ParaStor300S分布式存储系统提供PB级海量存储资源池,通过优化数据读写操作和动态申请内容的方式,提高序列数据库访问命中率,助力医院神经疾病研究工作高效进行。

无限扩展,自动迁移

面对医院容量无限扩展的需求,曙光ParaStor300S单一集群支持3-4096个节点,提供EB级存储空间。目前单人全基因数据原始数据量约50G,科研过程数据约200G,样本量预计达到数千个,总数据量约为2PB。同时,系统可采用横向扩展及在线扩展方式,实现性能容量线性增加。通过分级存储功能,平台可以实现冷热数据自动迁移至相对应的介质中,轻松实现医院未来扩容及数据迁移的需求。

机制完善,灵活管理

曙光ParaStor300S具备完善的权限控制机制,可以实现医院神经疾病研究团队对存储数据的灵活管理与控制。支持不同用户的读、写、删、查等各类权限组合,保障研究团队安全访问存储资源,有效管理数据访问权限,提升数据安全性和管理效率,助力医院神经疾病研究工作顺利进行。

目前,该高端计算平台已用于高通量基因组学数据处理与智能病理影像识别分析,可深入推进神经病理、神经康复、神经医学影像等多学科研究。依托曙光存储先进存力,平台还可支持国家人类遗传资源数据及生物信息大数据的汇聚、存储与管理,有效提高精准医疗领域的开发效率及科研质量,缩短科研周期、降低科研成本,助力神经科学研究迈向新的高度。