任新勃 发表于:14年12月10日 16:00 [综述] DOIT.com.cn
随着新一代测序技术的飞速发展,人类发现的基因序列数目以指数级增长,对于如此数量庞大的基因进行同源性搜寻、比对、分析、遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量,使众多生物企业和科研机构面临着强大的存储需求。
极大容量及高扩展性。基因研究产生的数据正以每12-18个月10倍的速度快速增长,并且这些数据还需要永久保存,这就要求存储系统具备海量容量及高扩展性。
高并发处理能力。基因研究应用软件数量巨大,要在分析处理阶段保证执行应用程序的读/写性能,这就需要存储系统能提供高带宽应对高IO密集型运算。
安全高可靠。如何保证输入(原始)数据的万无一失,如何确保存储系统的可靠稳定,以及如何保证数据生命周期内的安全,也是行业用户最为关注的。
管理简单。要确保集群中的节点都能正常工作,管理员必须能实时监控系统运行状态,出现错误及时定位并采取补救措施。此外,系统升级、备份、打补丁等操作也要简单快捷。
中博集群存储满足生物基因对存储的极高应用需求
中博集群存储系统采用统一命名空间的分布式文件系统,克服物理机架和模块的限制,通过增加存储节点来实现性能和容量的独立升级,从而解决海量数据的存储、消除I/O瓶颈,实现数据存储安全、降低升级运维复杂度,满足生物基因对存储的极高应用需求。
与传统存储相比,中博集群存储优势显而易见
高性能
中博集群存储采用高速的并行计算,将大量的数据I/O请求分散到多个存储节点上共同完成,克服了传统存储单一出口点所造成的性能瓶颈,并使I/O读写性能成倍提升,可提供超过100GB/S的聚合带宽,满足生物基因每天成百上千个应用程序高并发访问的需求。
高扩展
中博集群存储支持在线平滑扩容,直接添加存储节点即可,不影响前端业务的正常运行,容量可扩展至PB、EB级,且性能会随容量的增加而直线提升,轻松应对行业用户业务不断增长对存储的更高要求;整个存储系统采用单一命名空间,统一管理所有存储节点,可将多台异构存储设备的存储空间聚合成一个存储池,很好地保护已有投资。
易管理
传统存储部署流程复杂,并且每增加一套设备就要多管理一套设备,管理难度随着容量扩展越来越大。相比之下,中博集群存储安装部署十分方便,只需对硬件连接、网络配置就能交付使用;运维工作也很简单轻松,存储节点增加不会给管理带来任何压力,始终只需对一套设备进行管理维护即可。
安全可靠
中博集群存储采用多级副本技术,副本数量自定义,可实现50%的节点宕机无影响,满足生物基因行业高性能计算环境的需求。当某个节点宕掉时,系统能够自动判断文件的哪些部分受到故障影响,并让多个节点参与受影响文件的重建,对前端应用与系统性能基本无影响,重建速度是RAID的几十倍。