随着互联网的普及,全球每天产生超过500亿GB的数据。据专家预测,到2025年这一数据将超过4000亿GB。大数据的发展对于数据存储的需求与日俱增,也让存储系统处于前所未有的变革时期,寻找新的数据存储方式已经成为企业和个人的迫切需要。
传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。而分布式存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
分布式系统的出现,有效解决了数据的存储和管理难题,并逐步受到用户的青睐。本期大咖说,邀请到华云数据产品营销经理张开亮为大家带来“安超分布式文件系统介绍”。
精彩观点
1. 数字专项推动企业数据快速增长。根据IDC预测,未来五年,娱乐数据依然是最主要的数据创建类型,而来自生产/嵌⼊式数据,例如物联网、人工智能使用和创建的数据具有更高的增速,其占比将由2018年的15.3%增长到2023年的30.8%。随着生产/嵌入式数据的快速增长,IDC预计,2019年,企业创建的数据量将超过消费者所创建的体量,占整个数据圈的53.4%。
2. 目前,传统存储设备拥有诸多问题,如扩展能力有限、设计目标差异,文件系统功能较弱,可用性问题突出,总体拥有成本高等等。
3. 随着技术的发展,存储系统也发生了演变,如今的存储系统应用松耦合架构,采用通用商用部件和横向扩展方式,并在设计时充分考虑部件故障,这样不仅解决了数据的存放、保护和优化,还在数字经济迅猛膨胀的过程中,做到降低成本、高效率地存放。
4. 安超分布式文件系统是面向海量数据的新型企业级存储系统软件,部署于低成本的通用硬件的网络集群之上,管理并整合集群内所有存储资源,构建具有单一文件系统影像的数据存储空间。安超分布式文件系统通过良好设计的系统架构、数据分布与保护策略,为用户提供高性能、高可用、高可扩展,易于管理的海量数据存储系统。
5. 安超分布式文件系统运行于网络互连的集群系统之上,通过在不同节点之上安装安超分布式文件系统的逻辑部件,将所有节点的存储资源整合成一个单一文件系统空间。安超分布式文件系统包含了三个主要的逻辑部件:元数据服务器、数据服务器以及客户端。
6. 安超分布式文件系统的主要逻辑部件可根据应用的具体需求灵活部署,以适配不同类型的数据访问模式。为了兼容传统网络文件服务,安超分布式文件系统还支持NAS网关,通过该网关,可以将安超分布式文件系统以CIFS/NFS/FTP等传统网络文件协议的形式输出。在大多数操作系统上均有安装这些协议的客户端,因此大部分用户无需安装客户端软件即可访问安超分布式文件系统。
7. 安超分布式文件系统拥有很多优势。在高可扩展的弹性架构方面,安超分布式文件系统具有很好的弹性,在容量、性能和可管理性三个维度上具有线性扩展能力。用户可根据自身需求构建不同规模的安超分布式文件系统,通过简单的增加存储设备和处理节点以获得容量及性能的线性增长。
8. 在高可用、高可靠方面,安超分布式文件系统采用高效的数据复制以及智能的数据分布策略来保证数据可靠性和可用性。如将文件复制多个副本,分别存放在不同机架的不同服务器之上,保证用户数据不会丢失,同时,可通过副本自动恢复损坏的数据。
9. 在高性能方面,安超分布式文件系统应用数据分块、IO调度、缓存、预取、延迟写等技术,提供了出众的IO性能,不存在单点的性能瓶颈。另外,在安超分布式文件系统过载的情况下,性能下降幅度可控,不会出现常见的性能大幅下降甚至服务不可用的情况。
10. 在自动管理、自动修复、自动优化方面,安超分布式文件系统针对大规模系统中的故障特性进行分析和研究,设计了具有自修复、自管理和自优化的系统管理软件,最大程度减少系统管理员手中干预,极大的节省系统的管理维护成本。
11. 在丰富的接口支持方面,安超分布式文件系统提供传统的文件系统接口以兼容现有的应用程序,具有很好的跨平台性和互操作性。同时,还提供高效、易用的APIs接口、Hadoop DFS的接口,及离线的元数据SQL查询接口。
12. 目前,安超分布式文件系统已经被应用于科学计算、视频处理与视频服务、医疗影像、云计算与服务等多种类型的场景。经过长时间生产环境的验证,安超分布式文件系统已被证明是上述类型场景中行之有效的存储解决方案。