信息化离不开数据中心,同理,缺乏云存储就意味着不是完整意义上的云计算。云存储是在云计算基础上衍生出的一种新概念和技术解决方案,它利用集群应用、网格技术或分布式文件系统等功能,将网络中各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能。
云存储是在云计算发展的过程中,以数据存储为核心的云服务形态出现。对于企业来讲,云存储可以有效解决如何存储和访问越来越多的数据的问题。
通过云存储平台,用户无需关注存储设备的空间大小和存放位置,甚至无需了解存储服务器的安全性和稳定性,因而也就省却了存储设备的管理和维护环节,也减少了数据灾备问题带来的困恼。因为用户所使用的,并不是某个存储设备,而是整个云存储系统的数据访问服务,用户只需要将数据存放在云端就可以实现云存储功能。
所以,用户使用的云存储,本质上就是一种云存储的服务,而不是传统意义上的数据存储。它通过应用软件和存储设备的结合,实现存储设备向存储服务的转变。用户可以在任何地方在任何时候,通过网络与云存储进行连接,并对云存储中的数据进行访问等各项操作。
云存储在未来发展道路上,也有着十分广阔的应用前景。据有关专业机构分析,今后五年内中国数据中心服务市场份额增长将超过19亿美元。而IDC也预测,到2020年全球产生的信息总量将达到35 ZB (1ZB=1000EB=1000000PB=1000000000TB),而在2010年这一数字却仅为1.2 ZB。越来越发达的信息社会,势必将产生更多的数据,同时也要求有更具扩展性的云存储架构和强大可靠的解决方案来保证海量数据的存储访问需要。
任何一种解决方案的设计出台,都是为了满足某种实际应用的需要,云存储领域也是如此。我们在设计云存储解决方案的时候,首先需要了解当前和未来数据存储的应用需求,洞悉云存储数据的规模和类型,只有这样才会有助于我们设计尽量贴近实际需求的解决方案。
权威机构IDC有一份关于2010-2014年全球数据增长趋势的分析报告,报告显示,全球数据从2009年到2014年将面临爆炸式增长,数据总量将从2009年的10EB增长到2014年的70+EB,其中结构化数据增长仅占其中一小部分,绝大部分都是数据仓库和非结构化数据增长。而数据恢复、效率和数字化也正在改变企业对存储系统的需求。
相对于结构化数据而言,文件归档和图片、视频等数据应用的非结构化数据和内容仓库,在实际应用中也更为普遍。另外,目前迁移到云平台的数据也主要是非结构化数据。这种以非结构化数据和内容仓库为主的高级数据应用特点,决定了云存储的目标要以这些高级、复杂的数据应用为重点,而这一目标又决定了云存储服务中的两种云架构体系:高性能存储和容量存储。
高性能存储主要针对联机事务处理和联机分析处理(OLTP和OLAP)等企业数据库业务应用,通常来说,企业员工可以通过VPN或者LAN进行访问。而容量存储主要应用在备份和归档方面,它可以通过Web服务器以内容交付网络的形式向终端或者企业客户开放。
前面我们提到,高性能存储和容量存储两种主要的云存储需求模式,前者为高性能应用,例如数据库应用和IOPS,要求低延时和高IOPS;后者则为容量型应用,例如对象存储和备份归档。
我们以性能和容量两个维度对云存储需求模式进行划分。性能要求最高的为企业数据库(OLTP和OLAP应用),其次为内容分发网络、应用数据存储、大型关系数据库,而从容量角度来看,数据存储要求空间最大的当属服务器与客户端的文件备份和归档,其次则为对象存储和高性能计算、大型分析工具。
随着英特尔公司本月初推出至强E7处理器平台,X86服务器的处理能力又有了一个质的飞跃。众所周知,X86架构为融合提供基础,随着最新至强E7平台的推出,X86架构不仅仅在服务器上将获得更大的成功,很多存储架构也日趋采用英特尔处理器,这样一来,它将有助于新融合存储服务器对云存储使用模式进行优化。
新至强E7硬件平台,将为云存储不同模式提供对应的硬件解决方案。
对于性能要求比较高的云存储使用模式,可以采用英特尔多插槽式的多核至强处理器平台,并配以超高速以太网结构支持用户网络访问和数据存储需要。而更注重数据存储容量的使用模式,则可以把重点放在存储介质方面,比如可以灵活采用低功耗、轻便易用的NAND闪存,也可以使用稳定可靠的SATA和HDD存储,满足海量数据存储访问需要。
在IDF2011技术课程上,英特尔提供了存储融合服务器在成本、电源、性能和可靠性方面的对比分析,图中展示的是融合服务器的硬件配置方案,以及相应的成本对比。
针对大型对象存储,英特尔公司推出了采用EMC和Oxygen产品的云存储解决方案。从图中我们可以看出,客户端需要通过防火墙才能访问云端,在获得云端的授权之后,接收来自云的数据包,同时这两个数据中心在接收云端指示后,允许客户端对数据中心进行数据存储和访问的操作。
针对应用数据存储、较大对象存储和备份/归档存储使用模式的云存储解决方案:
基于EMC和Atoms的云存储(图片来源:Intel)
融合存储服务器组件(图片来源:Intel)
上图中显示的是,采用EMC*1U服务器、适用较大对象存储的云存储解决方案。
采用下一代至强处理器平台,优惠存储容量的参考架构,下面分别展示的是较大对象存储、备份归档存储和大规模分析Hadoop使用模式。
较大对象存储使用模式(图片来源:Intel)
备份归档存储使用模式
大规模分析Hadoop使用模式
结论:
最新一代至强处理器平台,针对云存储可以提供更加出色的性能和能源效率,采用英特尔平台的融合存储服务器可以提供更加高效的存储解决方案,还可以对应用模式不断进行优化。