据IDC预测,到2020年,全球数据总量将达到35ZB。大量的结构化数据、非结构化数据、半结构化数据,充斥着我们生活的方方面面。这些以井喷式增长的多样化数据信息,注定是要受到市场认可的,只要企业对这些海量信息进行分析处理、发掘其潜在价值并作出预测,那么这些数据信息将会成为企业内部的“灵魂”,重要决策的依据,亦会是企业取之不尽的巨大财富。
大数据势必改变世界
6年前,约翰·韦伯斯特(John Webster)和克里斯·斯塔库提斯(Chris Stakutis) 就联合撰写过一本名为《无所不包的数据》(Inescapable Data)的书,书中记载了他们与近50位企业家和高管的对话内容,主要是关于大规模收集数据如何改变他们的业务和生活的讨论。
早就有媒体撰文称“大数据革命彻底改变人类的生活,例如在副食店就可以询问家中的冰箱是否需要牛奶。走进鞋店后,一台无线设备就能测试你的鞋码和走路方式。”
也许,以上变化还未能全面映射真实世界。但着眼现在,社交网站Facebook每天产生32亿条消息,3亿张照片,每周新增图片总量达60TB.而提供云计算服务的亚马逊EC2,目前的服务器数量已达45万台。现在,社交网络,云计算,移动互联网,物联网,智能数据,智能城市,智慧城市等等都是产生大数据的来源。这些数据之大,让我们不得不把闪光灯照向它,因为,大数据已然改变了世界。
大数据如何改变世界
也许你会好奇,大数据的量是很大,但是人们为何如此热衷于对大数据的分析处理呢?它究竟有多重要呢?
索尼公司前首席执行官出井伸在谈到索尼衰落的原因时曾表示,新一代基于互联网基因的企业的核心能力,是利用新模式和新技术,更贴近消费者,更深刻理解需求,高效分析信息并作出判断,而像索尼这样传统的产品公司,则日渐沦为上述新兴平台级公司的附庸。可见,在出井伸的眼里,分析整理大数据的重要性和紧迫性。
另外一个正面的例子则来自电商企业京东商城。就在今年9月中下旬,京东商城在手机采购签约仪式上向外界透露了两大数据掘金“神器”:基于供应商开放平台的EDI电子数据交换系统,以及数据营销平台系统。实际上,京东商城京东商城图书类商品已经融入了EDI系统,目前的运行效果非常好。专业人士指出,EDI对于提高供应链管理效率、降低成本有至关重要的作用。它是指将双方业务数据通过标准数据格式自动传输给对方,减少人工介入,提高数据传输的准确性、时效性和安全性。这对于双方实时了解彼此的货存量等信息提供了平台,可有效减少信息沟通、库存冗余等带来的成本浪费。
数据统计显示,2012年上半年京东图书音像销售单月已过亿元,商品种类超过110万种,购买用户超过600万,今年图书音像部门实现的销售规模预计达15亿。EDI系统使整个图书品类周转天数得到大幅度降低,效果凸显。
而京东商城利用大数据平台营销,成功地找到了自己的潜在客户,在增加客户粘性和新用户人数方面获得大幅度提升。
另一则正面的例子来自纸业公司恒安国际。在一次免费派发自己的产品婴儿用纸尿裤时,正是由于成功应用了大数据技术,恒安国际成功地找到了自己潜在的客户,即那些准备生小孩的女性,从而提升了自己的品牌和销量。
可见,对大数据的分析处理确实是一项非常有商业价值、且不可替代的投资。
数据容灾备份遭遇三大挑战
随着大数据越发变得重要起来,人们开始担心,大数据时代,企业如何保护这些大数据,如何保证整体业务的连续性。此时,容灾备份映入人们的眼帘。但是,大数据的特点之一是数量非常大,这对于企业的业务系统处理能力要求相当高,这就导致企业的容灾备份会遭遇以下三个维度的挑战:
第一个维度,是从管理层面如何有效保障大数据时代的管理,以及企业的投资。
第二个维度,在大数据时代,企业的应用系统,包括后端数据保护层面,如何较为灵活的拓展成为一大挑战。现在传统的扩展更多的是基于存储或是基于纵向的扩展。因为大数据时代的来临,对业务系统后端的计算能力、吞吐能力要求更高,如何适应大数据时代的需求,是企业非常紧迫的需求。在性能伸缩性方面,如何提高业务,前端业务的处理能力,也很重要。
第三个维度、在单一的数据中心中大数据的规模,或是在多用户规模的情况下,如何保证整体的数据安全成为又一挑战。这种规模化的技术挑战,在大数据背景下面会有更大的数据量,会有更大的容量。在这个更大容量的背景下,是如何去保护这些数据,企业势必需要更小的备份窗口,以及计算的窗口,同时还需要更快的恢复方法,而且还需要更快的恢复效率,以及应用系统、数据恢复的有效性,这些都有待提高。同时,企业是否可以做到,当数据中心里有几十个TB数据,仍可以在很短时间内把这些数据处理完数据备份或是数据恢复。而且在短时间内修复完全或者备份完成,是大数据以后发展过程中,需要不断完备的方便。
小 结:
大数据改变了我们的世界,挖掘大数据的价值亦非常重要,如何做好容灾备份成为企业重中之重。企业要做到符合大数据时代发展的需求,就要走在大数据时代前沿,打造一个较以前更快的“引擎”, 即一体化容灾的“整体矩阵”,不要等大数据真正“爆发”时措手不及……