DOSTOR存储在线 7月16日原创报道: 说起今年存储圈儿里最火热的话题,非大数据莫属。当这股由大洋彼岸掀起的讨论风潮传到中国大陆时,人们对大数据充满了好奇与期盼。大数据能否解决数据量激增、大量非结构化数据分析处理的难题?大数据的潮流将对存储业界的哪些细分领域造成何种影响?带着这些问题,记者参加了日前于北京举行的BIG DATA world forum 2011,并有幸参访了出席本次大会并做主题演讲的EMC卓越研发集团首席技术官陶波,就有关大数据的诸多问题予以解答。
EMC是大数据领域的倡导者,并推出了EMC HADOOP企业版、EMC GREENPLUM数据库、。EMC GREENPLUM社区版等多个相关产品。据陶波介绍,从市场接受情况来看,一些数据量较大的行业走在前面,比如金融、电信、大型电子商务网站(比如淘宝)等等。站在用户的角度,大数据解决方案的魅力在于能够解决数据激增(尤其是非结构化数据处理)的难题,此外,数据分析所带来的经济价值也十分明显。对此,陶波举的例子很有说服力:“美国有一个租DVD的机构,他每年有一个竞赛,花一百万美元给作出最好算法的人,类似协同过滤网。你买一个DVD之后,你还有可能买其他DVD,他邀请世界上最聪明的人来做数据分析,看他们最喜欢什么样的。纽约交易所都在做这样的事情,他有大量的金融数据,他们现在就在做一个应用就是分析及服务,然后可以卖出,证券商也好,或者所有对数据感兴趣的人也好,卖给你们之后希望可以提高可用价值,这个价值是有用的。”
另外,大数据在带来诸多改变的同时,也不可避免的面临着一些风险和安全问题。对此,陶波为想要试水大数据的企业用户给出了一些建议:“如果你的大数据分析是在自己防火墙里面进行的,在企业内部进行的就还好。如果你将来分析即服务,真的给防火墙外面的人提供服务的时候,在安全方面要求是很高的。”
站在存储技术革新发展的角度,我们更关心大数据会对现有的存储系统(尤其是后端存储)带来哪些改变。“现有的存储系统会有两方面的挑战,”陶波解释说,“第一个挑战是大家会对这种文本式的存储,看的特别重要,NAS这个市场增长是非常大的。第二个在存储上的变化是它对于不同的数据库的支持性能会有很高的要求,他们还是跟传统数据库是不太一样的。包括运用一些闪存技术,进行性能优化,对于一些关键词的操作是不一样的。”
在大数据受到越来越多关注的同时,云计算依旧十分火热。那么对中国企业而言,云计算和大数据哪个会先被接受呢?对此,陶波回答说:“我觉得云计算跟大数据是垂直关系,很难讲具体哪个市场会先起来。也很有意思,对于我们来讲两者都需要,数据库云做大数据分析的,还有做传统的事务型的云计算,这也说明我们是两条腿走路。”
近来,业界猜测EMC是否会开始逐渐关注服务器存储统一化,做标准整合。对此,陶波透露了EMC的下一步动向:“EMC会有基于闪存的一些技术上的引进,应该很快会面市,它不是服务器,但是会帮助提高一些计算,或者是在存储体上做,或者利用新的闪存,提高性能。”