郑玮:PowerCenter大数据版释放大数据价值

Informatica将推出Informatica PowerCenter大数据版(Informatica PowerCenter Big Data Edition)。这是一项重要的革新,使企业能够高速、大量、多种类地将社交、移动设备、云以及机器中的数据增加到传统交易数据中。使用Hadoop等新型分析平台,PowerCenter大数据版是唯一将新兴技术与传统数据管理基础设施相结合,在充分释放大数据价值的同时降低大数据成本和风险的产品。

PowerCenter大数据版提供了一个创新且无需编码的环境,确保企业围绕诸如Hadoop等新型技术,通过高速数据存入和提取、无编码开发环境、虚拟数据机,以及在Hadoop上近乎通用的数据访问和全面地提取、转换和加载(ETL)来降低大数据项目的成本。

在近日的媒体见面会上,Informatica核心技术部资深产品管理总监郑玮就大数据以及相关话题发表自己的看法。

BI依然保持旺盛需求

郑玮女士表示,BI经历几年火热发展以后,现在随着大数据的出现企业对其依然保持着旺盛的需求。BI和ETL已经形成了很好的竞争,以前BI是从数据仓库中拿出数据来做分析,而现在,BI可以直接和Hadoop结合进行数据分析。

Hadoop和传统数据库配合使用

对于何时使用Hadoop,何时使用传统数据库,一直以来有一种传统的说法:如果数据是非结构的、半结构的,就一定要使用Hadoop;如果是结构的数据,就要使用传统数据库。但是郑玮女士表示,其实两种数据库是可以交叉使用的。在使用的过程中,只需要考虑数据量,以及是否是新建项目。比如,很多客户已经花费大量费用建立了数据库,而且具有良好的应用效果,那么,就没有必要换掉已经使用的数据库。如果是客户要上马新项目,就可以直接使用Hadoop。

硬件层面的数据分析

对于数据分析,现在不仅软件在进步,硬件上面也在发展,现在有很多内存的数据分析,对于那些没有PB级别数据的企业,可以选择这种内存的数据分析。Hadoop存放数据量很大,但数据是放在磁盘里的,数据分析速度会很慢,而把数据放到内存去分析,速度将会非常快,而且因为内存相对来讲价格低,所以还可以节约成本,现在很多公司喜欢用内存作分析。

郑玮女士还表示,亚洲拥有自然的大数据问题,不仅是从人口,还是从地域方面来看,数据量都会很大,数据的复杂性也会很高。特别是在中国,各种各样的大数据问题随处可见,而且在中国大数据将会拥有更多的机会。基于这种认识,Informatica明年将会增加中国的销售人员,并将更加关注中国市场。