Informatica孙大山谈大数据的投资回报

Informatica是一家专注于数据集成、数据管理领域的软件提供商,我们的宗旨也是帮助企业能够为我们企业当中的业务应用提供及时、快速、可靠、准确地数据。

Informatica中国区资深技术顾问孙大山认为通过以下几个步骤来进行大数据的管理。
第一就是数据访问,Informatica通过一个完整并且统一的平台来为我们提供了各式各样的数据访问接口,无论是传统的方式到云端的服务,无论从社交数据到移动计算,还是与企业合作伙伴之间灵活的数据交互,所有这些方面中所涉及到的数据的源、数据的位置,我们都有相应的接口进行覆盖,我们可以轻松通过一个单一的平台来实现所有数据源的接入以及访问。

第二,全新的数据探查的能力,我们可以在不同的数据实体当中发现具有相关性、相似性的业务实体或者说主数据实体,并且可以自动识别哪些数据属于敏感数据,属于需要我保护的,比如说对于企业的机密数据或者说一些客户的隐私数据等等,也可以做到自动的识别以及自动的脱密或者漂白的处理。

第三,数据对于我们来说最重要的一个用途就是用来进行数据分析并且指导我们企业的业务规划、战略规划,数据的分析基础是数据的质量,没有一个好的数据质量,你分析的结果也是完全不可用的,或者说会起到极大的反方向的作用。在这方面通过Informatica的数据质量管理以及整体的工作流的管理,我们可以将IT人员、数据分析师、数据管理人员共同连接到整个的数据质量处理流程中来,让他们一起工作,一起进行数据质量的提高及数据质量的分析。

为了得到一个统一的完整的数据示图,我们数据集成是非常重要的一步,在这里通过Informatica数据集成的平台,我们可以实现各式各样的数据集成方案,包括批量的、增量的、时时的、流数据处理等等,以此为我们下游的应用、为我们的数据分析提供准确的、及时的数据。

通过Informatica最新发布的自然语言识别以及概率数据分析的功能,我们可以做到针对数据中的人、地点、事件等信息进行跨语言的模糊识别分析能力,这种在我们很多方面都是非常有用处的。

最后,融合了对Hadoop平台的支持,我们也是在今年推出基于Hadoop的平台框架,通过这样的方式,Informatica已经为我们企业做好了应对大数据的准备,通过这样一个完整的数据集成平台,我们可以有效地对我们所需要的数据进行有效的访问,进行强大的集成,包括将这种结构化与非结构化数据的整合,通过这种B2B的数据交互,可以实现企业与合作伙伴之间,或者社交网络与移动设备之间的数据访问、数据交互,另外通过数据质量产品来保证我们数据的可靠性,通过信息生命周期管理保障我们数据的安全性,这就是Informatica整体的数据解决方案平台,我们也可以看到,在这个平台中的每一个产品都可以帮助我们的企业提升我们数据的价值,降低我们数据的成本。