甲骨文五环节直击大数据 推动国内大数据项目落地

DOIT软件与服务频道原创报道 随着互联网、物联网的快速发展,海量数据迎面袭来,对大数据的处理成为一件必须的事情。但是,光谈需求是不够的,最关键在于,随着大数据处理技术水平的提升,CIO们开始敢于直面大数据。

都说大数据中有金矿,但这只是其特性中的一部分。经典的大数据4V包含,数据体量巨大(Volume)、数据类型繁多(Variety)、处理速度快(Velocity)与商业价值高(Value)。要从数据中获得最后的V——高价值,必须先征服之前的3V——数量、种类和处理速度。

大数据挖掘需要经过获取、存储、处理、分析和利用五大过程,距离最终和业务产生有效关联,成为切实指导决策与行动的信息要素,这一过程可谓过五关斩六将。

在最初的数据获取和发掘阶段,企业需要解决的是如何通过数据搜索与可视化,更快地解答有关业务的诸多问题;在数据分析阶段,企业需要良好的平台和性能,支撑随时随地的实施数据分析,监测数据异常与趋势,进一步得出洞见;在最终的规划与预测层面,企业则需结合历史与统计数据,搭建预测模型,最大化预测的精准度,在战略管理以及人财物为决策者提供建议。

甲骨文作为软硬件实力并存的技术公司,将从各个环节对企业大数据部署提供简化和帮助。Oracle大数据机、Oracle Exadata数据库云服务器、Oracle Exalytics商务智能云服务器以及Oracle Endeca Information Discovery,依托于ERP/CRM等关键企业管理系统的商务智能软件一起组成了甲骨文最广泛、高度集成化产品组合,为企业提供了一个端到端的大数据解决方案。

数据获取

谈到大数据,人们首先想到Hadoop和非结构化数据,然而,这二者并不能代表大数据的全部含义。传统的结构化数据的处理依然是重要内容。Hadoop、NoSQL和SQL的共存与融合,使大数据技术在成熟度方面迈出了全新的一步。“在很多企业发展到了Hadoop层面时,或者大数据技术带来了一定的价值后,都需要一家厂商,来全面支持以上所有的架构,Oracle使用X86和存储,安装Hadoop企业版本和Oracle NoSQL 数据库,为客户提供Oracle大数据机。Oracle大数据机可以快速地、低成本地为客户搭建大数据处理平台。”甲骨文公司副总裁及大中华区技术总经理喻思成说道。

图 甲骨文公司副总裁及大中华区技术总经理 喻思成

日前新推出的Oracle大数据机X4-2与Oracle大数据连接器和Oracle Exadata数据库云服务器组成了面向大数据的集成平台,帮助企业轻松实现结构化数据和非结构数据的融合。Oracle 大数据连接器优化了 Hadoop 与 Oracle 数据库和 Exadata 之间的集成,将Hadoop系统无缝地连接到Oracle数据库系统中,实现非结构化和结构化数据的拼接,从而形成一个完整的大数据解决方案。

甲骨文在7月份发布的数据库12c版本,最重要功能之一即内存计算。In-Memory、Exadata以及大数据连接器的组合,实现了甲骨文大数据解决方案实时数据处理能力的基础。

分析决策

在数据分析层面,Oracle Exalytics商务智能云服务器采用业界标准硬件、市场领先的商务智能软件和内存数据库技术而开发,可以通过超高带宽的infiniband网络从Oracle Exadata上加载和读取数据。它是全球首款专门为提供高性能分析、建模、发现和规划而设计的集成系统,能够以快捷的速度、智能性和简化性帮助企业应对各种挑战。

此外,Oracle Event Processing和Oracle Endeca information Discover也是甲骨文大数据分析层面的强大武器。Oracle Event Processing,这一构建实时筛选、关联和处理事件应用的全面解决方案,有助于消除、整合、关联和筛选数据,避免数据仓库杂乱不堪,从而具备实时分析大量数据流的能力。例如在广告的实时投放这一业务上,就需要数据的实时处理和商务智能的应用。业务部门需要实时检测广告点击量和点击来源来决定随后的投放量和投放地点,其他诸如根据投放人群、性质等等数据的进行分析、处理的因素来制约着广告精准投放的需求。Oracle Endeca information Discover是一个企业信息探索利器,用于对多维多变的数据进行高级、直观的探索和关联分析。信息从不同的源系统加载,存储在可动态支持变化数据的分面数据模型中。这些集成、丰富的数据可通过交互式和可配置的应用程序进行搜索、挖掘和分析。例如社交媒体、内部文件或产品评论等客户的书面反馈,为比较传统的、量化的商务智能技术无法轻易回答的问题找到答案。

在决策阶段,Oracle实时决策是一种高度可扩展的服务导向型决策管理平台,可实现决策优化。它利用实时和历史数据、业务规则、预测模型、自动化以及自助学习技术,提供随时间推移不断调整的实时决策。其决策服务可嵌入到企业内部的交易应用中,以优化重复发生的运营决策成效。

在分析大数据时,企业需要访问所有数据,使用R语言进行统计、分析和编程,为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。

在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle Database11g的集成, 为进行更进一步的数据分析提供了一个企业就绪的、深度集成的环境。

大数据落地中国

国外的大数据应用案例的确不在少数,而且很多都已耳熟能详。但在国内的情况又是如何呢?据悉,甲骨文目前已与国内多行业的大型企业洽谈合作事宜:“第一类客户是电信业,电信行业拥有海量且价值连城的数据;第二类客户是金融业,金融行业的客户需要对大数据有非常准确的把握。由于其目前面临着前所未有的挑战,需要提高业务的类型,提高客户的黏度和创新,所以使得金融行业需要对业务本身进行挖掘和使用,这就涉及到了大数据;第三类客户是零售业,包括在线的零售电商,都在使用大数据对客户的行为进行挖掘追踪,实现交叉销售,提升客户体验。娱乐、媒体、地产行业等行业也对大数据表现出浓厚的兴趣。”喻思成说。

对于大数据,不同客户、不同行业之间的差距巨大,甲骨文又将如何来推动大数据在国内的落地开花呢?其实面对这样的挑战,甲骨文并不陌生,“这与传统的Oracle数据库的生态链是一样的。在数据建模时,Oracle提供几个事例化的模型结构应用在某些固定的行业中。但是对客户进行大数据整体搭建时,甲骨文会需要第三方的平台,除非客户IT部门的能力非常强。”喻思成如是说道。

虽然国内大数据市场一片繁荣,但如何加速推进大数据项目的落地和成功,并不是一蹴而就的事情。只有成功的落地项目,才能够进一步激励市场,让大数据技术更多造福于民,在这个过程中,我们可以看到整条大数据生态链中的各方都在做积极的努力。