数据仓库协会(简称为TDWI)近期的研究显示,随着技术难题被攻克,大数据已经成为企业重要的业务资产。在此项研究中,TDWI共访问了325名 IT经理人、技术顾问和企业用户。这些受访者来自不同规模公司。在最终得到的报告中,TDWI指出,新技术的出现使得企业能够对不同类型的海量数据集进行更为复杂的数据分析。
超过三分之一的受访者表示,他们目前正在对大数据进行某种形式的高级分析工作,其中大部分应用在BI(商业智能)、预测分析、数据挖掘和统计分析任务。调查发现,近45%的受访者认为,大数据分析可以让商业洞察力变得更为精准。38%的受访者期待,能通过该技术更为敏锐地发现更多的销售和市场商机。超过60%的受访者希望,大数据分析能快速提升公司在社交媒体上的营销能力。
TDWI的调查还显示,大数据分析应用案例中增长最快的当属高级数据虚拟化。为了让数据的可视化程度更高,越来越多的企业开始使用高级分析工具对大数据集进行分析。
该报告的作者、TDWI分析师Philip Russom说:“大数据在过去曾经是一个技术难题,企业不得不想方设法应对海量数据的管理挑战。现在,如果使用分析的方法处理这个问题,你就能从大数据中获得诸多好处,这些好处是传统BI和数据仓库技术所无法给予的。”
“大数据”指海量数据集,其容量通常以数百TB或者数百PB来计量。随着时间的推移,这一术语并不仅限于海量结构化数据,它还包括博客、点击流数据、机器和传感数据和社交媒体等非结构数据。Russom表示,在许多案例中,企业的呼叫中心、RFID芯片、供应链应用工具和物流工具都存储有大量数据,但企业并不拥有可以有效利用这些数据的工具。
如今,新技术与成本大幅下降的存储和硬件结合起来,让企业可以高效、快速地存储、管理和分析各种类型的海量数据。越来越多的企业开始筛选这些复杂的海量数据,以进行建模。这些都是他们过去不知道或是无法理解的。目前,Aster Data、GreenPlum、Teradata、Netezza、ParAccel、Vertica和SAP等公司所提供的数据库和数据分析技术能够帮助企业完成这些工作。
Russom指出,这些厂商提供的产品采用了新的技术并进行了一系列创新,能够解决传统数据库技术中的一些不足。这些新技术包括内存数据库、海量并行处理分析技术,以及允许人们以过去无法想象的简单、高效的方法来存储、管理和查询大数据。Hadoop和MapReduce等开源工具则使企业能够以一种全新的方式来管理和跟踪大数据。
Russom在报告中称:“分析工具和数据库现在能够应对大数据带来的挑战。它们能够以更快的速度处理海量检索和解析表。新一代工具和平台将性能水平提升到了一个新的层次,这对于大数据应用非常重要。”
这份报告还提到,在充分发挥高级大数据分析能力的同时会面临挑战。报告指出,超过45%的受访者表示,大数据分析面临的最大挑战就是严重缺乏技术熟练的专业人才。更糟的是,新一代分析工具与传统BI和数据仓库所需要的熟练技能不尽相同。报告还指出,缺乏商业支持和与大数据分析有关的整体成本是大数据分析所面临的另外两大障碍。