DOIT 软件频道 1月28日原创报道: 正如中国惠普有限公司软件事业部大中华区总经理于志伟所说,“在未来,除了土地、资源、人,这些社会、企业和国家最重要的资产之外,数据会成为同样重要的资产之一。”在这个时代——即便不提大数据——数据的作用正在变得越来越重要,数据所产生的信息将会帮助个人、企业甚至是国家作出重要的决策,而“大数据”这一更大量数据集的代表,所带来的信息价值肯定会与众不同,更具价值。
惠普在数据中心硬件基础设施上已经为大数据做了充足的准备,从大数据服务器到大规模横向扩展系统,从融合基础设施到成套的VirtualSystem、CloudSystem和AppSystem,作为“一家坚持其优秀的硬件传统”的IT提供商,惠普在大数据硬件基础设施上形成了足够的竞争力。
以惠特曼以为核心的“新惠普”战略并不意味着惠普在软件上面会甘拜下风,在大数据时代,计算、存储和网络只是大数据的基础,或者说,这些只是企业大数据战略需要考虑的第一层,是否有更好的软件,意味着对大数据是否能够更好的进行管理,并进而实现对大数据的分析,真正获得其价值。无法通过分析而获得价值的大数据——除了法规遵从的必要性之外——是没有任何被企业花费巨资存储、处理和管理的意义的。
但即便是专精及相信大数据价值的企业,也并不意味着成本——ROI或是别的评价指标——可以不受限制的上升,企业处理大数据的最终目标是获得价值,甚至是利润。因此,在管理、处理以及利用这些大数据的信息时,企业必然会重视其资本在其上的支出和收效,自然是“越低越好的”,可这却与一般的常识或者说如今的现象相悖:数据信息种类正变得越来越多,数据也变得越来越大,信息甚至在转瞬之间就发生显著的变化,而分析的深度——到达哪一层?——的问题同样不能忽视。
“当我们分析的时候,如果我能从一个小时的视频中攫取到10分钟的信息做二次分析。根据这10分钟的信息得出是或不是的结果,或者是从一个小时的视频中得出两秒钟的信息,那么肯定后者会好,而后者分析的深度就在于算法、原理是不是最深入的,这些如果可以达到一定的好处可以影响到多少用户。”正如于志伟所举的例子所表明的,“对信息可以评估出的带给企业、政府的价值到底有多少?”是惠普未来在大数据领域的关注点,而最终希望达到的终点,自然是“利用这样一个先进的数据存储、管理、分析以及产生行动性的结果取得最大的回报。”
在前不久举行的惠普“业务洞察 智领未来”活动上,惠普正式面向中国市场发布了包括惠普Vertica分析平台6.1(HP Vertica Analytics Platform 6.1)、惠普电信大数据以及分析(HP Telco Big Data and Analytics)解决方案、针对SAP的惠普主动式服务(HP Proactive Care for SAP)、Autonomy法律与合规绩效套件(Autonomy Legal Performance Suite)、Autonomy 营销绩效套件(Autonomy Marketing Performance Suite)在内的一系列软件及整体解决方案更新,通过这些解决方案,惠普方面表示,至少希望能够帮助其用户做到三点:通过智能生态系统帮助客户管理信息、帮助客户智能地解读自己的数据、帮助客户以更快地速度响应数据并做出明智的关键决策。
而针对这一次面向大数据时代的数据管理、分析层面的软件及其解决方案发布,业界媒体就此机会采访了惠普公司Vertica市场营销副总裁Chris Selland、中国惠普有限公司软件事业部大中华区总经理于志伟、中国惠普有限公司企业服务集团首席技术官王纪奎。
惠普Vertica市场营销副总裁Chris Selland
Vertica 6.1:更专业的大数据时代选手
“我们同样也要注意到,大数据意味着种类非常地纷繁复杂,速度是非常地快速。因此很多公司所需要寻找的解决方案是在面临种类纷繁复杂的海量数据时,如何快速、更好地获得我们所需要的解决方案来管理数据和信息,并且以更安全便捷的方式来进行管理,分析我们面临的问题,找到我们所想找到的答案,并作出预测,这就是我们所说的新一代的信息平台。” Chris Selland表示,惠普Vertica 6.1在“海量信息的高效处理方面拥有强大的功能,可以迅速的移动数据、管理数据,更快的从数据中获取洞察力。”
Vertica来自于惠普2011年对数据分析软件公司Vertica的收购,在收购之前,Vertica作为数据分析、数据仓库领域的知名公司,位列分析机构Gartner数据仓库数据管理魔力象限的中游,在执行力和技术前瞻性方面都有不错的表现。事实上,Vertica在2011年被惠普的收购,是当年针对数据仓库、数据分析公司收购浪潮中最晚的,在此之前,IBM、EMC、SAP和微软分别收购了Netezza、Greenplum、Sybase和DATAllegro等业界知名公司。
Chris Selland表示Vertica 6.1的版本更新虽然并不显著,但作为“专为大数据而设计的高性能数据分析平台”,它具有四个方面的显著特征:
极快的数据分析:查询速度比传统产品快50-1000倍,接近实时的数据洞察。
大规模扩展能力:可添加无限数量的行业标准服务器,无限扩展用户的解决方案。
开放式架构:内置Hadoop、R及一系列ETL和业务情报工具的支持能力,保护和利用用户原来在软硬件上的投资。
优化的数据存储:利用专利的柱状压缩技术,每台服务器可存储10-30倍于行数据库的数据。
Vertica与Hadoop整合,加速数据分析
与Hadoop相结合已经成为大数据时代数据管理和数据分析解决方案的必修课,因此,Chris Selland特别提到,Vertica 6.1与Hadoop进行了深度的捆绑,新增了数据管理选择,能够通过Hadoop分布式文件系统(Hadoop Distributed File System (HDFS))连接器来优化大数据,HDFS连接器的数据加载速度比惠普Vertica分析平台6.0中的前代连接器版本快四倍以上。
据介绍,用户可以有两种选择:1、将数据直接加载到惠普 Vertica 分析平台上;2、存储在Hadoop中并通过惠普 Vertica 分析平台进行分析。Chris Selland认为,无论是哪种情况,与Hadoop的更好集成都能帮助客户更快地从大数据中获得洞察。连接器还可确保各种商业智能(BI)工具都能通过惠普 Vertica 分析平台在Hadoop上运行。
不过,他也表示,Hadoop并非没有缺点,而Vertica 6.1是能够弥补这些缺陷的产品:“Hadoop现在是势头正劲,它本身也是非常强大的工具,可以非常快速地存储和管理多种类信息。但其中一个不太适合的方面是在高性能的分析方面,利用它(HDFS连接器)的分层存储和数据归档来帮助企业实现更为便捷的管理,因为它可以实现Hadoop和Vertica之间的自由的数据传输和存储,更为快速。”
在官方资料中,惠普方面表示,通过Vertica 6.1中提供的HDFS连接器“可确保HDFS与惠普 Vertica 分析平台之间的无缝原生集成,且无需任何资源密集型MapReduce代码。这种原生集成能使客户将惠普 Vertica 分析平台和Hadoop上的分析查询相结合,从而确保以简单、可扩展的方式进行高性能分析。”
“我们目前即使把信息给到企业,并不是很多企业现有的掌握大数据管理方面的人才就可以分析出来的。因为他只是从表象看,看不到深层次的问题,所以我们建议碰到了这样的情况最好是找一些专业的厂商。” 谈到Vertica 6.1与Hadoop平台在企业中所发挥的不同作用,于志伟表示,“Vertica和Hadoop,他们有不同的特性,Hadoop是处理不同类型的信息,非常有广度”而Vertica 6.1“能看到更深层次的东西”。
中国惠普有限公司软件事业部大中华区总经理于志伟
与于志伟的观点类似,Chris Selland认为,在企业——尤其是大型企业中——Hadoop和Vertica方案“双管齐下”非常重要,他表示,Hadoop并非是针对高性能、多层次、高深度(精度)进行设计的,其最初是被用来“针对更加广泛的类别,所以甚至并不注重速度。”虽然这难以称得上是Hadoop的缺点,但对于企业来说这毕竟是有缺陷的,所以“如果企业要双管齐下”,从这个角度来讲,Hadoop和Vertica有着非常大的互补。
整合数据解决方案:惠普关注行业特性
在此次发布的产品更新与解决方案中,包含了惠普许多整合性的解决方案升级以及针对特定应用、特定行业的产品功能发布,这显然是对大数据时代鲜明的应用与行业特色的一种回应。
惠普电信大数据以及分析(HP Telco Big Data and Analytics)解决方案最为引人关注,作为专门针对通信服务提供商(CSP)的解决方案,其能够将包括用户经验和喜好的各种来源的数据转换为行动情报。通过利用惠普大数据分析软件,以及惠普的咨询、研发、信息管理和商业智能经验,惠普电信大数据及分析解决方案能够让通信服务供应商管理、分析并使用与业务相关的结构化及非结构化数据。
中国惠普有限公司企业服务集团首席技术官王纪奎
中国惠普有限公司企业服务集团首席技术官王纪奎在面向媒体的演讲中特别指出,“惠普具有面向行业的大数据服务能力”,并就惠普电信大数据以及分析(HP Telco Big Data and Analytics)解决方案谈及,惠普在通信行业提供的行业和功能加速器整体解决方案,这一方案包括:商业智能战略与管理、企业数据管理、绩效管理与分析,其不仅提供数据整合与数据仓库,还在更细节的部分提供信息战略与治理、主数据管理及信息质量管理等多项功能。
“在不同的行业里要了解如何在产生大数据的时候去分析用户的商业价值,我们要了解它管理信息的战略。当然也要了解整体数据,到底是从什么系统来,做什么用,最后和哪些客户有关系,目前处理的,大部分还是跟内部的系统有关系。”王纪奎认为,利用Vertica、Autonomy包括相关的管理软件工具,最重要的是“要深入理解这个行业里数据对它意味着什么?”而惠普所做的,正是把这些数据、客户需要的价值、行业的数据特点、分析结果、客户需要的效果整合起来。
因此,王纪奎指出,惠普通信行业大数据及分析服务整合了从软件到硬件的惠普多个层面的产品,其中包括:HP Smart Profile Server、HP Actionable Experience Management、HP Ad Experience Personalization、Information Optimization Transformation Experience Workshop以及针对通信服务提供商的“信息优化转型体验研讨会”。
“惠普通信行业大数据及分析服务让运营商在已有的IT中洞察和充分发掘结构化和非结构化信息价值。”王纪奎透露,这一解决方案已经帮助国内的某个运营商提高了1.5%的运营收入,而国内的另外一家运营商也开始尝试使用这一解决方案来优化管理其运营架构和流程:“如何让整个公司真正地产生大数据价值,要有很好的数据管理和业务流程设计,从而让客户来了以后真正地产生价值。所以我们通过整个流程设计和解决方案分析,把数据流程理清楚以后产生价值。”
王纪奎建议,要想让大数据产生价值,一定要深入的理解行业,与行业特征进行有效的结合,“只有深入地了解这个行业里的业务系统、应用系统、客户信息以及不同的数据对它意味着什么,才能真正地让数据的价值产生出来。”以电信行业为例,就要考虑网络优化,考虑如何把广告和相关的搜索引擎、用户的商业模式进行结合,“大数据落地与用户的价值相结合”才是真正的目的和目标。