8月14日消息,在互联网大会2013中国大数据发展论坛最后的对话环节,互联网周刊主编姜奇平与微软全球资深副总裁、微软亚太研发集团主席张亚勤就大数据的一系列热点话题展开对话。
以下是对话实录:
姜奇平:下面进行的是大数据的最后一个环节,作为高端论坛,我是主持人姜奇平,互联网周刊的主编。这位大家非常熟悉是我们业界权威泰斗是微软全国资深副总裁,微软亚太研发集团主席,大家欢迎。今天激情了一天,我听了一下,更多的是企业应用,在应用层面的。从去年以来,大家都在介绍大数据到底是什么?介绍多了以后,到最后大家更迷糊了,我觉得对于我们下一步大数据发展来说理清思路非常重要。需要业界领先的,权威的代表性人物为我们拨云见日。我认为今天是非常好的机会,我们有机会向张亚勤先生请教。首先围绕大数据到底是什么,你谈谈您的看法,给大家分享一下。
张亚勤:大数据是挺热的,还有这么多人站着,说明了大家很观注,其实现在也没有严格的大数据的定义。我们做大数据,海量的数据,数据仓库很多年了,也有很多商业化的。第一点我们讲数据规模大,数据快,从量变到质变的过程。第二点云计算,云计算,计算的规模,存储,包括学习的算法,包括我们讲的遗传因子的算法,我认为这是水到渠成。数据放在那,加上很好的方法,只是一部分,更重要的是对于数据的使用。我要有远见,有一个大数据战略,拿什么样的数据,怎么样应用。第二点是视觉观点,不同的视觉看,数据呈现是什么样的。如果数据来了之后,你对它的解释不同,结果就不同,有很多的数据分析。第三怎么获取价值,利用大数据,数据是静态的数据。
姜奇平:我觉得张总的说的话,如果大家真的听明白了则不虚此行,我认为这是当前对大数据认识境界最高的。我认为之前都是把大数据当成课题的,但是我认为张总谈的,从需求角度来讲,也就是从我使用大数据是为了什么?要达到什么样的效果,我认为这是对大数据认识的突破。如果一个领导心不动,没有把自己摆出去,我认为这样是不行的。
张亚勤:把数据变成信息。
姜奇平:从过去传统的数据结构化数据,现在到了大数据,新的管理模式和商业模式有什么样的颠覆?
张亚勤:这是很好的问题,我们做数据研究的。大数据有什么新的东西?其实就是大了而已没有什么新的。出现了数据以后,把各种数据库放在一起。比如说企业里面的财务系统,人事系统,客户系统结合在一起,数据变成多维的。比如说视频信息,我们看到图片数据,看到社交数据,这时候传统的数据库没有办法处理了,时间长了,需要很长时间把它计算出来,这时候就需要新的办法,进行批量处理。大数据不仅仅是量化。经过智能系统查询,给你一些东西。大数据是不确定性的,有的时候查东西,有的时候不知道查什么,更多的是一种趋势的分析,是一种推荐效率,是一些模糊的选择,所以提供了新的信息,是原来没有的。
姜奇平:现在出了新的大数据管理,给企业带来了更加精准,更加可控的进行量化,给企业带来价值。张先生说的话里面有很多隐含的信息,我们可以展开。微软是世界排五位的大数据厂家。在我印象里面很多互联网企业,在服务角度里面,忽略了产品。包括我们管理方法不同。我想您是业界资深专家,帮我们分析一下。
张亚勤:我觉得我们有一个特点喜新厌旧,新东西来了,旧东西就淘汰了。其实这个世界是需要那些旧东西的,数据库里面的信息提供数据接口,加上新的数据。云计算也是需要的,05年06年的时候,谷歌(微博)有一个很大的变动,我认为云很重要,但是云加N也是很重要的。现在在移动互联上的UP,看起来比浏览器更常见,因为有商店,有订单的要求,以后会怎么样?我觉得都会有的。我觉得软件和服务,浏览器和UPS都要有。
姜奇平:我从您的观点里面感到强烈的意向,我们有一个很平衡的观点,还是就事论事。刚才说的都是一些大思路的问题,大思路对大家的启发,或者说方向,帮大家建立一个感觉。我觉得大数据最终还是商业,这是它最高的主战场。如果将来被应有的话,要有技术,而不是好看,华而不实,微软给我们的感觉是专业化,要求也比较高,也比较专注这个需求。关于产品方面的,工具在什么地方,应用产品是什么样的?您能不能帮我们解答这方面的东西。
张亚勤:大数据不是新的东西,商业化很长时间,只不过规模和媒体出现的比较少,第一个是搜索,搜索不是因为大数据的技术,现在在企业里面,有很多数据仓库的产品,现在在企业里面怎么把企业内部性和公共的需求和第三方结合起来,把大数据融合进来,这是一个很重要的东西。比如说我们企业里面的流程,我希望社交这块,我希望移动这儿,我希望用微信和微博的平台结合起来,对你们销售也好的,对你们人事管理也好,对你们CRM都是有一个新的突破。
第二点大数据往下走的一些误区或者挑战。讲到挑战会讲到隐私的问题,安全的问题,这些问题讲不清楚,但是永远无法解决,永远存在的,永远被解决。总之有风险在,但是由于你的得益超过风险,所以还是继续使用的。过去我跟大家说,希望把它公开,希望引擎搜我,还要付钱给我。现在趋势是很多企业,我的数据很值钱,我的数据是黄金,要把数据保护起来,保护起来就形成新的数据,这样的话我是不是把数据屏蔽起来,不跟别人交流数据。数据不交流就不行了。比如说facebook,全球最大的社交网络。国内微信,微博的数据,包括淘宝的数据,这都是大数据,但是没有开放出来,都是自己搜索。包括APP,大数据带来的就是这些问题,怎么解决问题呢?今天没有时间讲了,但是总的来讲就是要把数据变成可交流,当它有价值的时候,可以在平台交流。
姜奇平:我作为大数据应用者,跟我个人有什么关系。我听说我们微软可以实现把Excel和其他的办公软件结合起来,我觉得很惊奇,跟云连接起来了如何在Windows里面把它结合在一起,这是怎么样的?
张亚勤:收集数据,管理数据,分析数据。怎么样呈现数据,怎么使用数据,怎么样识别数据,感知数据。大家都比较习惯Office等等,我把实用的数据和大数据结合起来,大家可能感觉更方便。最近我们出的产品,就是把Hadoop,经过分析之后在Powerpoint里面展现出来。这个产品已经出来了,可视化,容易使用,这是大数据非常重要的方面。
姜奇平:有人用这个方法找女朋友,通过六个步骤就可以很好的促进谈恋爱,我不知道是真还是假,真假不重要,大数据发展一定跟我们的日常生活有非常密切的关系的。商家可以用它对市场进行洞察,我认为作为个别来说,也可以对你的朋友,对你的周边的人进行洞察,我认为大数据将来是很有用的,正是因为有用,有价值,他们才会运用它。最后一个问题,按照我们原来设计的问题,您认为什么样的大数据适合中国?中国大数据开发和利用方面的进展如何?
张亚勤:中国相对美国来说,每天上大淘宝网,每天用微博,每天用微信搜索,其实已经用大数据了,现在中国用的比较多的还是在消费者里面,包括网络金融,都是大数据应用非常好的案例。中国现在和美国相比,我们比较落后在企业界大数据应用。因为国内的企业,IT比较落后一点,收集的数据也不够,对数据的理解也稍微差一些,这方面需要有进一步的提高,最后要进入企业决策里面。还有一点是机器合成的数据,大量的传感器嵌入式的设备,包括传感器的设备,包括汽车的数据,需要一点时间,但是从现在开始应该收集大数据,将来的量远远超过现在。机器到机器,量是十倍的,这方面也需要关注。
姜奇平:我想谈谈我的体会,我今天跟你交流,我觉得我自己有一些这方面的收获。我认为大数据和以前的传统数据相比,传统数据是简单系统的数据,大数据是大系统的数据。在我们的数据从简单向复杂系统转移的时候,呈现了多样化,结构化的特征。在这个过程之中,我们大家的误区,过多的注重数据课程方面的事情,但是通过跟您交流以后,有一点非常对,大数据还要从应用到洞察的分析能力,提高人们的决策能力,最终产生价格,这是我的第一个收获。
第二个收获,大数据有一些说法,当然每个人向不推的方向探索,从您的介绍来说,我受到启发,大数据和云计算的发展都是一体化的,这里面有几个关系需要处理好。我们既要重视云的服务,也要重视端专业化的服务,给它提供有效的产品,提供有效的工具,这样大数据才能得到很好的发展。在软件数据的关系之上,我受到一个启发就是说,对数据软件化的增强,这方面也要努力,也是非常重要的。将来我们面向企业,大数据是薄弱环节,反过来来说也是一个机会,如何让企业在大数据方面进一步前进,这也是企业需要努力做的。这是我今天和张总交流的收获,我在此向张总表示感谢,也希望大家对张亚勤今天精彩的发言给予热烈的掌声。