12月5日,主题为“重塑商业模式,拥抱智能时代”的2017中国数字经济峰会在京召开,大会由DOIT传媒和eHub联合主办。来自阿里云、百度云和科大讯飞三大国家人工智能平台企业的专家,与中国500强企业的近百位CIO、CTO和企业领袖共话跨界、融合的创新思维与实现路径,展望数字经济新时代下的企业数字化转型之路。
百度云副总经理傅徐军以“ABC,为行业变革而来”为主题发表演讲。以下内容根据速记整理, 未经本人审定。
傅徐军:非常感谢。大家眼里,百度是一个非常传统的2C公司,是做搜索引擎的公司,正因为前两年一直致力于把搜索引擎做得更好,所以在云计算和大数据两个方面积累了非常坚实的基础,这两年又在人工智能有非常重大的投入,所以我们在内部叫ABC,怎么样让百度在这一方向转型,怎么去更好的服务我们的行业客户。今天也是借峰会的机会就这些方面的探索规划做一些探讨和互动。
百度的前任首席科学家是吴文达,他说如果人工智能是一个火箭,大数据就是燃料,发动机和云计算就是引擎,以前的云是1.0,现在是2.0,1.0的特征就是以资源分享为驱动,以业务升级为特征,2.0我们希望能为企业带来更多的业务价值。当ABC和产业结合的时候,我们觉得会发生两种方式的变化。
第一种是渐进式的,我的产业和互联网之间怎么融合,互联网的技术可以快速的进入产业,产业对行业的洞察可以给互联网企业更多的视野,双方会产生一定的化学反应,会创造新的商业模式。
第二种方式,革命性的创新,我们看到的一些对话式的人工智能产品,无人车、无人商城等等。
这两种变化又会进一步的对IT的能力,对计算和数据的能力,提出非常大的挑战。当这个能力发生一些质的变化,又会循环的回去促进我前面的两个变化快速发生,直到越走越快。
百度在ABC方面的布局,无论是业务架构还是组织架构上,基本分为三大块,一块是度秘,第二块是无人车,第三块是百度云。
度秘在美国前两年走得更快,我们知道苹果的siri和亚马逊的amzon,在国内微软小冰也火过,科大讯飞的灵犀,度秘是李彦宏起的,说每个人都希望有一个秘书,出门的时候订飞机票,后来毕竟百度是一家互联网公司,他们觉得这个取名太严肃了,所以我们从今年开始,整个度秘唤醒词是小度。
怎么做好对话是人工智能助力的,百度有三个条件,听得清,听得懂,能满足。
听得清是语音识别能力,听得懂是百度以前自然语言处理的能力,知识图谱能力和搜索的推荐能力,听得懂就是能满足我真正要满足用户的需求,满足终端客户和终端用户生活中工作中的小小要求。
我有一个小的demo,演示是让人工智能的技术更好的理解上下文的语境、知道老百姓的大白话的表述。我们看到它可以简单的记录上下文的语境,可以进入十五轮对话左右,但是超过了就会丢失掉,下面的例子是一段视频,度秘和智能家具合作的视频,这个产品怎么在家居环境得到更好应用,无论是冰箱孩子电视机,都可以作为智能对话的设备,未来不会再像以前的冷冰冰,而是做非常多的智能交互。
我们希望把智能对、话语音技术应用到家庭的方方面面,因为百度本身是一个最大的搜索引擎知识库,所以去问这是什么地方的时候,这个图片被截屏,和内部的百度百科或者百度知道几百万张酒店的图片对比,得到正确的结果的时候,结果就会反馈到电视机上。还有你忘记这个明星是谁,他会告诉你是谁,这个是准确率最高的。
百度的能力也非常有限,把生态做好,让百度只要关心的关注语音识别和自然语言处理能力就可以了,所以我们做了一套系统多S的开放平台。这个平台也是在百度云之上,让我们第三方合作伙伴可以非常把能力放在平台上。
无人驾驶是非常火的方向,百度在2014年就建立了无人驾驶事业部,2015年无人驾驶开上五环,当时的时速80公里每小时以上,天气晴朗没有红绿灯和行人,相对来讲是要求不那么高的环境,但是技术发展非常快,2016年10月乌镇互联网大会无人车开进了大会现场,当时我们提供了18款车,品牌覆盖比亚迪、QQ、奇瑞三种车型,所以这段路叫子叶路,是完全开放的道路,有行人和机动车红绿灯等等。我想说百度无人车经住了考验,300多次试驾没有一次发生问题,工程师也会发现一些问题,太阳太大的时候树荫会把白线遮住。
到了2017年,百度的内部想法发生变化,他觉得靠百度一家想推动中国无人车发展非常难,怎么样能够调动所有人的积极性,调动合作伙伴的积极性和车厂积极性,更好更快的把无人车做得更好,百度推出阿波罗计划,把无人车的代码全部开源出,以后专注做无人车,帮助合作伙伴尽快的把实验室环境的无人车放到生产环节。
(播放视频)
阿波罗计划推广的非常快,今年年底发布2.0版本,不同的阿波罗计划更先进的版本使得我们的客户调试代码程度会大大的降低,调试的过程会很复杂,但是我们可以看到,随着阿波罗计划的推广,使中国无人车的步伐大大的推动。
无人车也会开放平台,这是一个软硬件一体化的仿生平台,一天可以平台上跑几百万公里,这是由百度云内部支持的。
讲一下百度云,前面无人车和小度,都是非常专业的领域,小度对应车联网和智能家居,百度云是百度人工智能能力,拆成更小的力度,重新组合,针对不同的行业做各种优化定制化的过程。
先给大家介绍一下智能媒体,它的底层能力是计算机视觉,我们今年1月份参加了江苏卫视最强大脑节目,这次是人类和小度PK,现场就有很多嘉宾和嘉宾小时候的照片,人跟计算机比拼现在的嘉宾和小时候的照片谁匹配得更准,百度以前没有这个技术的,因为现在的人脸场景不管是一比一还是一比二,都是同年龄层的匹配,百度在内部发布了两万名员工提交了自己的毕业照和成年照片,进行了大概一个月的训练,做了一个模型,所以比较微弱的优势战胜了人类的最强选手,当然百度做这个最早不是为了上综艺节目,而是综艺找到了我们,最早我们是和宝贝回家公益组织合作,我们希望天下无拐,我们跟两万七千个照片库进行了对比,找到了几十名走失的孩子,其中年龄差距最大的两个,一个是20年,一个是17年,20年的那位是6岁的时候从重庆走失,我们在泉州发现,警方进行DNA对比是一个人,也送他回了重庆,我觉得如果可以用技术做这样的事情也是非常有意义的。
计算机视觉怎么和产业结合?我想举一些例子,我们提供ABC一个完整的能力,最底层是视频点播直播加速,中间是搜索系统推荐包括广告营销框架,最上层是内部叫VCA、VCR,本质就是对视频进行图片、语音的人脸场景识别,不需要靠人去看,而动态的识别图片的内容,这段视频的内容是什么东西。其中一个例子是我们跟CCTV共建创新实验室,可以看到它的demo。
我们看到,通过语音识别,可以把食品里面的语音文字和人脸动态的抓出来。同步可以生成很多的标签,使原来计算机无法检索的非结构化数据和半结构化数据变成结构化数据,大大提升搜索精度。对于广电系统等,会大量的省去了人工编务的时间,以前需要人看几个小时的视频,非常累,现在通过计算机的方式可以大大的提升效率,准确率80%左右,还是有很大提升空间,我相信人工智能和产业化学反应会极大的推动技术的进步。
这个是我们跟苏州市公安局一起合作的安防场景,第一天上线就抓到一个在逃三年时间的逃犯,他当天戴着帽子和墨镜,警察和百度的员工面对面看的时候也发现不是一个人,三四年的时间照片也不是最新的,可能匹配不上了,但是计算机有它独特的视角做一个比人类更聪明的对比,因为现在我们发现某些情况人比计算机更好一些,但是有些情况计算机比人聪明。
郑州的美兰机场,每次登机之前要刷条形码,导致排队很长,装了人脸闸机以后就不需要了,这块也是计算机视觉的应用;这是我们跟首都钢铁公司自动化技术公司合作的,它解决了工业缺陷审核的场景,很多的钢材会有很小比例的误品率,红色铁皮,孔洞,褶皱,怎么把这些这么小比例的钢材找到?传统的方式是用高速摄像机半毫秒拍一下,现在的解决方式是用国外的软件,几千万一套,百度和首钢有一些合作,我们花一个月时间对25万张照片进行标注,标注用了一周时间,之后用深度学习进行训练。检测速度很快,经过实测试,准确率是99.98%。
上面展示的只是我们跟各行各业合作的案例,百度本质上是一个技术公司,很多时候是从技术去看行业的,比较传统,虽然它现在在不断的改变自己的想法,应该是看行业需要什么,怎么完善我的技术,这是百度整个行业不断的思考不断规划的一些东西,我今天也是抛砖引玉,希望跟在座各位有更多的合作机会。
由于金融的客户相对对合作的保密性要求比较高,所以我不会给任何的案例,但是看得出来,我们跟金融的合作非常多,因为金融看上去是最稳健要求最高的,同时它也永远站在创新的最前沿,我们可以看到大概在九个方面可以有三四十个产品跟金融行业有非常多的合作,无论是知识图谱还是企业舆情,可以帮助他们更好的去做贷中后前的管理,比如店铺选择和智慧选址,比如我现在有一个网点,人流其实是不够清晰的,我不知道他们从什么地方来,也不知道他们去过什么地方,可以基于百度地图和百度搜索的数据给这个网点非常清晰的人流和热力图,当然,我们不会给基于个人的信息。
再举例子,比如信用卡的领域,大家知道信用卡盗卡和套卡养卡的问题比较严重,比方说营销机构买了身份证,去注册我的信用卡信息,所有填写的信息都是真实的,但是拿了卡以后不做正常的消费,过段时间银行觉得我信用有错,这个时候我钱套出来可能就消失掉了,公安部不会为几万块钱立案,但是钱非常多也是非常恐怖的数字,我们是不是可以跳出来想想我们基于交易习惯或者信息也好,做一个机器学习,让机器训练去替代人的主观上的专家系统和人的逻辑设计,我们做了这样的事情,效果非常好,准确率可以达到90%以上,我们记忆不的把这个模型做得更好。
这个是百度云的全家福,百度云有将近两百个产品,有成熟的也有不太成熟的,这边是相对成熟的一部分,我们会分为几块,产品的解决方案和行业的解决方案,也欢迎各位在任何时间找我做任何交流,谢谢大家。