12月5日,主题为“重塑商业模式,拥抱智能时代”的2017中国数字经济峰会在京召开,大会由DOIT传媒和eHub联合主办。来自阿里云、百度云和科大讯飞三大国家人工智能平台企业的专家,与中国500强企业的近百位CIO、CTO和企业领袖共话跨界、融合的创新思维与实现路径,展望数字经济新时代下的企业数字化转型之路。
大家知道,语音识别,在中国有一家公司,不单是中国领先,而且已经全球领先了,这家公司就是科大讯飞,科大讯飞研究院副院长付瑞吉以“人工智能技术的最新进展和产业应用”为题,发表演讲。以下内容根据速记整理, 未经本人审定。
付瑞吉:各位来宾大家下午好,首先非常感谢DOIT的邀请。我是来自科大讯飞AI研究院的付瑞吉,今天的题目就是人工智能技术的最新进展和产业应用,跟大家介绍一下科大讯飞这些年在人工智能领域的研究进展和应用。
我们都知道,从去年开始,阿尔法狗战胜李世石,使得人工智能变成了一个家喻户晓的概念,瑞银集团交易大厅以前坐满了交易员,现在基本上是空了,人工智能已经取代了交易员,完成一比一的交易。孙正义提出未来产业机器人将决定GDP的全球排名,我们以前讲人口红利,可能以后就是机器人红利了,人工智能在全球范围内变成一个非常重要的战略性的战略高地。
迄今为止,工业界人工智能成功的经验,刚才提到了ABC成为主流,我们有深度学习算法,大数据,计算能力,变成了一个人工智能里面的标配,要想成功这三个方面必须得全部具备,在讯飞这些年来摸索产品阶段,人工智能包括语音的这些产品成功经验中,总结了这样一条,我们叫联谊效益,就像一滴水一块石头到湖面上泛起了涟漪,我们新的产品发布的时候有各种缺陷,准确率没有那么高,这个时候它的水波振幅非常大,代表了我们的错误率会比较高,但是总有一部分发烧友容忍度比较高的用户会用我们的产品,这个时候会为我们贡献真实的用后数据,这些数据也用我们的云服务收集回来,帮助我们迭代的改进我们的算法,形成这样的闭环,用用户不断的数据迭代改进我们的算法,使得我们产品的准确率提高,它的振幅变小,会吸引更多的人去利用,涟漪就会不断的扩大,直到覆盖到整个湖面,使这个产品覆盖更多的用户。
讯飞总结了它的应用模式,分为两个方面,第一个方面,我们叫和自然交互去结合,自然交互改变生活,就是说我们可以跟智能家具和可穿戴设备包括智能汽车,我们知道现在越来越多的设备没有屏幕,小型化,可穿戴,跟它交互的时候,以往像手机一样的触摸已经不能满足我们的需求,那么我们用更加自然的交互方式,用语音交互,更好的去使得交互更加的流畅。
和行业交互,更好的颠覆行业,包括智慧城市和医疗等等,我们后面会看到各种的案例。
讯飞2014年开始定义了人工智能的三个阶段。
第一个阶段是计算智能,计算机可以算,这个是计算机诞生那一天就有优势,速度就是快,存储的就是多,我们每天用的搜索引擎或者地图搜索远远超过人类,这都是属于计算智能。阿尔法狗一定意义也是计算智能。
第二个阶段是感知智能,对应的就是我们的能听会说,能看会认,这个是类似所有动物都有的智能,都有视觉和听觉。这个阶段随着深度学习的突飞猛进的进步,计算机的能力已经越来越逼近人类,在某些任务上,已经超过了人类。
第三个阶段是认知职能,能理解会思考,里面核心的就是人类语言的语境,人类语言包含信息非常丰富,里面涵盖的知识也是非常的丰富,计算机如何理解语音,更好的为我们服务,这个是我们现在人工智能所面临的非常难的一个难题,也是各大研究机构争相研究的话题。
讯飞提出的这三个阶段,基本作为业界公认的共识。
我们看讯飞在这些年的研究进展。
首先是感知智能方面,讯飞是做语音起家的,从99年创业开始,做语音的合成,实际就将文字转化成流畅的语音,相当于给机器撞上了嘴巴。讯飞现在的技术达到世界第一,从06年开始参加暴风雪大赛,连续12年都是冠军,现在可以做到非常流畅的去合出人的声音,有不同的音色,有可能有人看到过奥巴马的视频。
第二个是语音识别技术,相当于撞上了人工的耳朵,不仅是要识别出语音中的内容,还有说话人的识别语种识别等等,讯飞输入法特别好,准确率达到了98%。
还有讯飞独创技术,是语音的评测技术,是我们从05年开始研究的,以往的口语考试都是老师评分,现在用机器评分,比人更加准确,更加接近于专家的评分,所以在全国的普通话水平考试里,已经全面的应用到了讯飞的技术,在一些中高考的英语口语考试也在不断的推广应用。
讯飞也做图象识别,我们这里举了一个例子,是手写图文识别,比如考试完以后,我们要对作文进行识别,这里面的难度就是学生可能写的字非常潦草,而且手机上的手写输入法没有笔顺的信息,讯飞基于大量的数据,用深度神经网络端到端的学习已经达到了国际领先的水平,已经在教育和快递单领域开始使用。
下面的例子就是在扫描阅卷里,我们首先扫描完了以后识别文字,进行自动的评分,当然后面自动评分的部分属于认知智能的部分,比如这个是英文的,我们会判断它的语法错误,拼写的错误,还有它的句子是不是流畅,还有它是不是地道等等,从各个方面去评价,最后给出一个分数,这个分数我们同样跟专家进行了比较,我们的评分水平是更接近于专家的。
这个例子也是医学领域的图象识别,我们参加了医学影响比赛,做的是肺部结节的检测,X光片,这个结节可能是肺癌的征兆,我们都知道传统来说这种片都是医生用肉眼去看,经常会有一些漏诊,我们在一个北京的知名三甲医院,医生的阅片漏诊率达到30%,本来可能他是有肺癌,医生阅片的时候漏掉了,尤其是肺癌早期不明显的情况下,给漏掉了,耽误了最佳的治疗时间,我们的阅片技术可以很好的解决这个问题,我们现在准确率可以达到94%。
刚才讲的是感知智能,2014年我们也依托于863的类答题项目提出讯飞超脑计划,目标就是让机器人考上大学,为人答题。我们这些年也有一些进展,在知识图谱的构建有一些进展,我们去年参加了比赛,这个比赛是给你一段话,让你把中间的概念识别出来,链接数据库对应的试题里,里面最难的任务就是有一些重名,比如布什有重名,比如小布什,我们取得的第一名。
第二个例子,我们在斯坦福今年的机器阅读理解任务上取得第一名,这个任务是非常火的,微软还有脸书等等都在参加,给你一篇文章,让后让机器阅读,之后提问题,让机器回答,我们的准确率是排在第一的。
大家都知道晓译翻译机,现在可以支持中文到英文、法文和西班牙文等多种语言的相互翻译,中国人出国旅游的时候非常方便,在京东多次断货。第二个产品,丁东音响,跟京东合作的国内首款智能音响,把它放在客厅可以交互,获得互联网的内容,也可以去控制智能家电,比如打开空调等等,第三个是阿尔法小蛋,是面向儿童的产品,可以跟小朋友进行交流。第四个是晓曼机器人,可以做智慧导诊,比如患者来了以后想找一个科室,找不到可以直接问机器人。
还有就是智慧城市,我们也是打通了各种大数据,去做交通和公安等等,其实最终的目的是方便老百姓办事,这是我们的理念,有一个例子,在杭州或者浙江某一个地方,老百姓办事的效率从原来的需要10到20天的时间,缩短到了1到2天,原来需要跑2到3次,现在就一次搞定了。
机器人可以做人脸认证,去替代柜台的办事人,帮你去开各种证明等等。
智慧教育方面,可以自动的阅卷,帮助老师减负,帮助学生更好的批改作文,另一方面是个性学习,每次考试完成以后,人工智能可以分析出你这个学生知识点的掌握情况,根据知识点的掌握情况去布置个性化的作业,比如发现你某个知识点掌握的不好,这个时候可以布置这方面的作业多一些,对于那些掌握的比较好的知识点,这方面就不需要做重复练习了,所以每次考试完了以后,每个人的课后的错题作业都是不一样的,都是个性化的,对于老师来说也是一样的,可以分析出整个班级或者是整个年纪的情况,老师可以做针对性的教学,实现因材施教。
智慧医疗大家都听说了,今年我们机器人全球首次的通过的职业医师资格考试,以456的高分通过,分数线360,成绩非常好,在安徽省内达到5%以上的排名。我们是通过阅读大量的医学资料教科书以及很多的真实病例学习到的大量医学知识,使得人工智能有一些医学的能力,结合当前的患者的信息去判断到底可能是什么疾病,或者要做进一步的什么检查去确认,最终给出一些诊疗的方案。
最后,我们觉得一家的力量有限,我们把人工智能的能力统统打包到云平台上,我们叫UI开放平台,把人脸识别和语音合成以及手势翻译等等的能力放在云平台上封装起来,供广大的开发者使用,现在支持的用户数达到14亿,人交互35亿,支持的第三方开发者达到了43万。
希望跟大家一起来在中国用人工智能改变世界,谢谢大家。