我们正处在难得的历史机遇期,数字化、智能化已经出现拐点。
4月21-25日,百分点受邀参加首届“数字中国建设峰会”,为了契合“成果展示平台“的定位,特展示了人民日报和人民数字联合百分点推出的“中国智能作诗词机器人——AI李白“。值得强调的是,在峰会同期邀请到了《中国诗词大会》总冠军——外卖小哥雷海为,与机器人现场斗诗,最终孰胜孰负?
从产业角度看,从政府到企业到人民百姓,发展数字经济成为各方认可的方向。那么,在人工智能应用爆发、数字中国建设高峰期,人工智能领域还需要实现哪些技术突破?如何领跑数字经济?
人机大战再次升级
此次斗诗是人机大战的升级,是一场人类高手与AI作诗的较量,更是一次人工智能认知层的突破。
相较以往的人机大赛,无论是围棋大战还是德州扑克对决,大都是基于数据驱动,是随着算法和计算力的提升而取得的机器胜利。
然而目前在语义理解上,突破者甚少。百分点将深度学习引入到自然语言处理技术中,并结合动态知识图谱,基于对80万首诗词文章的学习,可根据不用的语境智能生成唐诗以及五十多个词牌的宋词,对传统文化与最新的人工智能技术进行了创新融合。
实际上,AI李白的首次曝光是在春节期间,主要围绕新年送祝福主题。此次峰会上展出了第二个版本,不仅可以让人体会到“一秒变李白”的神奇,还能与人互动对“飞花令”,将《中国诗词大会》由线上转到线下真实场景中,让人工智能应用普惠到更广泛人群中。并且更好玩有趣,机器人可识别观众语音,根据语音生成个性化的诗和词。
也因此,在人民日报旗下人民直播平台上,全程直播了这场AI李白挑战雷海为的斗诗赛,结果不出意料,人类高手雷海为赢得比赛。直播的同时,基于乐调查的实时在线投票中,支持AI李白的观众反而占了一多半。
对此,百分点董事长兼CEO苏萌博士认为,在即兴创作诗词的挑战赛中,人机各领风骚。在全文逻辑和情感细腻度上,人类高手更胜一筹;在写作效率和短文本的用词上机器后来居上。
经典古诗词是语言中的精华,充满人类情感,可以使语言思维得以升华。这就如同AI李白,也是通过NLP和知识图谱对古典诗词进行语义理解,自动学习发现诗词中的特征和规律,捕获上下文复杂的语言依赖关系,从而训练出智能作诗的模型。未来在深度学习算法持续升级换代后,系统也会持续进行自学习、自优化。
苏萌博士表示,这场斗诗赛,意味着机器已经走进艺术领域,可以理解人类,进行一些创造性突破。希望今后可以用大规模盲测的方式量化评估人与机器的诗词创作水平。
未来突破
AI正在以人类无法想象的速度演进。
最近几年,随着大数据技术、算法以及GPU计算能力的大幅度提升,使得神经网络的计算效率得到了显著的提升,深度学习在图像、人脸识别等感知层已经实现明显突破,比如峰会现场“刷脸”入场采用的人脸识别技术,其准确度高达99.7%,已超越人类。
苏萌博士认为,智能是解决实际问题的智能,智能进化三部曲包括感知、认知、决策,其中智能决策是其终极智能。然而,从感知到认知再到决策,每一步突破都会越来越难。尤其是NLP被比尔•盖茨形容为“人工智能皇冠上的明珠”,处于认知智能最核心的地位,一旦技术突破将会推动人工智能整体的进展。
但是目前,NLP目前依然处于基于浅层语义的分析阶段,缺少对现实的理解及对现实通用知识的掌握,在效果提升上已遇明显瓶颈。
百分点早在2016年将深度学习引入自然语言处理上后已意识到此问题,便着手在知识图谱结合自然语言上进行探索研发。目前百分点在分词识别准确度已经达到98.97%、实体识别准确度达到91.45%,已走在了行业前沿。通过自然语言处理技术,理解人类的语言、思维,语言是人类文明传承的载体,一旦机器学会人类语言思维,可以推动知识图谱的进一步发展,机器可以更好的“读懂”人类。
此次斗诗大赛,说明了百分点在自然语言生成技术(NLG)方面实现了突破,也是人民日报社联合百分点引领国内媒体率先探索智能采编业务的体现。在认知层,百分点将持续投入研发,实现更多突破。
在会上,人民日报数字传播有限公司董事长徐涛表示,已与百分点达成深度战略合作关系,希望将百分点在人工智能领域的突破性技术应用到人民日报数字屏幕上,给社会提供更多的数字文化产品。
各种人机频繁上演的背后,实际上是意味着我们已经进入到人机共生的未来社会新常态。如果说90后属于互联网原住民,那么现在的青少年,就是人工智能爆发期的原住民。因此,展馆中处处可以看到“带娃参会”的场景,更有中小学校组织学生来参观。
未来,AI2.0时代产生的各种应用产品,会让人类生活更加美好,另一方面,不善于使用人工智能的,会真正被同龄人抛弃。
领跑数字化转型
在峰会主论坛上,国家网信办发布了《数字中国建设发展报告(2017年)》。报告指出,我国数字经济规模已经位居全球第二,尤其是“互联网+政务”让人民群众获得感显著增强。无论是政策层还是实际应用场景都已明晰,未来将进入加速跑阶段。
那么需要思考的是,如何才能领跑?在数字中国建设进入高峰期之时,所处的是数据密集型和知识密集型时代,数据是数字经济最基本的物质基础,人工智能技术是其技术手段,以其为代表的新一代信息技术将成为拉动数字经济的新动能。
百分点自2015年开始深耕数字化转型,为解决企业机构实际问题,基于大数据全栈技术和人工智能认知技术进行双轮驱动,通过语义理解将信息知识化,从语义到知识,最终支撑政府进行智能决策。
目前,百分点已经覆盖主流媒体出版机构、政府公务事务、智能制造、零售等龙头企业,并建设了海外国家级大数据和人工智能平台,是国内实体经济数字化转型和数字经济国际合作方面的先行者。