目前人工智能正在从感知智能走向认知智能,将带来新一轮的技术变革和社会经济变革。
4月7日,百分点科技特别邀请百分点认知智能实验室名誉主任、自然语言处理(NLP)领域的国际著名学者、ACL终身成就奖得主、中国中文信息学会名誉理事长李生教授,以“人工智能正在由感知走向认知”为主题进行了讲座分享。
|感知有所突破 认知还在路上
李生教授认为,人工智能经历了规则推理、机器学习和深度学习三个阶段,基于多层人工神经网络的深度学习是目前人工智能最有效的学习算法。深度学习在识别(感知智能)上已有突破,但在理解(认知智能)上还有局限性,即将碰到天花板。
这是因为,人类对世界的认识可分为感性认识和理性认识两种,感性认识只能看到事物的表象,理性认识能察觉到事物的本质,能更深刻、更全面、更可靠地反映事物的本来面目,从而引导人们按规律办事,有效地改造世界。
人工智能是对人类智能的模拟,也因此,感知智能对应着感性认识(识别),认知智能则对应着理性认识(理解)。
目前,深度学习在人工智能两大应用技术——机器视觉和语言语音处理方面都取得了“识别”上的突破,同时也遇到一些“理解”上的挑战:
在图像识别方面,深度学习甚至超过人类。有了深度学习之后,机器自动提取特征,解决了人工提取难度大、效率低的问题,图像分割、目标检测、目标跟踪、图像检索、图像增强和图像滤波降维等都有了极大进展。但它自适应性及泛化能力还不强,光线以及遮拦都可能降低其稳定性。
同时,计算机视觉还有一个更重要方向——三维重建,它要求对图像进行语义理解,通常用于与环境的有效交互。比如CT等医学影像的三维重建,还有自动驾驶及VR、AR等方面,需要走重建与识别融合的道路。
在语音处理方面,语音处理(识别)属于感知的范畴,而语言处理特别是文本语言的处理则需要更多对语义的理解。语言理解的实质是语义理解(说话人的意图),目前还十分困难,一方面是由于语言的歧义性(一词多义)和多样性(一义多词);另一方面是高度依赖知识,除上下文内容之外,还有语言知识(语法结构)、专业知识、背景知识、常识性知识和先验知识等。
语义理解是自然语言处理(特别是机器翻译)的重点也是难点,如何从形式与意义的多对多映射中,依据当前的语境找出一种最为合适的对应,是语义理解的核心问题。
也因此,无论是计算机视觉还是语音识别,都需要“理解”能力。但由于当前人工智能缺乏理解,导致“认知还在路上”。李生教授认为,人工智能进一步的发展必须逾越人类大脑思维能力鸿沟,解决不了推理问题机器就难以实现真正的认知。
具体来说,深度学习目前还是引领人工智能发展的核心技术,作为多层神经网络,受脑神经科学的启发而发展起来。深度学习是联结主义代表,基于概率统计的算法,采用监督学习方式,并需要用大量标注数据去训练模型,再用训练好的模型去测试未知数据。
但是,基于统计的数据驱动方法可能准确率很高,但其鲁棒性差,经不起干扰,性能高低主要取决于训练数据的质量。
而符号主义是研究并模拟人的思维方法,使用符号、规则和逻辑来表征知识,进行逻辑推理。因此,未来的机器理解也应该像人一样,走归纳与演绎融合的道路,将联结主义与符合主义相结合,将统计与推理相结合。
|从学术界出发 在产业界落地
总体来说,当前人工智能仍然依赖算法,所用的深度学习算法还存在着不具备小样本学习功能、泛化能力和抗干扰能力不强、不具备思考和知识推理能力等一系列局限性,人工智能的研究任重道远。
近年来,深度学习不断在网络深度和网络结构上做文章,但不管怎样,它还是受脑启发而不是类脑,人工智能与人类智能比较起来还存在着没有意识、不能思维、不能推理等一些根本性的差异。
因此,李生教授认为,不具有完全推理能力的人工智能不能算作真正的人工智能。人工智能的未来应该是逐渐逼近人类智能,可能会有人脑思维和电脑思维两种途径,因此要从二者的差异入手,找出人工智能未来发展的出路。
未来需要研究与应用并进,从学术界出发、在产业界落地,用产业落地来推动学术的进一步突破。研究与应用并进,技术与产业需求结合,变成可以落地的应用系统。
在互动交流中,被问及人工智能未来的发展方向时,李生教授表示,近年来人工智能主要是归纳综合,还不是演绎推理,比如GPT-3等训练模型体量大,能处理TB级的数据容量,但都属于蛮力操作。
李生教授介绍,人工智能是个多学科交叉的技术领域,大家要不断学习,启发自己的思维,从现有的多学科研究成果中不断获取经验,从而实现创新实践。生物需要智能,市场也需要智能,做一个学术界和商业界兼得的优秀智能人才。
由于机器善于计算数据,人类善于处理知识;机器对于解决静态的,确定性的问题是强项,而人类经常遇到的是动态的不确定性的问题。因此,要想突破人工智能的局限性,需要用脑科学牵头,带动计算机科学和数学等学科的深入研究。
未来要进行“两个加强三个结合”,一方面要加强基础理论研究,包括脑科学和认知科学、数学(微积分,线性代数,概率统计,逻辑推理)和计算机科学(算法,结构);另一方面加强基础设施建设,包括芯片、传感器、算法和平台。
同时,在基础理论上进行学科交叉,用脑科学带动数学和计算机科学,其算法是核心,学习一点复杂性和不确定性理论,研究一下复杂性和不确定性算法。
具体来说,要将软件算法与硬件芯片结合、知识推理与数据统计结合、机器计算与人类认知结合。 单纯的经验论和单纯唯理论都会束缚人工智能的手脚,只有在理论基础上取得根本性突破,才能避免走进死胡同。
李生教授表示,人工智能的发展在于对人脑智能机理的逼近程度,是让机器理解、掌握并运用人类知识。 机器永远是人类的助手和工具,面对它、掌握它、用好它,人机融合才是发展的出路。