信息检索领域正在经历一场学术革命,从传统信息检索向智能信息检索与挖掘升级。9月20日,第二十五届全国信息检索学术会议(The 25th China Conference on Information Retrieval, CCIR 2019)将在福州召开,作为中国信息检索领域的高水平盛会,将成为这场革命的重要里程碑。在这次大会上,中国人民大学高瓴人工智能学院执行院长、北京智源人工智能研究院首席科学家、一览群智首席科学家文继荣教授将深度解读智能信息检索与挖掘这一课题,展示信息检索的学术未来。此外,一览群智还将在现场展示认知智能研究在行业应用的实践成果。
全国信息检索会(CCIR)是由中国中文信息学会和中国计算机学会两个学会联合主办的年度会议,是信息检索领域学术界、产业界共同参与的学术盛会;该会议是信息检索领域科研人员交流最新科研成果、理论与创新的平台。CCIR参会人员来自全国各地不同行业信息检索及其应用领域的专家、学者和产业界人士,会议议程除了包含国内外知名学者的大会报告、会议论文报告、Poster交流、评测活动外,还组织青年学者论坛、博士生指导论坛以及面向热点研究问题的前沿讲习班等。大会也邀请部分相关国际期刊、会议(如TOIS/SIGIR/WWW/WSDM/CIKM)的作者交流最前沿理论、技术与应用成果,推动了我国信息检索理论与技术的研究和应用的持续发展。
尽管传统信息检索与挖掘算法已有广泛应用,但是搜索技术的架构和交互界面已经30年未变,搜索的核心技术已经10年没有重大进步。因为用关键词检索的方式,表达能力有限,在使用过程中,通常和搜索工具的信息交互都是采用“一问一答”的方式,无法完整描述整个信息需求,搜索系统也不会主动交互和引导,只是高度依赖用户的表达能力,获得的信息也是千人一面。从更基础的技术来分析,传统信息检索与挖掘算法缺乏对底层数学与认知基础的理解,并未充分解决该领域核心问题,导致最终的搜索结果难以解释,算法效率难以提升。
“智能信息检索与挖掘”是搜索的发展方向,也是文教授在北京智源人工智能研究院领导研究的课题。这一课题将针对智能信息检索与挖掘的认知和数学基础以及下一代信息检索与挖掘算法与系统开展研究,力图在这一领域内部的基础理论方面取得突破。借助新的理论基础,构建新型信息检索与挖掘算法,搭建同时具备理论与实践意义的下一代信息检索与挖掘系统。
智能信息检索与挖掘,具体表现形式其中之一是智能信息助手,它将取代搜索引擎成为连接人与信息的新工具,用存储、计算和智能拓展人的能力,构建具有超级记忆力、知识能力和分析能力的“超级助手”,能够随时、随地方便地获取高质量相关信息和知识。
在打造智能信息助手的过程中,需要数学与认知理论基础、基于自然语言的交互式信息获取、知识增强的信息表示与挖掘以及深度语义检索与推荐模型,这些基础研究将在客观上进一步推动认知智能的基础研究,推动认知智能的发展。特别是在NLP、知识图谱等领域,将为这一场学术革命提供技术支撑。
比如,在知识增强的信息表示与挖掘,是要针对大规模、开放域、异构、稀疏的数据通过表示学习来做大规模的多模态异构的表示与关联,来构建多模态知识图谱。基于这些知识以及知识图谱能够对用户意图进行理解与表示,这个知识是表示意图理解。想基于知识、文本联合表示学习有必要进行这样的用户理解。基于知识的可解释检索模型。把知识图谱的研究成果与行业应用相结合,能够带来多样的应用革命。
信息检索的未来如何?我们将如何抵达这一未来?9月20日,CCIR 2019上找答案!