所谓木秀于林,盛名之下,觊觎者众。被业界公认为人工智能“皇冠上的明珠”的认知智能,正在被全球领先的科技企业竞相逐鹿。
作为本领域龙头企业之一的神州泰岳,自10年前便开始在认知智能领域持续探索,长期积累下已取得了显著成绩。2018年6月30日,神州泰岳亮相2018中国国际软件博览会,正式上线全国首个智能语义开放平台——中文信息(深度)处理开放创新平台。
在此次软博会人工智能高端论坛上,工信部及软博会组委会选择并推荐神州泰岳副总裁李国东发表主题演讲,阐述神州泰岳多年来在语言智能领域的基础技术研究、产品落地上的贡献,同时展示了中文信息(深度)处理开放创新平台在打破中文认知领域产业壁垒,加速产学研落地,构建并推动整体产业生态发展方面所作出的贡献。
深度聚焦智能语义 实现产学研用育完整闭环生态
“人工智能的两个重要部分:“感知”和“认知”。我国的汉语及少数民族语言构成了我们独特的中文认知智能领域。我国早在1981年就由著名科学家钱伟长倡导,成立了中国中文信息学会,学会专注于中文认知智能、语言智能、语义智能领域的研究,集中了这一领域的所有专家学者。中文信息学会作为国家的一级学会甚至比人工智能学会还早。在认知智能领域的世界最高学会ACL,我国已经送出了两任理事长,我国科学家李生还获得了ACL的终身成就奖。在学术研究和基础技术上我国在这一领域处于世界前列。
相对于轰轰烈烈的学术研究界,我国认知智能产业落地方面还处在成熟前期,尚没有像感知智能一样大发展,阻碍发展的主要障碍来自于:
第一,本领域技术门槛高,技术需要长期积累,一个算法一个技术改变不了整体。
第二,在认知智能产业,早年具有战略眼光的公司不多,时至今日才感觉缺少长线布局。
第三,大量的技术成果基本都掌握在能够长期潜心基础研究的学校和研究机构当中。
第四,大量的技术成果尚没有完成成果落地和商业转移,长此以往将阻碍技术的进一步发展。” 中国中文信息学会秘书长孙乐与神州泰岳副总裁李国东在谈到我国认知领域现状时一致这样认为。
认知智能的核心是自然语言理解,自然语言理解的核心技术就是语义理解,或者叫智能语义。在智能语义方面,神州泰岳至今已经进行了十多年的耕耘和技术积累,堪称国内最早专注于认知智能领域的公司,同时由于公司长期业务的复杂和繁琐性,神州泰岳在基础技术以外更擅长于人工智能的应用和解决方案的落地,因此获得了国际评估机构Gartner的积极关注和肯定。
正是由于神州泰岳的专注和坚持,2017年底,得到了我国认知智能领域的最高学会中国中文信息学会的认可,唯一指定了神州泰岳为学会产学研落地的合作伙伴,同时指导神州泰岳开发、建设了中文信息(深度)处理平台。
据神州泰岳副总裁李国东介绍,中文信息(深度)处理平台是依托于中国中文信息学会会员,专注于认识智能、语言智能,语义智能技术和产品及服务,平台将囊括大部分专家学者的科研成果和产品,以及相关合作伙伴打造的产品的服务。
相比其他企业级AI平台,中文信息(深度)处理平台全面覆盖了中文语言智能及其相关领域最前沿的技术成果和产品,同时围绕认知智能打造开发工具、将技术PaaS化、SaaS化,构建并完成了产学研用育的完整闭环生态。中文信息(深度)处理平台肩负着整体认知智能、语言智能行业的创新、孵化和落地任务,是真正的产业级平台而不只是企业级平台。
从该平台产生的时间点看,认知智能正处于成熟前期,马上要进入大发展;从平台的特点看,跨产学研,跨企业的最全面覆盖,是真正的天然产业生态平台;从平台的目的看,更加开放,加速技术创新,加速产品落地。以上几点造就了平台的唯一性和无法复制性。
围绕认知智能领域,平台形成了“一云、四块、两线”的总体发展战略。
“一云”是基于现有公有云技术,附加开发工具和开发环境,构建完整的语言智能IaaS+PaaS+SaaS云生态。云端实现了平台随处可见、随处可用。
“四块”是建立在云平台基础上的四个核心业务板块:开放板块主要将本领域专家学者、合作伙伴、神州泰岳自身的技术以分为基础服务、应用服务、解决方案的几个维度,以多种形式在云端展示、开放,侧重技术和产品随处可看、可试、可用,降低技术和产品的匹配和寻找使用门槛;创新板块则提供AI创新辅助工具集、产品管理、实施咨询等工具类产品服务,侧重解决技术的产品落地和技术持续创新问题;数据板块则是针对大数据领域,为行业提供训练数据集、评测数据集、大数据工具集等数据服务,打破由于数据不足而造成的通用技术难以在垂直行业落地的壁垒;培训互动板块会涉及实训课程、智能问答中心、专家互动等多元培训服务,培养人工智能技术人才,降低技术沟通门槛。“四块”使整个平台贯穿了从成果展示品牌建设、创新项目落地、数据共享产品孵化到技术推广知识分享全环节。
“两线”则从线上品牌孵化到线下成果转化和落地推广,充分发挥了创新云平台的实用性与业务引领性。
平台一期已汇聚合作院校20余所,专家团队40余家,NLP服务120多个,覆盖了本领域的主要技术,今后将全面覆盖国内智能语义、中文语言智能及其相关领域最前沿和专业的技术成果和产品。该平台的正式上线使神州泰岳在语义工具数量上位居同行首位,同时神州泰岳率先将在平台上自身研发的基础服务免费开放、推动生态发展。
李国东副总裁表示,中文信息(深度)处理平台平台将加速企业孵化转型,是认知领域独角兽平台。未来,神州泰岳将继续以实际行动坚守人工智能语义发展战略。
为传统行业全面赋能 着眼语义识别的全场景应用
任何一个新技术最重要的是如何对现实场景进行改造、达到自身技术落地,对于与现实结合紧密的语义智能领域更是如此。经过多年的实践探索,神州泰岳的智能语义技术已经在公安、金融、政务、教育行业找到了众多的落地场景,并开始为传统行业全面赋能。
例如在智慧公安领域,认知智能、语义智能技术可以应用在刑侦、经侦、治安、情报、法制等非常具体的应用场景。通过整合案事件、现勘、笔录、警情、人口、网络数据等各警种来源的海量数据,并对数据进行交叉碰撞和智能分析, 从而更好地为公安局提供非结构化文本分析、数据分析服务、互联网数据采集服务、互联网数据分析与监测等服务,协助公安局完成公安业务数据的深度分析和挖掘等工作。
在金融领域,为了解决业务的规范表达与自然语言表达的复杂性及多样性之间的矛盾,基于智能语义、认知智能技术,具备完全面向业务建模的能力,可让研发人员专注于业务理解和业务表达,极大地缩短行业应用场景创新的研发周期,并提高应用质量。在银行业,神州泰岳连续拿下“中、工、建”等多家客户,并多次在于国际IT巨头的竞争中脱颖而出。
在智慧政务领域,基于中文信息处理,可提供多元数据的的智能公文辅助写作系统。同时结合知识图谱的技术,可以实现对重大事件的预知、预告、预判,另外综合管廊通信安防一体化解决方案,构筑起城市地下智慧神经系统。
智能语义领域想要取得更大发展除了自身的技术进步外,更重要的在于通过生态伙伴的广泛合作,不断积累技术和行业经验。如今,神州泰岳在中国中文信息处理学会指导下,已平台一期率先聚集了清华、北大、哈工大、北师大、苏州大学、东北大学、中科院自动化所、软件所等国内20多所自然语言处理核心研究机构的40余团队,今后更将扩展到学研的全面覆盖和企业的大面积覆盖,将行业应用、数据、实施能力与先进技术配套结合,让人工智能技术能真正具体的服务于企业、行业、社会,共同构建行业生态,充分释放AI的生产力。
以此次软博会和平台一起上线为契机,神州泰岳将致力于全面打破认知智能的壁垒,利用产学研联合进一步强化自身技术,通过打造产学研用育的闭环生态,为智能语义与其他行业的全面融合打下坚实基础,并最终推动认知智能走向成熟。