秒懂讯飞输入法智能拍照输入黑科技 看完这篇就够了

 当今社会,在线办公已成为新常态。尤其是互联网打工人,手机是电脑之外最重要的信息传递工具。如何在手机上快速录入大篇幅地信息,高效誊抄手写记录,便捷输入数理公式……让人头疼不已。为了解决以上种种难题,讯飞输入法重磅发布了“智能拍照输入”,开创拼音、语音、手写之外全新的输入交互方式,通过“拍一下”的简单操作搞定各类复杂信息的录入,开启效率输入的新篇章。

云图片

    伴随A.I.技术的成熟,我们所使用的第三方输入法智能化程度不断加深。讯飞输入法发布的“智能拍照输入”融合了行业领先的文字识别、手写识别、公式识别、图像理解、机器翻译、知识图谱等A.I.技术,拥有多场景、更智能、更准确的特点。现在打开讯飞输入法新版,开启“智能拍照输入”,不用键盘打字,就能支持中、英、日、韩、德5国印刷文字和手写体识别,英语和日语拍照翻译,数理公式一键上屏等功能,此外还支持数学作业智能批改以及一键生成office电子档,极大拓展了输入法的应用边界。

云图片

    那么“智能拍照输入”是如何实现的呢?这背后离不开科大讯飞的核心技术。据悉,采用基于语义分割的文字检测技术与超大底层感受野网络以及适用于自然场景的数据增强技术的混合,大幅提升文字识别能力,无惧图片模糊、超远距离、角度扭曲等问题。 

云图片

    面向数学公式识别难题,提出了基于树形结构信息建模全新的端到端识别算法,实现特殊符号“所拍即所得”。截至目前,科大讯飞在图文识别领域已经历四代识别框架,代表业界算法演进的趋势。

云图片

    值得一提的是,其第四代框架结合图卷积神经网络(GCN)等结构化分析技术和基于生成对抗网络(GAN)的图文数据生成技术,有效解决了通用问题。

云图片

    得益于A.I.视觉技术的精进,科大讯飞屡次在行业大赛中摘得骄人成绩,譬如在ICDAR ReCTS评测任务中刷新全部四项识别榜单的世界纪录;在ICFHR2020 OffRaSHME数学公式识别挑战赛中获得冠军;在计算机视觉顶级会议CVPR2019和文档分析与识别顶级会议ICDAR2019上的多项评测任务中获得冠军;在ICPR2018 MTWI图文识别挑战赛中包揽全部三项任务的冠军。通过A.I.技术与互联网服务深度结合,使输入法变得大有可为。

    如今,全民数字化生活进程在加速,智能升级、数字转型、创新融合与消费者的关系愈加密切。从无人驾驶技术到智能机器人,从智能家居到日常用品,不可否认A.I.已不仅是实验室名词,而是深入到我们生活的方方面面。

云图片

    易观分析师认为,输入法作为集合强A.I.能力的交互入口,其多元应用场景也被进一步打开。移动输入的智能化程度、个性化程度受到供需两端的极大重视。

云图片

    从艾媒咨询《2020年秋季中国第三方手机输入法市场监测报告》得知,在线办公和在线教育场景中,纸质办公文件和教材内容多,输入所需时间长,文字识别可以实现图片转文字,有效提升输入效率,成为受访用户最感兴趣的功能,占比分别为38.2%、34.8%。

    接入A.I.视觉等技术解决方案后,讯飞输入法为互联网打工人的手机赋能,带来信息处理效率的大幅提升。从用户体验看,智能拍照输入“拍一下”,使原本数小时的信息处理工作几分钟就搞定。由此可见,A.I.赋能的输入法将带动整个在线办公领域的蓬勃发展。

    作为“中国人工智能国家队”一员,科大讯飞始终坚持源头核心技术创新,持续拓展行业赛道,面向消费者推出多款智能产品及服务,讯飞输入法便是其一。现阶段,随着A.I.技术和智能硬件的发展,讯飞输入法的发展重点不断将新技术融入到使用场景中,探索全新的输入方式,进而提高沟通效率、丰富表达内容、增强输入体验,真正为人们带来极大地便利,让每个人都能好好感受用A.I.建筑的美好世界。