日前,以“软件赋能数字经济 创新驱动数字中国”为主题的2019(首届)数字中国创新大赛启动新闻发布会在京召开。作为第二届数字中国建设峰会的重要组成部分,本次大赛旨在聚焦大数据、人工智能、工业互联网等新一代信息技术,解决数字经济建设发展中的痛点、难点,推动新一代信息技术和传统产业的深入融合,助力数字中国建设。
华为作为大赛的出题方之一,提出了赛题“文化传承——汉字书法多场景识别”。
“AI(人工智能)作为助力‘数字中国’建设的核心技术之一,如何能够快速普及和应用一直是困扰大家的难点问题。华为云就是想让现在‘高高在上’的AI变成大家都可以‘用得起、用得好、用得放心’的普惠AI。”华为云EI服务产品部营销总监桑宏宇说。
基于华为云EI的能力和实践经验,与开发者一起推动人工智能产业创新和发展,加速推进普惠AI落地,不再让AI技术成为高高在上的象牙塔,真正推进AI技术在某领域的普及和应用,是华为云的初衷。同时,华为也希望通过这次大赛,推动利用AI技术帮助解决社会或者大家实际生活碰到的问题,为整个社会造福。
作为此次大赛的出题方,华为在确定赛题过程中主要考虑两个大方向,一是偏向AI技术领域,聚焦人工智能领域中语音、语义、图像、人脸识别等技术的运用;二是偏向行业场景,例如人工智能在天气预测、提高生产效率等方面的具体应用。最终,围绕“数字中国”主题以及实现社会效益的目标,经过长时间的谨慎而全面的内部讨论,华为将此次赛题最终确定为:文化传承——汉字书法多场景识别。
书法是汉字的书写艺术,是中国文化的符号、中国传统文化的核心,需要不断传承并发扬光大。然而,生活场景下的风景名胜里的碑刻,建筑上的题词、对联、牌匾,博物馆里的字画作品,甚至寻常家居里悬挂的书法字画等,对于年轻一代而言越来越难以识别。“我们的技术工程师中也有很多传统文化爱好者,想到如果可以利用先进的AI技术,实时、准确、自动地识别出这些书法文字,对于记录整理书法艺术和传播书法背后的中国文化有着重要的社会价值。”桑宏宇强调。
目前,利用人工智能技术进行手写中文识别已经有了很大的突破,有很好的准确率。华为云EI的文字识别服务(OCR)已经在帮助德邦等物流公司识别快递单,实现快递信息的高效精准数字化;帮助医疗机构识别各种医学化验单,实现医学检验化验信息的高效精准数字化;帮助保险公司识别各种保单,实现保单信息高效精准的数字化。华为云EI服务在各行业的应用极大提升了各行业的生产效率,降低了成本,为企业的智能化发展奠定了坚实基础。桑宏宇提到,“华为云EI的OCR服务在企业应用时,我们发现很多行业有手写体识别的需求,而整个AI行业中手写体的识别精度都有很大的提升空间。”
“文化传承——汉字书法多场景识别”赛题涉及到对多种技术的考察,例如包括图像描述、图像检测、图像编码、图像分割等图像处理技术,包括深度学习理论、算法和神经网络的深度学习技术和包括需求分析、方案设计、编码、测试等计算编程技术。同时,该赛题对于参赛者的考察也是全面系统化的,参赛者需要了解深度学习模型,例如深度神经网络(DNN:Deep Neural Networks),能根据实际问题选择合适的模型。熟悉 Tensorflow,Pytorch等框架,能根据实际问题选择合适的框架,并使用框架能力进行模型训练和应用开发。
谈及本次赛题的最大难点,桑宏宇表示,“难点主要聚焦在由于书法背景多样化和字体风格多样化带来的AI识别挑战。”书法文字印刻在石头、石碑、宣纸、木头等不同场景且具有一定的颜色对比,同时存在纹路颜色不均衡、小面积被腐蚀等背景噪音,以上均对AI识别提出了不小的挑战,而篆、隶、楷、行、草等不同书体形态各异、不同书法流派风格独特,书法本身最吸引人的字体多样化则是对AI识别的另一重挑战。在以判断AI文字识别的准确率为主要衡量依据的背景下,考虑到相对较短的比赛时间、任务完成量以及任务难度,也为了鼓励更多参赛者愿意参赛、能够参赛,桑宏宇表示将会适当降低赛题门槛,对赛题中书法场景和字体作出限定,避免将比赛的AI设计变成一个庞大的系统工程。
华为在作为本次大赛出题方的同时,也会扮演导师的角色,并为参赛者提供技术和平台支持。此次大赛,华为推荐参赛者使用华为云今年10月最新发布的普惠AI开发平台——ModelArts平台,帮助参赛者在克服人工智能难题过程中提升效率,改善效果。ModelArts平台提供自动学习、数据管理、开发管理、训练管理、模型管理、推理服务管理、市场等多个模块化的服务,具有上手快、训练快、上线快特点。“相信未来开发者在使用华为云ModelArts开发人工智能应用时能够得心应手。”桑宏宇说。
未来,华为也将致力于将优秀比赛成果进行延伸开发,以实际行动促进数字经济发展,为数字中国建设贡献力量!