一个开发平台的“魔力”:华为云ModelArts如何让人工智能“普惠式”落地

近日,由西安航天基地主办、华为技术有限公司承办的“华为云杯”2019人工智能创新应用大赛正在火热进行。大赛聚焦AI应用落地场景进行全场景创新,通过以赛促学、赛教结合的形式开展,并提供资本对接和创业辅导来助力创业者与企业持续发展。同时,大赛将综合科研教学成果及商业领域需求,探索用AI来解决真实世界问题的可行性,为需求方和开发者提供联接的桥梁,搭建一个技术交流、人才培养、机遇共创的AI开发者平台和生态。

 据了解,大赛面向全社会开放,个人、高等院校、科研单位、企业、创客团队等均可报名参赛。本届大赛设置启动仪式、初赛、决赛、颁奖仪式四个主要环节,计划2019年12月下旬完成初赛,2020年2月下旬进行决赛,冠亚季军和优胜奖将分别有10万元、5万元、3万元和1万元的奖金激励。

 参赛选手们将通过比赛图片集进行图像分类模型的应用开发,大赛组委会此次也为选手们提供了华为云ModelArts进行云端AI开发。作为一站式AI开发与管理平台,华为云ModelArts具备为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力。选手们通过ModelArts可以快速完成AI模型开发与部署,管理全周期AI工作流。

 AI产业规模化的挑战

 人工智能(AI)是近几年科技产业最重要的技术发展趋势。毋庸置疑,当前AI产业正在快速发展,各行各业都在试图共享一波技术红利,引领行业技术创新发展。企业也正努力将AI导入自己的产品,以创造更多附加价值。在这一过程中,AI应用的开发至关重要。但是在AI开发面前,企业与开发者存在着诸多的难题与挑战。

 对许多开发者来说,人工智能应用的开发,仍存在极高的门槛。我们知道,人工智能的应用开发可分成“云”与“端”两大部分。云指的是云端数据中心或超级电脑,具有强大的运算能力,负责执行模型训练工作;端则是指用训练好的模型进行推论的各种边缘节点设备。对应用开发者而言,模型训练是人工智能应用开发的起点,也是许多问题的根源。

 在AI应用开发过程中,我们不得不面对开发效率低,标注、训练、部署整个过程耗时,以及稀缺与昂贵的算力。AI产业若要规模化走进各行各业,助力企业AI产业化应用,就必须要降低AI开发门槛和难度。而开发者在AI开发过程中也存在诸多痛点,例如,随着数据量不断指数级增长、模型越来越复杂、计算过程愈发耗时,以及众多晦涩难懂的AI开发工具导致AI开发效率降低,这不仅降低了开发者的开发热情,更阻碍了AI产业的规模化发展。

 深度学习作为人工智能崛起的主要原因,是开发者必须要学习的技能,但是对于普通开发者而言,掌握深度学习模型训练的时间成本相当高,这也降低了AI开发者的开发效率。AI开发者尚且面临如此多的困难与挑战,对于那些缺少算法开发和调参能力的AI初学者来说,更是一条无法逾越的障碍。

 在这样的情况下,对于AI工程师、业务开发者,甚至“小白用户”,能快速完成AI模型开发与部署,顺利完成业务开发上线,一个“用得起、用得好、用得放心”的AI开发与管理平台必不可少。

一个理想的AI开发平台

 为了帮助开发者解决AI应用开发的种种挑战,华为云ModelArts应运而生。ModelArts这个名字既有“模型的艺术”的意思,同时也蕴含了华为云以普惠AI致敬开发者,助力广大AI开发者能够便利地借助此平台成为AI开发(建模)大师之意。

 作为一站式的AI开发与管理平台,华为云ModelArts集跨场景、软硬协同、端边云一体等多方位的优化经验于一体。“一站式”是指AI开发的各个环节“开箱即用”,包括自动学习、数据处理、算法开发、开发管理、模型训练、推理服务管理、部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要过多把精力放在底层技术上。同时,ModelArts支持像TensorFlow、PyTorch、MXNet等主流开源的AI开发框架,支持传统机器学习算法运行,如逻辑回归、决策树、聚类算法等;支持CNN、RNN、LSTM等多种类型的深度学习算法执行;也支持开发者使用自研的算法框架,匹配开发者的使用习惯。

 针对业务开发者,华为云ModelArts提供了自动学习功能,无需关注模型开发、参数调整等开发细节,仅需三步(数据标注、自动训练、部署上线),即可完成一个AI开发项目。尤其边标边学的智能化数据标注支持图片、语音、文本、视频等常见标注及自动驾驶、医疗等领域标注任务,标注效率提升70%,在特定领域可提升人工标注效率10倍。

 针对有一定AI基础的AI初学者,ModelArts基于业界的主流引擎提供了预置算法,无需关注模型开发过程,直接使用预置算法对已有数据进行训练,并快速部署为服务。预置算法可用于物体类别和位置、图像分类等场景。除此之外,ModelArts可以实现以最低成本完成最优效果的呈现结果,即根据开发者的推理速度与最终部署环境,自动生成满足要求的模型。

 截至目前,ModelArts已经拥有开发者超过4万;今年5月,更是在斯坦福大学DAWNBench榜单以2分43秒的成绩获得图像识别训练时间世界第一。

多场景加速行业落地

 经过持续的技术创新与实践积累,目前,华为云ModelArts支持图像分类、图像检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景,这也让AI的行业应用有了更多想象空间。比如在水利方面,企业可以将检测漂浮物的数据上传,通过自动学习能力,ModelArts帮助标注并自动生成模型,监测水面污染情况。在建筑行业,过去通常是工人用笔在钢筋切面上点划来计算钢筋数量,算得又慢又可能出错,一般都要核对很多遍,而运用ModelArts图像检测能力后,能自动识别钢筋的切面,能快速数出钢筋有多少根,而且比人工的准确率更高。此外,ModelArts还可以使能一些更加智能的应用,比如人脸识别,强化学习策略、强化学习控制、对抗生成网络等。

 在行业落地方面,华为云ModelArts平台也进行了诸多探索和实践。在垃圾分类方面,华为云举办了人工智能大赛·垃圾分类挑战杯活动,该活动旨在运用人工智能为垃圾分类乃至千行百业带来更多可能性。现实生活中,垃圾形态、拍照时角度、光线、背景等差异,往往使得AI训练集的数据难以识别垃圾的庐山真面目。参赛选手利用ModelArts克服并解决这些难题,从而构建出能准确识别垃圾的模型。

 在医学AI方面,金域医学病理专家团队与华为云AI团队合作,在ModelArts平台首次基于病理形态学,通过深度学习技术,训练出精准、高效的AI辅助宫颈癌筛查模型。该模型在排阴率高于60%的基础上,阴性片判读的正确率高于99%,同时,阳性病变的检出率超过99.9%。这是目前国际上已公布的AI辅助宫颈癌筛查的最高水平。

 此外,雨林保护组织RFCx利用华为云人工智能服务与ModelArts工具,构建能检测、分析蜘蛛猴叫声的智能模型,从而获悉蜘蛛猴的栖居地、威胁信号、生活习性等数据,从而协助护林员保护蜘蛛猴这一濒危物种。

 从上述行业实践,我们看到了AI给各行各业带来的变革,同时我们也看到了ModelArts在赋能行业客户进行应用创新方面的巨大推动作用。

 华为云ModelArts不止步

 华为云ModelArts平台已经成为华为云构建AI开发生态的重要篇章。2019年3月,华为云进一步面向开发者推出了华为云AI市场,该市场是在华为云ModelArts一站式AI开发与管理平台基础上构建的开发者生态社区,其中包含的华为云AI模型市场是国内第一个提供发布及订阅AI模型服务的平台。此举旨在为高校科研机构、AI应用开发商、解决方案集成商、企业及个人开发者等群体,提供安全、开放的共享及交易环境,有效连接AI开发生态链各参与方,加速AI产品的开发与落地。

 华为云ModelArts不止步于此,未来该平台还将搭载华为自研昇腾310和910芯片的模块和服务器,持续实现软硬件协同设计和优化,为开发者提供更高性能的训练和推理的计算能力,以及更优的价格体验。除此,将集成更多数据标注工具,并持续服务于自动驾驶、智能制造、智慧城市等更多新型应用场景。华为云ModelArts已经不局限于是一个理想的AI开发平台,也成为华为云践行“普惠AI”的重要抓手,助力AI产业在未来大放异彩。