华为云的新长征:用全栈全场景AI再次摇滚

华为,可能是国内最具摇滚精神的企业。灵活大胆、富有激情,这些特质几乎写在了华为的骨子里,从最初的交换机起家,到运营商、网络、手机、企业、再到云。短短的3年里,在全世界从南走到北,在科技的前沿从白天走到黑,华为云走了很多公司一辈子都走不了的路。华为云最新的一段摇滚征程,就唱到了AI路上。这里,将会是华为云又一次盛大的演出。

AI开发,大象们的舞台

AI技术与云本身就是强绑定的。想要发展AI,只有两条路,一条是走专精之路,如讯飞、商汤等,另一条则是走综合发展之路,这条路就是大象们的舞台。凡是综合性AI玩家,没有一个能脱离云的帮助,国外的AWS、谷歌,国内如阿里、腾讯、华为。从大象也能起舞,到只有大象能起舞,这一局面是很多因素的共同存在导致的。

从开发角度来看,AI涉及到的内容极其繁杂,进而使得单一企业难以实现。仅仅从底层开发角度来看,机器学习、知识库、自然语言处理、语音语义识别、计算机视觉、机器感知、情感计算、神经网络以及各类强人工智能技术等数十个研发领域,这其中巨大的研发投入是普通企业难以承受。

同时,开源社区的发展让AI技术的业务领域得以进一步扩散,不少开源项目展现出极强的生命力。但是开源技术的不稳定性和前沿性并存,普通企业可以探索也能开发一下产品,但却很难全面掌控开源技术,一旦失败也没有巨头们的试错机会,只能在竞争中无奈退出。

AI技术发展还有一个典型的特点,那就是对数据的依赖性很强。在数据量不足的情况下,人工智能技术很难发展起来的。尤其是基于行业进行智能化升级时,行业数据将会是AI研发的加速器。当今时代号称信息爆炸的时代,海量数据用于AI模型和算法的训练再合适不过,近年来火力全开的深度学习和生成式对抗网络等都是需要大量的数据完成深度神经网络模型训练才能发挥其功效的典型代表。

如果说技术上的差距可以靠个别优秀人才来弥补,生态上的问题恐怕就是无解难关了。大型企业的优势在于生态和业务布局。原有业务生态提供大量的数据给AI模型进行训练和迭代完善,大量成型的AI技术及模型构建成可靠的行业通用型AI平台,当平台逐步完善成熟,再反哺回原有业务进行智能化升级,一条闭环的生态链会进一步构成企业的护城河,使得其竞争力独步天下。

以往的AI技术与云的关联性是很低的,但在近两年里,这一局面开始扭转。一方面是AI技术落地速度加快,云在各个行业已经扎稳根基;另一方面是由于云计算、大数据、AI技术相通性和相辅相成效果极佳,云计算能够解决AI系统根本上的算力难题,再加上如今5G技术正在大力普及,边缘计算和云也走向边云融合,AI的算力得到极大的满足,这也恰恰让原本的大型公有云服务提供商优势更加凸显。

算力的基础只有云吗?并不,还有芯片。国内能生成芯片的企业并不多,大型企业可能只有华为的昇腾、寒武纪、阿里的平头哥等寥寥数家,但芯片的重要性却无以复加,一方面自产芯片能够极大的适配业务,实现定制化生产,另一方面自主研发的芯片能够形成真正的技术闭环,端、边、云全线融合,进一步降低安全风险,保障软硬件和数据的稳定。

面对AI这一前所未有的巨大机遇,大象们虽然看似行动缓慢,但却早已翩跹起舞,开始寻觅属于自己的时代。华为云就是其中最为摇滚的一个。

摇滚的华为文化,激情的AI探索

根据IDC的数据来看,华为云在上个季度增速达到300%,为排名前五的几家云厂商中增速最快的一个。当我们习惯了华为云的速度之后,不难发现,华为云在AI方面也走到了舞台的中心。究其原因,华为云的后发先至可归功于其两大法宝:深厚的技术基础和摇滚的探索精神。

这个世界并不缺乏狂人,而区分狂言和豪言最可靠的办法,就是看结果。华为云曾经的愿景如今一一都在变成现实,这不难看出华为云深厚的技术底蕴。根源上来看,华为本身在通信服务、云计算、硬件终端等方面就有着深厚的技术积累;同时又统一了API、服务、生态和架构,让企业应用能够自由迁移和并存;再者,华为云“上不碰应用,下不碰数据”的理念也构筑起了用户的信任感,从而能够迅速发展。

在AI方面,华为云雄厚的技术家底也让人眼馋。在刚刚结束的AICon上,华为云就对外全面展示了自家的AI技术全景图。硬件方面, 进行模型训练往往需要花费大量时间,因此算力更强的计算平台将更具优势。华为推出的专业的AI处理器昇腾系列芯片,通过华为3D Cube架构和高达90%的卷积算子能实现每个时钟周期完成4096x FP16 MAC运算。同时,这一芯片利用达芬奇智能架构成功实现“端边云”的统一,跨平台跨终端的智能技术更加畅通无阻。

硬件性能如同一匹千里马,软件就是伯乐,唯有真正懂马之人才能发挥出硬件的真正实力。为了将昇腾芯片的能力完全释放,华为云从硬件到神经网络研发出来一系列的昇腾处理器专用开发工具链。基于华为昇腾处理器的软件栈可以分为四层,底层是计算资源,包括了AI芯片、视觉处理专用硬件及各类操作系统;上一层是芯片使能层,包括了张量加速引擎、任务调度器等计算加速产品;再往上一层则是执行框架,包括框架管理器和流程编排器等;最顶部则是应用层,这就包括了开发过程中会用到的计算视觉引擎、语言文字引擎、通用业务引擎等诸多应用。

赋能开发者需要开放的不只是产品,还有工具。华为云针对昇腾软件栈打造了一套完善的工具链,包括了工程管理、编译调剂、流程编排、离线模型转换、比对工具、日志管理以及自定义算子等,并通过神经网络软件流进一步进行调度和管理,从而提升AI开发效率。

摇滚不死,前沿的探索精神便不灭。华为每年超过10%的研发投入是其前进的保障,摇滚的探索精神让华为云在前沿技术上也一样快人一步。中文是世界上最古老的语言之一,但对于新派的计算机来讲,理解古老的中文甚至是古诗词也就很是困难。为此,华为诺亚方舟实验室的三项预训练语言模型技术:哪吒,乐府和 TinyBERT。

中文预训练语言模型哪咤通过混合精度训练和LAMB优化器的帮助,在中文任务中达到了业界最好水平;乐府模型则通过与华为云的合作,经过大规模现代汉语及诗歌预训练并基于诗歌的Finetune实现诗歌序列化,能够自主产出诗歌;TinyBERT则是将预训练语言模型实现小型化,并基于知识蒸馏和数据增强完成模型压缩,保障模型精度。

除了在语言方面的研发,华为云还在当下热门的物联网领域进行的深入研发。华为云推出的知识图谱将人、车、家及办公场景实现无缝拉通,实现全场景智慧升级。并通过知识图谱端到端构建平台解决了知识图谱构建周期长、人工投入大的难题。在未来,华为云知识图谱还将面向运营商领域的效率提升与智能决策提供更多帮助。

全栈全场景AI攻略,唱响未来之声

随着5G时代的逐步到来,AI技术的发展已经走向全面落地。华为云的探索不只是软硬件,还有全栈全场景的AI开发体系。

华为云面向AI的战略无比清晰,投资基础研究,提供安全可信、自动自治的机器学习基础能力;打造全栈方案,提供高效、易用的全流程AI平台;投资开放生态和人才培养,持续与产学研及行业伙伴进行合作;增强解决方案,打造更强更可靠的更具价值的产品和服务;提升内部管理效率,应用AI技术提高内部运营的效率及质量。

也正是在这一的战略之下,华为打造了一系列面向AI技术的全栈全场景产品及平台。应用使能方面,华为云打造了提供全流程服务ModelArts平台,不仅提供了从数据采集、筛选、标注、到管理的全链数据处理流程,还能够提供自动化模型训练能力,实现模型可视化,通过AI市场提供API、数据集以及模型的交易,并提供云端实时业务部署,一站式解决用户的AI从研发到落地的各类需求。

在框架方面,华为云打造了支持端、边、云独立的和协同的统一训练和推理框架MindSpore。该价格通过新编程范式,实现AI算法即代码,降低AI开发门槛,并基于数学原生表达的AI编程新范式让算法专家聚焦AI创新和探索;通过新的执行模式, Ascend Native的执行引擎可以实现 整图卸载执行,充分发挥昇腾大算力,并且全场景以按需协同的方式部署,能够更好的资源效率和隐私保护,打破端云界限, 多设备协同模型实时更新。

让AI产品上线离不开安全稳定的测试环境,华为云基于Cloud IDE+Codehub构建的高效可信的开发环境,可以进一步提升开发效率。华为云DevCloud就是一个一站式、全流程、安全可信的DevOps云平台,其提供的Cloud IDE能够为AI开发者提供轻量、极速的Visual Studio Code编码体验,并且,能够支持插件扩展,支持主流编程语言,兼容VSCode。华为云CodeHub(代码托管)则是基于Git的在线代码托管服务,是一个具备安全管控、成员/权限管理、分支保护/合并、在线编辑、统计服务等功能的云端代码仓库,并且还提供了开发软件效率最快的各式各样的半成品:源码、算法、组件、框架,站在巨人的肩膀上进行开发无疑将会事半功倍。

纵览天下AI风云,国内的竞争已经逐渐趋于红海化,但是细数各大厂商,大浪淘沙之后能够剩下的、值得期待的企业却并不多,华为云就是其中一个。从底层芯片到上层应用,再到开发所需的各类工具及环境,华为云在AI方面已经布置好一个巨大的舞台。只要合作伙伴需要,只要开发者需要,华为云的摇滚表演就势必会震撼全场。