最强算力AI芯片助阵,华为云引燃世界人工智能大会

上周五,华为“周五见”达成了刷屏级的效果。

  其实一直关注我们的朋友,或许在此之前就不难推测出,华为如此郑重的“周五之约“,应该是要发布去年HC大会中已经披露定位和规格的昇腾910芯片。

  果不其然,华为轮值董事长徐直军在上周五发布了这款属于Ascend-max系列、号称地表最强算力的AI芯片。一时间关于AI、关系芯片的话题又重回大众视野,提振了社会心气。

  对于昇腾910这个名字,AI爱好者可能已经不再陌生,那么我们接下来的问题或许应该是,“周五”之后怎样?换句话说,大家都已经从各种信息渠道了解到,这此发布的昇腾910是华为的AI大招,目前世界上最大算力的AI芯片。

  但或许大家会好奇,这个大招对产业,对你我有什么价值?它的能力将如何投放给广阔的企业智能市场需求?

  所以在“后周五时代”,或许有必要进入昇腾910背后,窥探这片多米诺骨牌的释放,可能会在AI与计算产业中引发连锁反应。首当其冲受到影响的,必然是公有云市场。

  昇腾910落地后,AI之风正向何处奔涌,云计算产业会荡起哪些涟漪?这是一个值得花费我们更多时间来思考的话题。

  云与AI之变

  了解昇腾910的产业价值之前,我们必须回顾云计算产业近几年在遭遇怎样的变化。

  我们知道,从2012年到2018年,全球AI算力的需求增长了30万倍。而今天随着AI算力从科研与开发走向产业应用,这个曲线更加笔直地向上攀升。

  深度学习为代表的第三次AI崛起,基础技术逻辑是以某一目标训练算法模型,然后进行推理部署,达成所期待的耦合效果。

  这就意味AI应用的流程包括训练和推理两大部分。企业想要获取AI技术,要么自己训练,要么使用厂商提供已训练好的AI能力。

  而无论是AI的训练、开发,还是能力调用、场景部署,都是建立在计算基础上的。而且AI任务本身需求大吞吐量、高并发、高延展性的算力,所以云计算是AI效率最高、贴合方式最紧密的主要算力提供方案。

  这一点带给云计算产业本身以非常强大的变化。过去云计算的价值,更多是对已有互联网任务进行支撑,而现在云计算成为了获取AI能力、开发AI能力的主要载体。从“支撑”到“获取”,这完全改变了公有云对于客户和市场的价值。

  于是我们看到,AI开始作为云计算厂商的主要增长点。今天全球云计算市场的主要趋势,是传统老大哥AWS正在增速放缓,今年第二季度其增速有史以来第一次低于40%。而从去年开始大规模重组整合,以一系列AI能力、AI工具,以及部署灵活性为卖点的微软Azure,异军突起以极快的速度成为第二,云+AI成为了微软最赚钱的生意。为了继续巩固这一优势,不久前微软十亿美元投资了OpenAI,意在与谷歌持续竞争未来的AI市场。

  而以AI算法能力著称,坐拥TPU和TensorFlow框架的谷歌云成为第三,今年谷歌预计在云计算业务营收超过80亿美金,这将成为谷歌体系的最重要增长点。

  而在国内市场,以AI技术著称的百度云、华为云成为了崛起最快的两朵云。不难看出的是,全球公有云市场中,AI正在成为当之无愧的王牌。AI能力的强弱,也在成为云增长的核心能力标准。

  那么什么是云+AI的核心能力呢?

  从欧美云巨头的发展轨迹看,专项AI算力、框架、能力、开发生态是构成云服务商与企业AI需求结合的四大联接点。

  而其中算力与框架,又是整个体系的支撑,是让用户可以自行研发AI模型的基础,价值格外重要。比如谷歌云这两年的快速增长,其实是以其自研的训练用AI芯片TPU为核心战略,再将开发社区和TensoFlow的用户捆绑到自己的云服务中,达成短期快速增长。

  而为了应对谷歌树立的AI开发者之墙,微软、Facebook等巨头联手打通旗下开发框架,并发布了ONNX等跨框架工具。

  由此可见,专项训练AI算力和开发框架,是如今构筑云计算企业未来增长点的核心。而华为发布昇腾910以及自研框架MindSpore,最直接受惠的当然就是直接应用其价值的华为云。由于业界其他云计算厂商都使用英伟达的板卡作为AI算力来源,所以华为云即将成为谷歌云之外,唯一拥有自研训练芯片和自研框架的云服务厂商。

  这意味着芯片和框架这场云+AI的国际顶层竞争里,加入了华为云的坐席。而华为云在昇腾310和边端场景的应用布局,甚至构成了比谷歌云更加完整的全栈AI能力。这一信息背后,预示着此刻已经风起云涌的云计算产业,必将更加不平静。

  在明晰了云+AI的产业格局之后,我们需要换个角度,从企业用户的视角看看,昇腾910与华为云的结合,到底将带来什么价值。

  针对AI训练的暴力计算,是不可或缺的产业基石

  对于AI技术的应用者来说,AI分为两个部分,也就是大家熟知的训练和推理。这二者之间的关系就像培养一个人。训练就像上学接受教育,推理就是开始找工作。

  每个人都知道,换下工作比较容易,学校教育上个若干年可就成本很高了。不仅是要磨练学生,更是考验家长和老师。对于AI来说也是如此,企业用户应用AI能力并不难,但是想要自己训练一个专属的深度学习模型,把AI变成自己的专有竞争力,那可就困难了。

  其中最困难的一项,就是训练专项算力不足。我们曾经采访过一位科研界的朋友,他设计了一个深度学习应用于生物医疗领域的算法模型。但是用研究所采购的专项算力,申请一次四个月,训练一次两个月,出了错误就重来。这种算力情况,直接导致他到毕业也不可能完成研发。

  大型深度学习模型训练,是耗时、耗能、消耗算力最大的AI开发环节,但这一环节也是AI开发与创新的基础。如果企业用户和开发者不能独立训练大型模型,那么AI将永远停留在表层应用,无法产生差异化创新与深度结合行业的应用。

  而解决方案也很简单,用徐直军的描述,就是对AI训练进行暴力计算。只用当AI算力强到一定程度,用不讲道理的姿态碾压数据训练,AI才能真正被千行万业应用,成为众智创新的新高地。

  目前来看,昇腾910芯片就符合“暴力不讲道理”的这个芯片“人设”。根据公布数据,测试结果表明昇腾910算力达到了半精度 (FP16): 256 Tera-FLOPS;整数精度 (INT8) : 512 Tera-OPS。并且合规算力所需功耗仅有310W。更直接的对比是,运用在实际AI训练任务中,在典型的ResNet-50 网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升,每秒训练的图片数量从965张提升到1802张。

  或许我们可以说得更直白一点,华为所指的主流训练单卡,就是英伟达的V100。事实上,目前能够基于云服务获取的AI训练算力,只能来自谷歌的TPU和英伟达的V100。后者基本要通过亚马逊的AWS来获取。而根据英伟达方面的指摘,TPU2.0仅有V100二分之一的算力,并且限量出租。

  于是我们能看到,基于云服务的AI训练算力是十足的稀缺资源,价格昂贵且难以预约。这样的产业条件,显然是无法促进AI行业真正向前发展的。

  而现在,昇腾910部署到华为云之后,全球开发者拥有了第三个选择,中国公有云市场迎来了首个全栈云+AI解决方案。加之昇腾910算力比V100更强,华为云始终坚持普惠定价策略和充足能力供给,训练这个天梯,或许真正能够拥抱算力层的解决方案。

  云服务+AI训练算力,是一颗名副其实的产业基柱。但是通往这个基柱的走廊,过去非常狭窄——企业和开发者要忍受各种成本限制,当昇腾910接入华为云,这个走廊瞬间被拓宽,甚至打开了一条全新通衢。

  从广泛布局企业EI,到昇腾310和ModelArts的应用与生态建设,直到今天迎来昇腾910和MindSpore,华为云的产业智能化赋能能力,也迎来了质的提升。

  补完AI重器,华为云凝铸产业赋能三叉戟

  顺着昇腾910的产业逻辑再往下看,会发现华为云即将献给市场的差异化能力,是全链条、无兼容成本的AI培育。

  AI训练算力对于云服务之所以重要,一方面是因为它本身对应着AI产业发展中的重要需求,另一方面,它也是全栈AI链条中极重要的上游支撑。当昇腾910被应用于华为云体系,华为云也就具备了完全基于达芬奇架构,提供从训练、开发到场景部署和体系化应用的全面支撑。

  在AI能力部署领域,华为云已经基于昇腾310芯片,提供图像分析服务、OCR服务、视频分析等服务,有超过50个 API基于昇腾310,日均调用量超过1亿次,并且在快速增长。

  在开发者使能领域,华为云基于ModelArts开发平台,为AI开发者提供全流程的模型生产服务,打通、覆盖了从数据获取-模型开发-模型训练-模型部署的全链条,ModelArts已经积累超过3万名AI开发者。

  在场景推理部署和简便开发之外,开始补完大规模AI算力,以及模型训练的顶层环节,意味着企业用户即将可以基于华为云,完成从训练-开发-推理-部署的全部生产到应用环节。这一链条的主要受益用户,更多是自身有大量可训练数据,并且要求AI技术满足差异化、行业垂直化需求的企业用户。

  如果我们按照这个需求在市场中框定用户,会发现补完昇腾910这个AI重器后,华为云即将向三类客户提供全栈AI赋能:

  1、对AI研发有重度需求的互联网企业、高科技企业,以及有AI创新渴望的科研机构、开发者。

  2、需要训练大量数据,并进行稳固部署,对AI安全有高度要求的大型政、企、研究机构。

  3、对行业AI能力有深度研发、训练需求的传统行业+AI场景,其中尤其以工业场景为重心。

  在公有云市场竞争激烈的今天,这三种客户很可能构成接下来华为云的企业智能三叉戟,从而撬动人工智能成为社会生产力,实现真正的普惠AI。

  伟大的咖啡机:从全栈AI到普惠AI之路

  以上所说,或许可以看作昇腾910芯片与华为云的短期改变与目标。如果我们把视线拉长,或许可以来回答这样一个问题:芯片和框架这些基础设施,挑战如此之多,为什么华为依旧坚持要做?

  不知为什么,今天华为云对AI所作的一切,让我想起了一种我们已经习以为常的设备:咖啡机。

  千万别小看这台机器,把咖啡从研磨到煮沸、冲泡的全流程,集成在一台设备里,是人类非常伟大的发明。它改变了咖啡原本的制作规则和制作门槛,让咖啡随手可得,咖啡馆开遍大街小巷。

  口味更多、等待时间更少、操作更简单,咖啡机让这种饮料真正普惠化了——甚至从一种少数人的贵族雅好,变成提高社交效率和工作效率的生产力工具。

  华为云今天在做的,其实就是把研磨、冲泡等各种AI流程,集中在公有云这台设备里。让开发者和应用者不需要去三大街磨咖啡豆,五大街请人帮忙煮咖啡,再回家花三天三夜等待——而集成的前提,是每一项关于AI咖啡的能力必须完整。

  这个完整度,也就是华为所说的全栈AI,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。具体到软硬件体系,华为全栈AI包括:基于统一、可扩展架构的系列化昇腾芯片和IP;芯片算子库和高度自动化算子开发工具CANN;支持端、边、云独立的和协同的统一训练和推理框架MindSpore;开发者使能工具ModelArts,以及大量多层次API。

  当这些能力和技术搭建成了完整可闭环的结构,华为云才可能不断压缩其中的过度与兼容成本,不断迭代和提供更多能力。基于机械化高效率的AI咖啡,最终才能被端到千行万业面前。

  或许有人会好奇,在框架诸强林立的情况下,华为为什么要做自己的框架MindSpore。答案在于,MindSpore主要努力方向是开发态友好和运行态高效,并且能适应端、边、云的不同场景。换言之MindSpore是一种强烈指向降低开发成本,提高开发成果可用性的深度学习框架,与华为云为开发者提供ModelArts平台的思路一脉相承。

  通过自研芯片降低成本,提升算力;基于开发框架和开发工具降低开发难度,提升应用效率;基于全栈架构降低兼容门槛;基于全云服务提供灵活可控、高集成度的AI基础设施。最终的指向,是尽可能的成本压缩与效率提升,让AI从科研环境下的理论可用,转化为工业生产环境下的产业可行。

  徐直军在昇腾910发布会后回答记者时明确,昇腾会像麒麟一样走向“不归路”。换言之,全栈全场景AI能力将会不断迭代滚动发展,这意味着华为云将AI推向普惠的路,也是一条不达目标不会停下的路。

  所以说,昇腾910真正指向的目标,是华为云的普惠AI战略,“+智能,见未来”的决心;是用户-云计算-AI能力之间的市场与服务重构;是AI门槛的规则改写。

  普惠AI任重路远,山水迢遥自是题中之义。但基于华为的全栈全场景AI创造,云+AI的基础规则已经改变。

  人类这种生物,从无在技术和生产力上退后的先例和可能。