AWS在AI方面都有什么?

2018年8月9日,AWS全球技术与开发者布道师团队负责人Ian Massingham (伊恩·马幸哈姆)在中国介绍了在人工智能和机器学习方面的技术和应用,从他的介绍中了解到了亚马逊的AI实践,以及通过AWS向外输出的AI相关的服务方案。

过去二十年来,亚马逊不断研发新的技术,用于优化用户在亚马逊(amzon.com)上网购的用户体验。

早在2003年的时候,物流方面,亚马逊的货物仓库里用自动机器人系统拣货,为的是让用户更早拿到买的东西。

在产品推荐方面,亚马逊的购物推荐早就成了大数据应用的典型场景,根据用户自己的购买经历或者购买过同一个产品的别的用户的购买经历进行推荐展示。

这样需要一个庞大的电子表格,AWS开发出了一个强大的算法来预测出购买某个产品的概率,类似的Netflix也用了这样的算法,据说,Netflix上75%的视频流量都是推进引擎导流过来的。

近几年来,亚马逊尝试用无人机来送货,目前正处于试验阶段。实际上,所有的送货无人机都是由一系列的算法来控制的,比如有基于GPS来规划路径的算法,计算机视觉算法,目前仅适用于五斤以下,三十分钟行程以内的包裹。

智能音箱Echo,伊恩坦言智能音箱是个比较低级的智能,唤醒音箱之后,将用户的语音输入转化成文本输送到云端,调用自然语言理解服务了解人说话的真正意图。

以上是几种亚马逊AWS的几种人工智能和机器学习的应用实例,作为一家云服务商,如何将人工智能和机器学习的能力做输出呢?

AWS将用这些资源的人分成了三类,对应有不同的服务。

一层是框架和基础设施层,需要的是底层的工具和资源,适用于机器学习专家、软件开发人员以及数据科学家。AWS提供了GPU/FPU(浮点运算器)这类高性能的并行计算硬件环境,比如有AWS EC2 P3这样专门用来做机器学习的机型。在软件环境方面,有打包了框架和各种驱动的AMI镜像,用起来很方便。

二层是平台服务,它主要是做深度学习工作流的管理,帮助一般的软件开发人员,把他们在软件开发方面的知识应用到机器学习的当中。它提供数据清洗所用的工具,提供模型训练的工具最后输出模型,过程中,机器学习需要反复调参迭代,AWS提供了迭代自动化工具。

AWS发布的AI和人工智能的方案SageMaker就是做AI机器学习流程管理的,涉及从数据处理,算法设置,到模型训练,乃至迭代调优的全过程,可以对接AWS的云服务,比如可以存放训练数据的s3,SageMaker里面集成了Jupyter Notebook,主要的代码都可以在这里完成,调整batch_size,epoch,学习率这些参数的操作可以交给SageMaker来完成,省时省力高效。

Jupyter Notebook

第三层是一些应用服务,指的是已经做了预抽取或者训练好的机器学习模型或者服务,供开发人员直接调用。用户可以调用SageMaker SDK的API来开发应用,使用刚刚训练成的模型,机器学习模型快速为得以应用。

机器学习常见的几大场景中有关于图像的,有关于音频的,关于自然语言理解的,AWS在这些方面也有自己的服务,Amazon Comprehend是做NLP(自然语言处理的),Amazon Rekognition Video是做视频识别的。

为了方便开发者在本地捕捉数据和运行机器学习模型,AWS发布了一个叫DeepLens的摄像头,可以连到AWS上对接别的服务,比如SageMaker。

以上就是AWS在AI和机器学习方面的实践和对外提供的服务,AWS提供的AI服务有两方面的优势,一个是在于AWS开放平台上的海量数据,另外,就是AWS有一系列的服务可以对人工智能的服务提供支持和集成。

一家云计算服务商能提供什么样的服务呢?云说到底是资源,是服务,AI本身需要做的事情现在也很明确,需要数据,需要清洗处理过的数据,需要云计算的数据存储和处理服务,训练所需的算法在过去几十年中一直在实践中发展着,不需要云服务商做什么,云服务商还能做的就是让繁琐的调参迭代的过程更高效一些,让训练出的模型快速得到应用。从这个角度来看,AWS的服务是全覆盖。

AI还在发展当中,AI在未来的发展主线肯定是随着数据的不断积累,AI场景的不断发掘而不断走向成熟的,过程中AWS这样的云服务商必不可少。