AWS DeepLens是一款支持深度学习的无线摄像机,旨在为开发人员提供机器学习上机操作体验;
Amazon Transcribe、Amazon Translate、Amazon Comprehend和Amazon Rekognition Video方便应用开发人员开发多种应用,包括语音转文本、不同语言文本之间的翻译、从文本中提取深度信息和视频分析应用;
这些新服务客户众多,包括美国国家橄榄球联盟(NFL)、Intuit、汤森路透、DigitalGlobe、Hotels.com、ZipRecruiter、《华盛顿邮报》、摩托罗拉系统、Infor、Elementum、iSentia、RingDNA和美国奥兰多市。
亚马逊(NASDAQ:AMZN)旗下公司Amazon Web Services, Inc.(AWS)在AWS re:Invent上宣布,推出5项新的机器学习服务和一款面向开发人员、支持深度学习的无线摄像机。Amazon SageMaker是一种全托管式服务,帮助开发人员和数据科学家快速开发、训练、部署和管理其机器学习模型。AWS还推出了AWS DeepLens,这是一款支持深度学习的无线摄像机,可实时运行计算机视觉模型,为开发人员提供机器学习上机操作体验。AWS还推出了4项新的应用服务,以帮助开发人员开发模仿人类认知过程的应用,新的应用服务包括:将语音转换成文本的Amazon Transcribe;翻译不同语言文本的Amazon Translate;理解自然语言的Amazon Comprehend和实时、批量分析视频的Amazon Rekognition Video,这也是一种新的计算机视觉服务。如需了解更多有关AWS机器学习服务的信息,请访问:https://aws.amazon.com/machine-learning/。
本新闻稿含有多媒体内容。如需阅读完整版本,请访问:http://www.businesswire.com/news/home/20171129006097/en/。
AWS DeepLens(照片来源:Business Wire)
Amazon SageMaker和AWS DeepLens使机器学习惠及所有开发人员
目前,机器学习的部署是一项复杂任务,需要反复试验和专业技能。开发人员和数据科学家必须先对数据进行预处理、转换并完成数据可视化,将数据转换成算法可用的格式,才能用其训练模型。即使较简单的模型,也可能需要很强的计算能力和大量培训时间,一家公司也许需要聘用专门的团队来管理包含多台GPU服务器的训练环境。从算法的选择和优化到调整数百万个影响模型准确度的参数,模型训练的所有阶段都涉及大量手工操作,需要进行大量的猜测。之后,在应用中部署一个训练好的模型,还需要拥有应用设计和分布式系统领域的各种专业技能。随着数据集和变量增多,客户必须一再重复上述过程,因为模型过时了,需要不断重新训练,以伴随新信息的出现不断学习和发展,所有这一切都需要大量专业知识和技能、超强的计算和存储能力以及大量时间。迄今为止,机器学习对大多数开发人员而言,都是可望而不可即的。
Amazon SageMaker是一种全托管式服务,可消除机器学习每个步骤中的艰难工作,也无需进行猜测。Amazon SageMaker提供预置的开发笔记本环境、为PB级数据集而优化的流行的机器学习算法和模型自动调整功能,使模型开发和训练变得更容易了。Amazon SageMaker还显著简化和加快了训练过程,该服务可针对模型训练和推理功能运行,自动配置和管理基础设施,为利用模型做出预测提供了方便。AWS DeepLens是从零开始设计的,通过为物理设备找到相匹配的指导手册、实例、源代码以及与熟悉的AWS服务的集成方式,帮助开发人员获得模型开发、训练及部署方面的上机操作体验,为学习和实验提供支持。
AWS机器学习副总裁Swami Sivasubramanian表示:“我们当年为AWS设定的愿景是,任何人都能够在宿舍或车库里使用世界上最大型公司使用的技术和工具,且规模和成本结构与这些公司相同。我们为机器学习设定的愿景与当年的AWS毫无二致。我们想让所有开发人员,无论他们的机器学习技能高低,都能够更加广泛和成功地使用机器学习技术。Amazon SageMaker消除了机器学习中大量麻烦、复杂的工作,可帮助开发人员轻松上阵,并成为模型开发、训练和部署的高手。”
凭借Amazon SageMaker,开发人员可以:
- 用性能优化的算法轻松开发机器学习模型:Amazon SageMaker是一种全托管式机器学习笔记本环境,在这种环境中,开发人员可以方便地探索存储在Amazon Simple Storage Service(Amazon S3)中的数据并实现数据可视化,还能够借助所有流行的库、框架和接口来转换数据。Amazon SageMaker包括10种最常见的深度学习算法(例如k-means聚类、因子分解机、线性回归和主成分分析),AWS已经优化了这些算法,其运行速度是标准算法的10倍。开发人员只需选择算法,规定数据源,Amazon SageMaker就可安装和配置底层驱动器和框架。Amazon SageMaker已与TensorFlow及Apache MXNet实现了原生集成,不久就将提供更多框架支持。开发人员还可以规定自己选择的任何框架和算法,只需将这些框架和算法上载到Amazon EC2 Container Registry即可。
- 快速、完全托管的训练:Amazon SageMaker使训练变得更加容易了。开发人员只需选择Amazon EC2实例的类型和数量以及规定数据的位置即可。Amazon SageMaker建立分布式计算集群、执行训练、向Amazon S3输出结果并在任务完成后拆掉集群。该服务可利用超参数优化自动调整模型,调整数千种算法参数的组合,以做出最准确的预测。
- 一次点击即可完成模型在生产环境中的部署:Amazon SageMaker负责实例发布、模型部署和安全HTTPS端点的建立,使应用能够以大吞吐量和低延迟提供预测,Amazon SageMaker还横跨多个可用区(AZ)自动调整Amazon EC2实例规模。该服务为A/B测试提供原生支持。一旦进入生产环境,Amazon SageMaker就可消除机器学习基础设施管理、健康检查、安全修补以及其他日常维护中的各种艰难工作。
凭借AWS DeepLens,开发人员可以:
- 获得机器学习上机操作体验:AWS DeepLens是一种支持深度学习、完全可编程的摄像机,旨在让开发人员真正用上深度学习技术。AWS DeepLens包括摄像机硬件和内置的计算功能,能够实时运行尖端的深度学习计算机视觉模型。定制设计的硬件每秒钟能够进行超过1000亿次深度学习运算,该摄像机配备了项目示例、代码示例和预先训练过的模型,因此,即使从未有过机器学习体验的开发人员,也可以在10分钟之内,开始运行其第一个深度学习模型。开发人员还可以扩大指导手册的使用范围,通过AWS Lambda功能,建立自己的定制深度学习项目。例如,AWS DeepLens能够设定为,识别车牌上的数字,并触发家用自动化系统,打开车库大门,或者,DeepLens在发现小狗上了沙发后,可以向主人发出提醒信息。
- 在云中训练模型并将模型部署到AWS DeepLens中:AWS DeepLens已与Amazon SageMaker集成,因此开发人员可以在云中用Amazon SageMaker训练其模型,然后,仅需在AWS Management Console中点击几下,就可将这些模型部署到AWS DeepLens中。该摄像机可在设备上实时运行这些模型。
美国国家橄榄球联盟(NFL)高级副总裁、首席信息官Michelle McKenna-Doyle表示:“我们加深了与AWS的关系,将AWS加到了NFL官方技术提供商目录中,能够将Amazon SageMaker用于我们的下一代统计计划,令我们倍感振奋。有了Amazon SageMaker,我们的开发人员就不用担心机器学习中那些无法分解的艰难工作了,还可以增加球迷喜爱的新的可视化功能、统计信息和体验。
DigitalGlobe是享誉全球的高分辨率地球影像、数据及分析技术提供商,每天要用到海量数据。MaxarTechnologies公司首席技术官、DigitalGlobe创始人Walter Scott博士表示:“DigitalGlobe规模达到100PB的图像库存储在AWS云中,公司致力于帮助人们更方便地在这个库中寻找和使用所需内容,并进行相关计算,以将深度学习技术应用于卫星影像。我们计划在托管式Jypyter笔记本环境中,通过Amazon SageMaker,针对数PB地球观测影像数据集来训练模型,这样,DigitalGlobe的‘地理空间大数据平台(GBDX)’用户只需按一下按钮,就能够建立模型,并在一个可扩展的分布式环境中大规模部署模型。”
Hotels.com是全球著名的住宿服务品牌,以41种语言运行90个本地化网站。Hotels.com和Expedia Affiliate Network公司副总裁、首席数据科学官Matt Fryer表示:“对于提高行动速度、利用最新技术和保持创新能力,我们始终抱有浓厚兴趣。凭借Amazon SageMaker的分布式训练方式、优化算法和内置超参数功能,我们能够以最我们的大型的数据集为基础,快速建立更准确的模型,大量节省将模型部署到生产环境中所需的时间。这其实就是在调用API。Amazon SageMaker将显著降低机器学习的复杂性,帮助我们快速为客户提供更好的体验。”
Intuit认识到,在帮助客户做出更好的决策、简化日常工作方面,机器学习有巨大的价值和潜力。该公司首席数据官Ashok Srivastava表示:“我们就可以在Amazon SageMaker这个平台上开发和部署各种算法,加速大规模人工智能计划的实施。我们将开发新的大规模机器学习和AI算法,并将这些算法部署到该平台上,以解决各种复杂问题,助力客户兴旺发展。”
汤森路透是全球著名的的专业市场新闻及信息提供商。汤森路透AI与认知计算中心负责人Khalid Al-Kofahi表示:“25年来,我们一直在开发先进的机器学习功能,以挖掘、了解、提升、组织并向客户提供信息,我们已成功帮助客户简化了工作,并从工作中取得了更大价值。采用Amazon SageMaker后,我们在问答应用背景下,设计出了一种自然语言处理功能。凭借Amazon SageMaker的丰富功能,我们的解决方案仅需针对大规模深度学习配置进行为数不多的几次迭代即可。”
卡耐基梅隆大学计算机科学学院院长Andrew Moore表示:“我们的学生发现,深度学习是真正鼓舞人心的技术。现在,深度学习似乎每周都在机器人、语言和生物学领域带来新的突破。AWS DeepLens令我喜欢的地方是,它有可能实现机器学习实验参与的民主化。能够将AWS DeepLens引入教室和实验室,让学生更快地进入真实的深度学习环境,将使我们这类大学倍感振奋。”
新的语音、语言和视觉服务将帮助应用开发人员方便地开发智能应用
有些开发人员,自己不是机器学习专家,但是有兴趣用机器学习技术开发展现人类智能水平的应用,Amazon Transcribe、Amazon Translate、Amazon Comprehend和Amazon Rekognition视频为这类开发人员提供了高质量、高准确度、可扩展和经济实惠的机器学习服务。
AWS机器学习副总裁Swami Sivasubramania表示:“如今,客户以Amazon Simple Storage Service(Amazon S3)为可扩展、可靠和安全的数据湖,存储了越来越多的数据。客户希望这些数据为自己及其客户所用,为了实现这个目标,需要易于使用的工具和技术,以释放这些数据中蕴含的信息。能够提供4项新的机器学习应用服务,帮助开发人员即刻开始开发能够观看、倾听周围世界并与周围世界交流互动的新一代智能应用,令我们倍感振奋。”
- Amazon Transcribe(已开始提供预览)将语音转换成文本,帮助开发人员将存储在Amazon S3中的语音文件转换成准确的、用标点符号断句的文本。Amazon Transcribe经过训练,能够以非常高的准确度,处理联络中心录音等低保真度音频。Amazon Transcribe可针对每个字生成时间戳,以便开发人员能够准确地保持该文本与源文件的一致性。目前,Amazon Transcribe支持英语和西班牙语,随后将支持更多种语言。再过几个月,Amazon Transcribe就能够识别一份音频文件中有几个人在说话,还能够帮助开发人员上载定制的词汇表,以更准确地转换其中的词汇。
- Amazon Translate(已提供预览)采用最新的神经网络机器翻译方法,在不同语言文本之间提供高度准确的翻译。Amazon Translate可翻译各种长度的文本,支持英语与6种其他语言(阿拉伯语、法语、德语、葡萄牙语、简体中文和西班牙语)之间的翻译,2018年将提供对更多语言的支持。
- Amazon Comprehend(已于今日上市)可理解来自文档、社交网络帖子、文章或存储在AWS中的其他任何文本数据的自然语言文本。Amazon Comprehend利用深度学习方法识别文本实体(例如人、地方、日期、机构等)、书写该文本所用的语言、文本中表达的情绪以及表达观念和含有形容词的关键短语,例如“美丽的”、“温暖的”、“晴朗的”等。Amazon Comprehend在广泛的数据集上进行过训练,其中包括来自com的产品介绍和客户评论,以开发能够从文本中提取重要信息的最佳语言模型。该服务还提供主题建模功能,可帮助应用从一个文档集中提取常见主题。Amazon Comprehend已与AWS Glue集成,以针对存储在Amazon S3、Amazon Redshift、Amazon关系数据库服务(Amazon RDS)、Amazon DynamoDB或其他流行的Amazon数据源中的文本数据,进行端到端的分析。
- Amazon Rekognition Video(已于今日上市)可针对存储在Amazon S3中的数百万份视频,跟踪人员、检测活动以及识别物体、面孔、名人和不当内容。该服务还针对实时传送视频中的数百万个面孔,提供实时面部识别。易于使用的Amazon Rekognition VideoAPI由计算机视觉模型驱动,这些模型经过训练,可准确检测成千上万的物体和活动,并从实时传送的视频和存储在Amazon S3中的视频中,提取关于动作来龙去脉的信息。Amazon Rekognition Video可用标签和地点(例如沙滩、太阳、儿童)自动标记视频的特定部分、检测活动(例如跑、跳、游泳)以及检测、识别和分析面孔并跟踪多人,即使这些人部分隐藏在视频摄制范围以外。
Isentia公司首席信息官Andrea Walsh表示:“我们开发了单一语言的媒体智能软件。为了增加功能,满足客户的语言多样化需求,我们需要翻译支持,以从非英语媒体内容中挖掘宝贵的信息。尝试过多种机器翻译服务以后,我们发现,将Amazon Translate集成到我们的流程中非常容易,而且Amazon Translate能够扩展,以处理我们加给它的任何翻译量。翻译结果也更加准确细致,满足了我们客户的高标准要求。”
RingDNA公司首席执行官、创始人Howard Brown表示:“RingDNA是一个面向销售团队的端到端通信平台。成百上千的企业通过RingDNA显著提高了生产率、开展了更明智的销售会谈、获得了销售洞察和预测能力、提高了销售团队的赢率并指导销售代表更快地取得成功。RingDNA Conversation AI的一个关键组件需要最佳的语音至文本转换,以提供每次电话的文字记录。Amazon Transcribe令我们倍感振奋,因为该服务提供了大规模、高质量语音识别,帮助我们更好地将每一次电话转换成了文本。”
《华盛顿邮报》数据科学总监Sam Han博士表示:“我们努力为将近1亿名读者提供最佳体验,推荐有意义的内容是我们的主要使命之一。有了Amazon Comprehend,我们就可以利用Keyphrase、Topic API等连续训练NLP功能,这使我们有可能实现更好的内容个性化、搜索引擎优化(SEO)和广告定位功能。”
Infor公司软件开发副总裁Manjunath Ganimasty表示:“我们的关注点只有一个:开发智能应用,帮助客户促进业务增长。Amazon Comprehend使我们能够分析搜索过程、聊天内容和文档中的非结构化文本数据,了解其中反映出的意向和情绪。因此我们能够训练我们的Coleman AI的技能,并为客户提供真正有针对性的、定制的搜索体验。”
Elementum公司工程负责人Minh Chau表示:“自然语言处理很难。为了分析和理解数据,我们考察了从封闭源代码到开放源代码的所有解决方案,但是没能找到一个使我们保持敏捷性和可扩展性、经济实惠且切实可行的解决方案。Amazon Comprehend提供了一种连续训练模型,使我们能够专注于业务,实现供应链管理(SCM)创新。”
美国奥兰多市警察局长John Mina表示:“能够与Amazon建立独特的开创性公私合作关系,试用最新的公共安全软件,我们倍感振奋。在这次试用中,奥兰多市将利用Amazon的Rekognition Video和Acuity技术以及城市现有资源,提供实时检测并向相关人员发出通知,这为在奥兰多市以及美国其他城市进一步加强公共安全、提高运行效率创造了机会。”
摩托罗拉系统公司首席数据科学家Dab Law表示:“Amazon Rekognition Video的分析功能令人印象深刻。举例来说,这些功能有助于在过往和实时视频中搜索相关人员,通过使这种通常由人工完成的任务自动完成,可以提高效率、加强相关意识。”