微软中国人工智能大会召开 打造从平台到应用全生态

在今天举行的2018 微软人工智能大会(AI Innovate)上,微软宣布,推出了18项创新技术、工具、服务,全力助推中国开发者,携手生态合作伙伴与行业用户,把握数字化转型机遇。

对话式人工智能开启更广阔前景

对话式人工智能正在成为新一代智能应用的核心。现代开发者必须懂得如何打造一个对话机器人,以及如何部署和运行它,因为这是来自客户的呼声——企业迫切需要能够针对销售咨询、人力资源、招聘、客户支持和服务等不同应用场景进行定制、优化和训练的智能业务机器人。

Azure Bot Services对话机器人服务让开发者和企业能够轻松开发出自己的对话机器人,发布两年来已经有30万开发者采用该服务开发。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜(Cortana)上,并能利用简单易用的开发工具为小娜赋予更多业务技能。微软已经与亚马逊合作,将微软小娜结合到Alexa智能音箱中,让用户通过Alexa调用小娜及其背后的人工智能服务。

微软小冰是面向情商(EQ)维度发展的人工智能系统,已在五个国家落地。今天,微软宣布一项人工智能内容创造的全新技能,为每个孩子定制专属于他们的有声童话故事,将于“六一”儿童节正式上线。家长可以设置童话故事的主人公和故事倾向,如更偏教育意义等,然后安排微软小冰完成创作。微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐,在短短20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准。该项服务完全免费,微软会持续向订阅家庭每天推送最新作品,让每个家庭的孩子都可以拥有一位专属于自己的故事主播。

目前,微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部时光。6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。

此外,微软还将向合作伙伴和开发者开放“全双工语音技术(Full Duplex)”,将“人机交互”进化为能像人类一样自然的“人机交流”,开发者可以使用这项技术打造自己的对话应用。今年四月,微软正式在美国和中国同步宣布了Full Duplex感官,并已完成产品化落地。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。小米生态链企业亿联客开发的Yeelight语音助手是全球首个搭载全双工语音交互感官的智能设备,其硬件产品已开始进入千家万户。

开源框架让更多开发者驾驭机器学习

今天人工智能的发展处于一个百家争鸣的发展阶段,开源框架内的人工智能技术发展得尤其活跃。而不断敞开胸怀拥抱开源的微软,也与时俱进地推出了开放人工智能平台(Open AI)战略及开发工具,积极参与和推动技术的创新与快速发展。

在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有15家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。

在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。这一框架最初由微软研究院开发,并且在Windows、Bing、Azure等微软产品上都得到了成功的应用。通过将这一技术框架开源,微软希望能够为每一位开发者赋予驾驭机器学习的能力。

微软Project Brainwave能利用Azure上最先进的FPGA基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,真正实现人工智能的实时计算。而且,FPGA运算不仅仅只在云端提供——通过合作伙伴,也可以通过Azure Stack混合云在本地提供FPGA。如此强大的实时计算能力不仅存在于云端,同时也适用于边缘计算,这将让更多创新成为可能。

微软研究院,开启人工智能的未来

今天,人工智能已经在潜移默化间给人们生活、工作的方式带来巨大的改变,那么未来的人工智能技术将如何发展?将近20年前,微软在北京成立了微软亚洲研究院,与微软研究院遍布全球各地的科研实验室一起,以全球最顶尖的智慧解决计算机科学中最具挑战性的难题,并为未来5到10年的发展开启更多可能。

作为美国以外规模最大、功能最全的研究机构,微软亚洲研究院在计算机视觉、自然语言理解等方面取得了举世瞩目的突破,甚至已经接近或者达到了人类的水平:在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。

微软亚洲研究院开发的OCR (Optical Character Recognition光学字符识别)技术,将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。