NVIDIA 黄仁勋:能够自我感知的自主机器时代正在来临

文/李卫忠

9月26日,GTC China 2017在京召开。

英伟达CEO黄仁勋上演两小时脱口秀:引领AI新格局。他指出,教机器人与外部世界交互和执行是一项复杂的任务,但是能够自我感知的自主机器时代正在来临。

英伟达CEO黄仁勋上演两小时脱口秀。

他指出,晶体管数量每年增加50%,但CPU的性能仅增长10%,摩尔定律已经终结。NVIDIA的GPU弥补了CPU的不足,所以CUDA开发人员5年内增长了14倍,达到60万人。

AI正在崛起

AI正在崛起,今年已获得66亿美元的融资,深度学习论文超过3千篇,顶级机器学习和AI盛会NIPS的与会者呈井喷式增长。开发人员正在应用深度学习实现惊人突破。

NVIDIA 对CUDA GPU的发展、投资和承诺,确保了最丰富的生态系统、最庞大的专家级开发者群体。

NVIDIA 将全力推进“统一架构”CUDA GPU技术,确保在NVIDIA 平台上的投资,通过Inception计划,支持1900家初创公司创建AI未来。

AI将注入万亿级物联网设备,监测一切

AI推理是下一个巨大挑战,AI是软件的未来,可以让人们重新畅想各种服务、软件、计算机和设备。经过训练的网络将展现惊人智慧,并融入万亿物联网设备中。AI会将智能注入2000万台云服务器、上亿台汽车和机器人中,最终,以万亿计的物联网设备和传感器将智能地监测一切,从心率和血压,到设备维修。

首款可编程AI推理加速器TensorRT 3发布

NVIDIA发布了全世界首款可编程AI推理加速器TensorRT 3。

TensorRT 3 与NVIDIA GPU的结合能够基于所有的框架、为诸如图像和语音识别、自然语言处理、视觉搜索和个性化建议等人工智能服务提供超快速且高效的推理。此外,TensorRT 和NVIDIA Tesla GPU加速器的速度可达到CPU的40倍,而相较于基于CPU的解决方案,成本仅为其十分之一。

TensorRT 3 是一款针对人工智能应用生产部署的高性能优化编译器和运行时引擎,用于在生产环境中部署深度学习程序。它能够快速优化、验证并部署经过训练的神经网络,从而在超大型数据中心、嵌入式 GPU 或车用 GPU 平台上开展推理工作。

它能够确保高度精确的INT8 和 FP16 网络执行,每年能为数据中心运营商节省数以百万美元计的采购和用电成本。借助它,开发者只需短短一天就能完成神经网络的训练,打造一个比其训练框架快3至5倍的可部署推理解决方案。

省钱:一台8 GPU V100服务器可替换160台双CPU服务器


黄仁勋宣布,阿里云、百度和腾讯均已在其云服务中部署 Tesla V100 GPU 加速器。另外,包括华为、浪潮和联想在内的中国顶尖 OEM 均已采用NVIDIA的 HGX 服务器架构并使用 Tesla V100 GPU 来构建新一代加速数据中心。

阿里云、百度和腾讯均在升级其庞大的数据中心,从基于 NVIDIA Pascal 的系统转而采用基于 Volta 的平台,从而为人工智能推理和训练提供非凡的速度和可扩展性。

基于 Volta 的全新系统的核心是NVIDIA V100 数据中心 GPU。该 GPU 配备有 210 亿个晶体管,性能较早前的 NVIDIA Pascal 架构P100 GPU提升了5 倍,同时可提供相当于 100 个 CPU 的深度学习性能。这一性能的提升相较于摩尔定律对同一时期的预测提升了4 倍。

黄仁勋展示,只需一台8 GPU V100服务器就可替换160台双CPU服务器或4个机架,每台V100服务器可节省50万美元。

AI,正在解决以前无法解决的问题

利用NVIDIA GPU加速的平台,在视频中实现了以秒级速度查询语音。

阿里云、腾讯云、京东云等中国云服务提供商已经采用NVIDIA GPU加速的平台,把AI融入到商业、社交、新闻、视频等各个领域。

到2020年,城市中实时摄像头将达到10亿,AI是唯一解决方案。海康威视、大华、华为、阿里巴巴都提供基于NVIDIA GPU平台的AI视频界方案,推动AI城市的实现。

AI也是自动驾驶汽车变革的推动者。NVIDIA DRIVE是为自动驾驶行业带来端到端解决方案的计算平台。

自主机器时代已来

教机器人与外部世界交互和执行是一项复杂的任务,能够自我感知的自主机器时代正在来临。

NVIDIA 已经设计了首款自主机器处理器Xavier,这款迄今最复杂的片上系统将于明年一季度提供给早期合作伙伴,第四季度全面推出。

黄仁勋宣布,将与中国大型在线零售商京东合作。京东每年配送的包裹数量超过 300 亿,且这一数字还在以50% 的速度逐年增长。

为应对如此大的增幅,京东正着手推出能够向客户派发包裹的 JDrover,以及能携带 30 公斤包裹的无人机 JDrone。京东的目标是在 2022 年之前建设一支拥有 100 万架无人机的机群。

上述两种配送工具均由京东创新实验室 JD X 负责开发,由 NVIDIA Jetson 超级计算平台提供技术支持,且运行 TensorRT以实现导航和无人送货。

黄仁勋说,自主机器要解决三大根本问题:一是为自主机器打造平台,二是为机器创造一个虚拟的环境,三是把AI大脑放到机器中去。

目前还没有完全解决,但都在并行发展中。明年将把三大地基都打好,随后的10-15年中,令人激动人心的事情将一浪一浪接踵而来。这将是我们一辈子也难遇到的时代。