英特尔刘钢:端到端完整AI方案,助力应用落地与商机拓展

12月5日,主题为“重塑商业模式,拥抱智能时代”的2017中国数字经济峰会在京召开,大会由DOIT传媒和eHub联合主办。来自阿里云、百度云和科大讯飞三大国家人工智能平台企业的专家,与中国500强企业的近百位CIO、CTO和企业领袖共话跨界、融合的创新思维与实现路径,展望数字经济新时代下的企业数字化转型之路。

英特尔在人工智能方面从硬件到库到框架到平台到体验,是一个全站式的解决方案。英特尔中国区非易失性存储事业部总经理刘钢以“端到端完整AI方案助力应用落地与商机拓展”为主题发表了主旨演讲。他谈到,英特尔已经在人工智能领域投资了10亿美元,拥有完整的人工智能产品组合,并且能够交付端到端的解决方案。基于业内一流的芯片、可扩展的编程模型和卓越的软件,可以极大地压缩开发周期的每一个环节,以技术突破带来改变,推动整个行业的发展和技术的提高。

以下内容根据速记整理, 未经本人审定。

英特尔中国区非易失性存储事业部总经理刘钢

刘钢:各位嘉宾,各位朋友,下午好。很高兴能有机会在年底到中国数字经济峰会跟各位分享交流,感谢DOIT的邀请。

人工智能在过去一年进展非常快,其实不仅是平台的改善和发展,而且在各种应用上已经进步的非常快,到了我们生活的很多方面,刚刚提到的城市管理,阿里的智慧大脑和百度提到的智能媒体还有智能的医疗,还有科大讯飞,其实在我自己生活中,我每天也可以感受到人工智能,今天早上我从上海飞过来,我在楼上听到我儿子在楼下说话,他说丁东给我讲故事,前不久我刚买了人工智音响,最近我发现我太太学英语比较专心,老是拿手机说话,因为手机可以自动的给她判别发言是否标准,我觉得打分比较合理,在我们家,我女儿得分是最高的,我觉得人工智能已经进展到跟我们的生活紧密相关。

为什么在过去的一年两年中,人工智能发展的这么快,跟以前的人工智能有什么不同?上一次大的浪潮是在97年,整整二十年,过去二十年为什么人工智能到现在发展这么快?那个时候的人工智能跟现在不一样,那个时候的人工智能学习方法是推理,人知道怎么解决问题,只是要给它数据推断出来怎么解决问题,而今天的人工智能是很多问题人根本就不知道怎么解答,甚至人的解答能力还不如机器,机器通过大规模的深度学习,自己找到解决问题的方法,这是通过深度学习找到的解决方法。后一种方法,可以让机器做得比人更好,甚至有很多时候摆脱了人的曲线,比如说像阿尔法狗,甚至都没有输入大量的数据,就让两台机器左右的互补学习,说话人工智能已经进展到了新的阶段,这个新的阶段主要是有四方面的技术的快速发展,让新的学习能力得以实现。

第一,大数据的快速存取。第二,高性能的计算能力,大家知道今天的阿尔法狗是二十年前深蓝计算能力的三万倍。第三,非常多新的算法的出现,而且算法通过互联网平台共享,算法的迭代升级也非常快。第四,跟刚刚科大讯飞讲到的也很一致,人不仅是有数据,在机器计算机里面的数据进行学习,而是有大量的物联网的设备部署,有大量的传感器,能够感知真实的世界,能够看得见,可以感受得到真实世界,由此采集了很多的数据,这个大量的数据又变成下一步机器学习的来源,所以这个是大部分大数据高性能计算和更高效算法以及大规模布置的物联网的传感器,让人工智能发展到今天这波,跟以前完全是基于逻辑推理的人工智能有非常大的不一样。

讲到四大关键技术推动人工智能发展,今天我想特别讲到其中的一块,因为都跟数据有关系,我想特别强调数据技术的进展,另一方面,也是英特尔我们自己把数据看得非常重要,以至于我们的CEO现在对外讲英特尔是一家什么样的公司时候,他绝对说我们是一家新锐公司,很多数据技术在英特尔越来越投入,进展越来越快,data在我们公司变得非常重要,也许这次我们看的是CIO论坛,没准下次我们看的是CDO论坛,今年年初大家看到可口可乐取消了CMO,有了CGO,数据就是下一个能源。

在数据方面有哪些进展?有哪些新的技术可以帮助我们更有效的存和取大规模的数据,来支持新一代的人工智能?

我们首先来看大数据的分层,大家都在说大分局,人产生的数据和机器产生的数据,以及工厂产生的数据,完全是不同数量级的,这是每一天这些设备产生的数据,设备产生的数据远远超过人,但是这个数据量大,并不是重要的,最重要的是这些大量的数据需要得到及时的处理,能够更靠近处理它的处理器,无论这个处理器是CPU还是CPU还是神经原芯片,可以更高效的处理人工智能。

但是另一方面,又不可能把大量的数据全部放到CTO,因为你做不到,我们可以看到,根据应用的不同,应用场景的不同,和数据重要性不行,把数据分成三大类,第一大类大家很熟悉了,冷数据,第二部分是温数据,第三个是热数据,需要实时在线,这三种不同层的数据需要用不同的存储技术解决,下面我很快给大家看一下在未来这几个主要的存储技术的发展,今天吃午饭的时候我们还聊到未来几个产品大的种类,大家可以看到,在未来的三到四年中,硬盘的市场占有量是在逐渐萎缩的,中间增长最快的是HC,从今天的市场到2020年变成300亿市场,而且SSD部分产品不仅是向下代替了很多快速硬盘的市场,而且向上也代替了很多内存的市场,为什么这样?这是因为有新的存储技术出现。

在讲新的存储技术之前,我想给各位看一个图,存储在各位CIO的预算或者花费中占比有多少,这是一个全球的数据。大概在基础架构的花费中,你可以看到,在存储部分的花费会占到20%,不包括内存;加上内存,大概会占到整个IT基础架构花费的40%以上。上周末我在苏州参加行业年度峰会,跟好几位互联网的服务商在交流,马上就有很大的互联网公司的IT高管跟我说,其实那个费用已经超过50%了,存储的花费已经超过了IT花费的50%以上了,尤其是随着最新内存的涨价,而且不止内存涨价,新的人工智能也需要更多的内存两个因素结合到一起,可以看到,在存储和内存上的花费非常大,在过去两年这两个加起来占到720亿美金。中国市场绿色的部分是固态盘,企业级固态盘占整个市场今天的三分之一,但是2020年企业固态盘占整个固态盘市场一半,在全球市场企业级固态盘今天就占到所有固态盘的一半以上,企业在它的IT基础架构里,大规模的部署新的存储技术,但是这种全新的存储技术用在温数据上,就是现有的固态盘数据,因为温数据既要求高密度,也要求大容量,而且还要比硬盘更快,这个部分基于闪存技术的固态盘可以满足要求,这一部分还有新的发展,大家可以看到,新的发展一方面是在接口方面,2017年开始,2018年会有非常大的转变,2017年转变已经开始了,固态盘的接口大规模的转,今天像BAT公司50%以上的固态盘已经转向了PCIE,因为固态盘如果还用传统的接口,接口本身就是瓶颈,所以在固态盘的基础上,往下非常大的转变其中之一就是存储接口的改变,这个跟英特尔最新的计算平台也有关系,在一台服务器里面部署几十片的PCIE的盘,各位可以看看今天外面的展台已经有好几家厂商的产品,就是在一台服务器上,这是一个发展趋势。

还有一个发展趋势,固态盘不仅是快,以前我们认为固态盘的劣势,硬盘的存储密度更高,固态盘只有几百GB,但是现在不一样了,固态盘的存储密度甚至可能更高,今天如果没有实现一个PB的存储容量,用硬盘技术做,2TB可能要放满42u机架,装满服务器,每一台服务器插满2TB硬盘,可以做到一个PB,有些公司已经开始测试了,新型的固态盘高密度的会变成1U服务器,1PB,整整一个机柜变成1U服务器,这是产品在测试当中,是基于3D64层,在一条寸子大的固态盘里,可以达到存储容量32TB,在一台服务器放满32个,就是一个PB,可以让温数据完全用基于新型的闪存固态盘实现,所以基于闪存NAND颗粒的可以很好的解决温数据部分。

我们再看数据分层,现在热数据部分还是用DRAM实现,新的应用对DRAM需求越来越大,尤其是人工智能,需要大量的样本比对,机器学习也需要大内存,越来越多的应用都需要内存,而内存价格飞涨,内存的容量其实过去几年并没有太大的增长,大家可以看这个图,左边这个图是过去几年内存的增长,你可以看到内存颗粒的增长,容量增长越变越慢,所以类似的容量并没有快速增长,而另一方面,闪存又太慢,因为闪存跟内存比太慢了,是从时延上来讲,人工智能里时延非常重要,人工智能的应用对时延要求非常高,要在每一个部分降低时延,但是你看在nand里面和dram时延差一千倍,两个之间有很大的鸿沟,一方面DRAM进展太慢,另外NAND基于闪存的SSD太大了,如果我用这个图比较大家可以更清楚的了解,CPU里面的存储叫SRAM,这个作为数量级1比对,大家可以看到,DRAM延迟大概是10,lateney是10万,硬盘就是一千万,是更慢的,怎么样能够弥补这两个之间的无论是性能还是价格,还是时延上的巨大差距呢?一种新的材质会出现,就是英特尔的新型材质,3DXPoint,Latency只有100,跟内存比没有差太多,但是密度却大很多,这种新的存储介质介于DRAM和NAND之间,今天中午讨论到了英特尔现在有基于PCIE的接口,听说未来也会有基于DRAM的接口,因为它太快了,只用PCIE无法把性能完全发挥出来,明年我们会看到有DRAM的接口出来。

我们先看看基于PCIE接口的产品,有什么样的性能提升,简单的来说,无论在Qos9的时候是60X,时延是最难提升的,从各个方面来讲,而ot low产品第一代时延就相当于现在最快的四十分之一,提高了40倍,在时延加速上,所以可以看到,它最大的优势就是在时延的改进方面,这是40倍的提升,是完全革命性的新的存储技术。

这种新的存储技术有多种的应用场景,常常也会问到你们这么快的产品怎么定位的,两种定位,第一种定位是最快的SSD,所以这里面有一个大数据库,各位如果有非常大型的数据库,当运行到optoneSSD上,每秒处理能力从原来的1365变成了13650,提高了十倍,只是把盘从nandSSD变成了optoneSSD,就是当成最快的SSD,得到的好处不仅是每秒钟TBS倍数增长,同时时延比原来改进了五倍。在前不久阿里的云栖大会,阿里也是应用这个进展,因为阿里有非常强的反应能力,因为大家知道阿里双十一的交易量非常大,所以阿里的数据库开发非常领先,阿里的最新数据库比MySQL还快,所以这是当成一个更快的或者最快的固态盘。

另一种应用方法,是把它当成更大的内存,因为它跟内存的速度相比,也只有一个数量级的差别,不是太大的差别,当成一个更大的内存,所以当你的内存平时只有几个GB,而你需要几个TB内存做人工智能的时候,Optone是个不错的选择。我们来看一个例子,这个公司原来只有很小的内存,用了Optone以后有了很大的提升。

(播放视频)

刚刚大家看到的应用,是把Optone当成一个扩展的新型更大内存实现,这个图大家可以看到,原本你左边插满了内存条,新的配置只需要一个内存条,就是Optone,做到只有原来成本的三分之一,但是可以达到1.9,可以看到新型的材料新型的存储介质来适应大数据的需求,因为大数据的发展才刚刚开始,未来会有更大规模的数据,这个时候只是依赖传统的DRAM发展不足以满足人工智能发展的需求,尤其是这一波人工智能是大数据推动的,所以后面支持大数据的数据技术创新就显得尤其重要,不仅是计算能力创新,而且是数据技术创新非常重要,所以英特尔不计算自己是一个计算公司,而说自己是一个数据公司。

刚才讲的还是通过大内存来解决已经知道的问题,现在这个应用是什么?就是内存大到了不是贵的问题,是原来不可能做到这么大的内存的,谁试过让服务器达到24个TB,或者48个TB的,没有做到过,但是如果有Optone就可以做到,当你应用在上层的时候,让根本原来无法解决的问题变得可以解决,这个也是Optone基于新型的存储介质的SSD产品带来的优势,尤其是对人工智能会带来非常多的帮助,尤其是这部分带来不仅是容量的变大,关键是延迟时间,在这个方面我们跟讯飞也有一个讨论,刚刚部署的AI的云平台,在那个部分,为了缩短人工智能、云对应用响应的延迟时间,它几乎在每一个部分去减少时延,所以Optone是其中非常重要的一个技术。这是讯飞照片,可以看到他的人工智能平台,可以看到实际上Optone在今年已经在很多人工智能平台中开始使用了。

我们希望能够扩大我们新型的存储技术对大数据和人工智能的应用,也希望跟各位一起合作,因为大数据是支撑我们人工智能发展的最关键的一个技术,所以英特尔的部门叫NSG,这个名字是非易失性存储解决方案事业部,谢谢大家。