2019年7月23日,奥卡云CTO 约翰·卡尔迈克在于西安举办的2019存储与数据峰会(DSS)上发表了题为《IoT Data Trends物联网数据趋势》的主题演讲,Veritas 创始人之一:约翰·卡尔迈克多年来深耕数字存储领域,这位存储老将加盟奥卡云之后,也加入了将西安打造成“西部硅谷”的宏愿,约翰·卡尔迈克对于存储产业有深刻认识,在IoT浪潮带来的数据洪流中看到了机遇,对奥卡云未来要做的事踌躇满志。
约翰·卡尔迈克:
大家好,我曾经是Veritas技术团队的创始工程师,Veritas是全球最大的存储管理软件公司之一,而我恰好对此有“些许”了解,今天我和大家分享一下IoT物联网数据的趋势,尤其中国的IoT和智慧城市,中国面临自己特有的问题,首先是中国的人口非常多,同时中国也希望能够打造世界上最顶级最好的基础设施,因此中国要完成一个非常大的城镇化转变,这些都给中国带来了一些非常特殊的挑战。
人们很难预测物联网未来到底会发展到什么程度,不过,最近几年,GPU计算比CPU还要便宜了,所以,GPU计算现在已经在各种设备当中得到了应用,比如在人工智能,还有机器学习当中,但我并不认为我们真正地理解了这会为我们带来什么影响,其中就包括,未来我们应该如何来管理物联网数据。
比如,这是一个无人驾驶汽车,一辆无人驾驶汽车的实质是一个移动的数据中心,也就是说路上将可能有三亿多个移动的数据中心,他们需要跟环境进行实时的交互,这些汽车要处理它们能看到的以及它们看不见的东西。
又比如在海洋市场,它融合了人工智能和机器学习,希望能够实现的目标是,通过不断对周围的环境做出反应,从而提高燃油效率等,这就需要在未来,让设备之间的互动更加及时、更加智能,更具策略性。所以,我们对于性能的期待就要变得高得多。中国在这方面有非常宏伟的目标。
从本图统计来看,物联网比其它事物发展都要快,有很多不同的领域,我们看到有三个大的领域:移动解决方案、云计算,介于移动解决方案和云计算之间还有物联网,物联网的市场规模和整个云计算和移动解决方案差不多,看到这个结果我自己都感觉有一点吃惊。
如图:在物联网领域,监控视频也可能是最主要的一个环节,视频数据量是非常非常大的。一个视频监控摄像头一个月可能要存储2TB的数据。在存储技术趋势发展下,我们做一个成本分析会发现,其实该类数据的储存成本仍然非常高,想用500美金存储100TB的数据的话,还很遥远,所以,IoT设备产生的数据会驱动一个非常非常大容量的储存设备的诞生。
如图:我们看到,监控数据的每年的增长量是17%,而其它行业的年增长率可能仅仅是6%到8%,监控视频数据方面,数据的增长要比其它行业都要快很多。
之前有位发言人(黄维院士)提到了颠覆性的技术,这也就是说新的技术会改变一切,新的技术会改变我们的思维方式,比如:之前虚拟化或者是云计算就是颠覆性的技术,而下一个颠覆性技术就是5G技术,为什么这么说呢?因为5G会减少本地网络跟广域网之间的区别。如果你连本地网络,网速可能能达到10Gbps等等,有了5G后你可以以10Gbps的速率连接到任何一个地方,你在中国与另外一个非常非常远的城市之间的连接,感觉就像跟隔壁大楼连接一样近,所以,本地与远端的概念将消失,5G技术将改变现在的一切。
问题来了,传统计算架构该何去何从呢?我认为新设备发展的速度以及新的数据发展的速度都需要考虑在内,必须大家假设一下,你的手机跟你的云帐户进行连接,然后,你打开了录像机,在这一年里面,你所有看见的东西都会上传到这个云当中,年末的时候,你会发现你一共在你的云帐户里面上传了15TB的数据,这得花多少钱呢?这个存储的成本会是非常高的。事实上,跟整个的云比较,如果我们把一个USB插到你的电脑里面,把这些视频储存本地,是更加可靠经济的解决方案,所以,云平台对于我们用户来说,并不是每个人都适用。
现在已经有数千种不同的物联网产品,实际上我们不再需要其它的IoT框架。中国未来十年或者十五年的大智慧发展战略,要全景透视中国的IoT设备,看到他们的运行状态,包括我们要去了解它们之间如何互动的,我的建议是我们应该关注数据的产生,我们应该把关注点切到数据的分析上。我们现在需要更加注重商业智能,因为现在,全世界范围内商业智能发展的规模已经达到前所未有的状态。
比如这样一个常见的场景,交通堵塞方面,人工智能,机器学习可以分析视频,可以告诉你说现在有交通堵塞,但是不能告诉你为什么会有交通堵塞。大智慧是我们未来的发展方向,帮助我们发现为什么会发生交通堵塞,如图:我们可以看到在路上有一些羊,这个路被堵住了,如果车在距离这个地方10到15公里的地方得到信息,然后,能够自动对这一情况做出反应,从而避免发生交通堵塞。这就是大智慧的意义所在。
发挥想象,你能想到的所有的东西都可以进行识别,现在机器学习非常非常的先进,它可以识别在任何场景之下任何的一个事物。可以产生非常多的信息,那么带来的一个问题就是当我们获取到这些信息的时候,我们应该怎么去处理这些信息呢?应该了解的一点就是,有了物联网技术后,可能在中国每一天都会在线上诞生10万个物联网设备,分析方面,你昨天做的分析可能今天已经过时了,所以,也就是说我们需要有不同的方法,去获取和识别新的信息和数据。
我必须要再次强调,产生大量元数据的IoT已经在中国得到了部署,它的增长速度非常快,它的速度每年都在增长。随着物联网技术的发展,网络安全的重要性提升到了一个新的高度,无人驾驶汽车或者是自动的交通灯,它们会接收一个中央云的指令,如果有黑客进去了,我们将会看到无人驾驶汽车会疯狂的驾驶,进入到了失控的状态。那么这种人工智能驾驶汽车它的可行性、安全性会降低。所以,也许我们当前面临的一个最大的一个缺陷,就是安全。
物联网设备数以十亿计,每天有十几万台新的设备诞生,我们现在有的最大的数据库,可能能够处理几千亿行的数据,比如说如果有100亿台IoT设备的话,每台设备需要处理几十行的数据,可以忽略不计,我们真正需要的是,一个100万亿行数据的数据库,要比现在最大的数据库要大1000倍。
因此,我建议我们在未来必须要一个单独的数据库,比如说未来的腾讯或者阿里的云数据中心,可能只需要一个数据库,大家在这个数据库里面可以获取一万亿条、两万亿条、三万亿条的数据,所以,我们要打造一个通用的数据格式,灵活支持各种应用,这个数据库必须要标准化,可能类似一个产品目录,那么解决方案就是类似于我们自动生产一样,所以,对于我们来说,我们必须要提高迅速的获取新的数据和容纳新的设备的能力,并且能够迅速的把它们给到AI当中,因为我们现在的世界当中,每一天都会有数十万条新的数据产生。
谢谢。