如果3000人同时讲话,你还能听清每个人在讲什么吗?
作为一名工程师,我热衷解决问题并使用“数学语言”——或是数字——来理解我们的世界。数字,不止是数值,它能用文字无法实现的方式为故事增色添彩。大的数字很有意思,因为它们的含义通常比数值本身更加复杂,4TB更是如此,想到这一数字对无人驾驶行业的意义,我就感到非常兴奋。
英特尔公司副总裁兼无人驾驶事业部总经理Kathy Winter
首先,为什么是这个数字?一辆无人驾驶汽车预计在一个半小时内就会产生4TB的数据量,而每个人平均每天在车内的时间就是一个半小时。到2020年,3000个互联网用户每天也将产生这么多数据。现在,你可能还无法直观感受这么大的数据量。那我们换个角度,多少人在Facebook上有3000个好友?想像一下,你每天都在关注、接收这些好友发布的新动态。
如果一辆无人驾驶汽车产生数据的亮点仅仅是4TB的话,可能并不会令人兴奋。让数据成为无人驾驶“新石油”以及真正带来挑战的地方在于,我们需要利用这些数据,把它们变成可执行的洞察,从而让汽车在无人干预的情况下思考、学习和行驶。在未来,数据驱动的驾驶有望减少90%人为错误造成的事故。
英特尔是一家数据公司。我们深谙如何去创建、移动、存储、处理、分析并管理大规模数据。而且,我们正在把这种专业知识应用到无人驾驶行业。根据经验,我们知道,要想解决无人驾驶所面临的数据挑战,最快的方式就是行业协作。若想在2021年全面实现无人驾驶,还有很多工作要做,但我相信,我们可以与行业及合作伙伴一起实现这个目标。
无人驾驶数据包括三种基本的类型:技术数据、众包数据和个人数据。技术数据最为明显。这些数据来自一套传感器,它帮汽车“看见”的四周环境。这些数据帮助汽车识别人或消防栓,“注意”道路坑洼,或者计算出旁边汽车驶来的速度。此外,技术数据有助于捕捉新的驾驶场景,并把它传至云端,以便进行学习和改进控制驾驶行为的软件。当技术数据传输到云端后,它可以惠及所有连接在这一云端的车辆。
众包数据是本地汽车从周边收到的数据,例如交通状况和路况变化。你可以想象很多应用都能用到这类数据,例如,寻找附近的停车场或规避交通拥堵点。最后是个人数据,包括你想听的广播电台、喜欢的咖啡厅、首选的路线等等。此类数据有助于在你的无人驾驶汽车中创造更加精彩的个性化体验。
随着行业全面迈向无人驾驶汽车,数据为全球行业带来了诸多挑战。第一个挑战就是上面所说的4TB。数据量正呈指数增长,这需要庞大的计算能力来进行组织、处理、分析、理解、分享和存储。想象一下数据中心服务器的计算能力,而不是PC。
尽快训练无人驾驶汽车是另外一个挑战。当识别到新的驾驶响应或情况时,机器学习、模拟和算法改进必须立即发生——而不是几个星期或几个月之后,并且更新的驾驶模式必须在可用后立即推送给汽车。何时、何地、如何发生这些因素对现在十分重要,对未来,当无人驾驶成为常态时,就更是如此。
除此之外,数据保护以及消费者对无人驾驶的信任也值得关注。我常常被问到:如何安全地存储和分享数据?我们对此极为严肃,存储哪些数据?丢弃哪些数据?分享哪些数据?我们如何保护这些数据?这些问题都需要行业合作,需要我们的顶级专家予以解决。
最后,数据的挑战并非恒定不变。在无人驾驶汽车从少量发展到几亿辆的过程里,数据挑战也会随之增多。只有能够处理日益庞大的数据,才能应对这一挑战。随着超级计算机及其背后的云日趋完善,真正的系统可扩展性对于汽车内部——回到4TB数据——以及外部的大规模数据中心都至关重要。
没有任何公司可以独立解决这些数据挑战。英特尔认为,解决无人驾驶面临的数据挑战的最佳方式就是行业合作,共同开发安全的顶级平台并分享安全相关的信息。我们的共同目标是没有事故并方便所有人的出行,行业合作将加快该目标的实现。能在英特尔团队中与合作伙伴一道应对4TB的挑战,让我感到异常兴奋,因为,我知道,解决这个问题将让道路更加安全,让出行更加美好。
(本文作者Kathy Winter,英特尔公司副总裁兼无人驾驶事业部总经理。她于2016年从Delphi加入英特尔公司。在Delphi,她曾成功实现首次全面无人驾驶汽车的跨国之旅。)