自动驾驶“落地战”,突破口将在场景化数据

从1886年的卡尔·弗里德里希·本茨发明出汽车开始,拓宽了人们的出行半径,加速了人流与物流的流动速度。到1939年,第一款配备自动变速器的汽车问世,解放了驾驶员的右手(左舵驾驶,右舵驾驶则解放左手),再到世纪交替时,ACC自适应巡航解放了驾驶员的双脚。而现在的智能驾驶技术问世,科幻电影中的自动驾驶离我们的距离正在快速接近。

前段时间,百度、高德、文远知行、AutoX、滴滴等代表企业在RoboTaxi(自动驾驶出租车)领域争相传来好消息。可以说通过RoboTaxi的落地,人类揭开了自动驾驶落地新的一页。

但是,新的篇章有新的难题。

在自动驾驶的过程中,汽车需要通过感知、策划、决策、控制等一系列的过程,实现“人工智能”。简单来说,自动驾驶系统根据从感知融合模块得到的环境信息,如其他车辆、红绿灯、行人等数据反馈,才可做出具体行为决策,如变道、超车、停车等等。

在具体商业化落地中,难就难在“感知-决策”这一过程。诸如高速公路、矿山等道路环境简单的场景,自动驾驶的实现相对简单。而在道路环境复杂的城市道路上,不可控的车辆、行人、宠物等各方因素,给“感知-决策”的过程带来了极大的难度。

我们在新闻上看到的自动驾驶事故现场,也大都是因为“感知-决策”这一环节出现了问题。

图源:亿欧

智能驾驶时代的关键——背后的高质量数据

对于自动驾驶汽车来说,想要在瞬息万变的复杂真实驾驶场景中发挥感知作用,背后就需要有海量真实道路场景的数据通过专业人员进行标注和验证,从而转化为算法训练的数据支撑。

AI数据是整个人工智能行业的燃料,它在智能驾驶领域的重要性毋庸置疑。但现实情况是缺乏获得大量且高质量道路环境数据的渠道。

一方面数据标注本质上是要获得更准确,更精细化的数据结果,而场景化的道路数据缺失、数据标注质量良莠不齐,以及数据隐私安全问题成为自动驾驶面临的三大痛点。幸运的是,云测数据作为AI数据服务领域的头部企业,一直致力于为智能驾驶领域提供高质量的场景化AI数据,通过对视频、图像、音频、文本、LiDAR和传感器数据进行结构化处理,为机器学习模型提供高质量的场景化训练数据。

图源:云测数据

据公开资料显示,云测数据为了满足智能驾驶领域不同场景的特殊需求,业内首创了“数据场景实验室”模式,通过还原多种智能驾驶细分场景,以解决特定场景下的数据缺失、质量良莠不齐等行业问题。一方面,在场景下的定制化数据采集更加精准、数据质量更高,另一方面,定制化的场景数据也与智能驾驶需求端的匹配度更高,从而最大化将数据转化为生产力。

大量的2D/3D道路环境数据可通过云测数据的标注过程被赋予“标签化”意义,例如,识别树木、障碍物、道路标识、听取动作或语音命令以及一些长尾场景诸如闯红灯车辆、横穿马路的行人等等。这些标注后的精准数据将会被反馈到汽车的算法模型中,使汽车具备“看”、“听”、“理解”、“交谈”的能力,为汽车决策提供数据感知支撑,从而实现决策过程。

同样,在智慧驾驶-智能驾舱中,随着语音识别技术和情绪识别等技术的发展,为了让汽车能够识别说话者的情绪和话语,云测数据通过对NLP数据进行对话意图、领域、槽位等进行判断和标注和多角度的泛化如重组或扩充句式、标签等过程,给AI算法提供详尽高质的“教材”,帮助算法进行决策,实现卓越的人车互动。

可落地应用的道路场景数据更受关注

有专家指出,目前的自动驾驶技术还没有准备好应对复杂路况的挑战。在真实环境下,系统存在的风险性还会被放大,这也是为什么在现在自动驾驶的车辆上依旧要放一个安全司机的原因。

可以说,自动驾驶真正商业化落地的关键之一,就是要通过人工智能算法处理更多更复杂的场景。

从宏观角度来看,现有算法、算力无法准确处理复杂交通环境下无限可能的长尾场景,这时候高质量AI数据的覆盖就显得更加重要;具象到自动驾驶落地需求来看,高质量的场景数据也已成为各方业务领先竞争的关键。

作为人工智能领域内最值得期待的场景,自动驾驶产业落地的大门已开启。场景化、定制化的高质量AI数据已成为自动驾驶领域最需要的基础动力之一。而AI数据也将在不断深入的产业落地中,为实现自动驾驶的全面落地提供突破性帮助。