今年是自动驾驶商业化全面开花的一年。
年初,十一部委联合发布《智能汽车创新发展战略》,将智能汽车列入顶层发展规划,紧接着3月份自动驾驶分级标准也进行了公示;
4月,时值百度Apollo开放平台发布3周年之际,Apollo RoboTaxi服务上线百度地图及百度APP智能小程序,成为国内首个通过国民级应用向公众开放的自动驾驶出租车服务;
同月,高德与国内自动驾驶代表性企业AutoX合作推出RoboTaxi(自动驾驶出租车)项目,面向上海公众开放体验。
6月,高德又与自动驾驶出行企业文远知行达成合作,向广州市民开放RoboTaxi运营服务。
就在前几天,滴滴出行首次面向公众开放自动驾驶服务,通过滴滴App线上报名,审核后就能在上海测试路段免费呼叫自动驾驶车辆进行试乘;
……
前有百度,后有高德、文远知行、AutoX、滴滴等自动驾驶代表企业,RoboTaxi(自动驾驶出租车)赛道如今充斥着布局自动驾驶商业化落地的各方势力。
一份来自安信证券的研报认为,从国内RoboTaxi覆盖的城市来看,广州、长沙、上海等一线城市已经逐步落地,北京、苏州等地也在积极筹备,RoboTaxi在国内已成星火燎原之势,2020年将是RoboTaxi规模化运营的元年。
自动驾驶:场景化AI数据成必争之地
RoboTaxi时代正在到来,科幻电影中的自动驾驶离我们的距离正在快速接近。但是,自动驾驶真正落地还有重重阻隔,首当其冲的便是能否保证车辆安全行驶的问题。
在自动驾驶的过程中,汽车本身需要具备感知、策划、决策、控制等一些列能力,而数据则是培养自动驾驶AI能力的重要因素,数据标注存在的意义是让机器理解并认识世界。与其他人工智能应用场景相比,智能驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,背后就需要有海量的真实道路场景数据做支撑。
AI数据是整个人工智能行业的燃料,它在智能驾驶领域的重要性毋庸置疑。但现实情况是缺乏获得大量且高质量数据的渠道。一方面数据标注本质上是要获得更准确,更精细化的数据结果,而场景化的道路数据缺失、数据标注质量良莠不齐,以及数据隐私安全问题成为自动驾驶面临的三大痛点。
▲图片来源:云测数据
为解决这些行业性问题,国内AI数据服务头部企业云测数据,通过提供场景化的AI数据,来满足智能驾驶领域高标准的数据需求。
据公开资料显示,云测数据为了满足智能驾驶领域不同场景的特殊需求,业内首创了“数据场景实验室”模式,通过还原多种智能驾驶细分场景,以解决特定场景下的数据缺失、质量良莠不齐等行业问题。一方面,在场景下的定制化数据采集更加精准、数据质量更高,另一方面,定制化的场景数据也与智能驾驶需求端的匹配度更高,从而最大化将数据转化为生产力。
云测数据总经理贾宇航在接受媒体采访时曾表示:“当前的自动驾驶所需数据需求,正向着多模态的方向发展。所谓多模态,即是对多维时间、空间、环境数据的感知与融合。比如当前的自动驾驶需要雷达+摄像头才能跑得更稳,相对应的,就需要2D/3D融合标注工具。”
▲图片来源:云测数据
云测数据在智能驾驶领域数据标注领域长期保持着领先优势。在标注工具方面,云测数据自研了一套可以支持图片、语音、文本等多品类的标注平台,可满足业内图片通用拉框、车道线、DMS、3D点云、2D/3D融合、全景语义分割等标注类型,支持自动驾驶、智能驾舱、自动泊车等场景数据标注。
值得一提的是云测数据的三维标注工具,尤其是3D点云的标注工具,通过渲染引擎等方面的优化,可保证整个过程的流畅和快捷。对雷达成像的图像中的机动车、障碍物、行人等多目标进行3D标注,也是业内率先实现2D、3D融合标注的平台之一。在数据质量的导向下实现更优的品控和更快的数据交付,当属业内领先。
▲云测数据的团队在进行3D点云标注
“数据标注的准确率和贴合度至关重要,比如要在一个2D图片或3D点云图里标注出汽车,标注的矩形框要尽可能地与物体贴合。”贾宇航补充道,“云测数据利用自主开发的标注工具,即使是3D点云图像,也可以保证数据标注的流畅性和时效性,以及行业内领先的数据标注精准度。”
正是定制化的场景、丰富的数据量,还有高质量的标注结果,让云测数据与行内包括自主、合资车企,大型Tier1,以及做无人出租车的自动驾驶公司等众多企业,建立了持久良好的合作关系。
据贾宇航介绍,涉足自动驾驶领域数据标注以来,云测数据仅在难度较大的3D点云数据上,就大概输出了千万帧的数据。这些数据应用于自动驾驶感知系统的优化进步,助力算法工程师和企业们在3D感知、场景理解等方面取得进展。
AI数据助力科幻照进现实
正如人类的飞天梦一样,人们对自动驾驶有着热切的需求。
而自动驾驶真正商业化落地的关键之一,就是要通过人工智能算法处理更多更复杂的场景。从宏观角度来看,现有算法、算力无法准确处理复杂交通环境下无限可能的长尾场景,这时候高质量AI数据的覆盖就显得更加重要。
一方面,现实交通场景复杂、安全威胁多。尤其是国内路况的复杂性和国内智能驾驶起步稍晚的现状,更需要高质、更精准的数据来进行算法训练。
另一方面,从安全性上来看,标注数据质量的高低将直接影响自动驾驶的安全性。例如,人像、建筑物、植物、道路、交通标志、车辆等数据标注的准确性直接决定智能驾驶AI对于路况的判断,数据标注偏差会直接影响行驶安全。
作为人工智能领域内最值得期待的场景,智能驾驶产业落地的大门已然开启。场景化、定制化的高质量AI数据已成为智能驾驶领域最需要的基础动力之一,而AI数据也将在不断深入的产业落地中,为现实世界推开“科幻”的大门。