人工智能应用落地提速,从场景化数据开始

人工智能数据采集标注头部企业云测数据近日发布了《2021 年人工智能数据采集标注行业四大趋势预测》。其中,云测数据强调了场景化的数据对人工智能技术深化应用的积极影响,并认为随着人工智能对长尾场景的数据需求进一步扩大,3-5年内,场景化数据将拥有更广阔的增量空间,成为行业加速发展的新引擎。

云测数据总经理贾宇航在公开演讲时也强调,“当下阶段,训练数据要更加贴合多样的使用场景、更加注重数据精准度、更加要求专业技能知识,同时还要保证其隐私安全等要求。”

人工智能应用落地提速,从场景化数据开始

以智能驾驶为例。与其他人工智能应用场景相比,智能驾驶的落地场景相对复杂,想要让汽车本身的算法做到处理更多、更复杂的场景,背后就需要有海量的真实道路场景数据做支撑。然而,场景数据缺失、数据质量良莠不齐,以及数据隐私安全问题,成为智能驾驶领域AI数据面临的几大痛点。

“更好的数据意味着更好的决策”。让汽车具备“智慧”,智能驾驶成为全球许多国家都在关注的一个重要课题。而在这一过程中,AI数据对于汽车智能驾驶而言至关重要,它是汽车变得更“聪明”的关键。自动驾驶真正商业化落地的关键之一,就是要通过人工智能算法处理更多更复杂的场景。

云测数据为了满足智能驾驶领域不同场景的特殊需求,在业内首创了“数据场景实验室”模式,通过还原多种智能驾驶细分场景,以解决特定场景下的数据缺失、质量良莠不齐等行业问题。一方面在场景下的定制化数据采集更加精准、数据质量更高,另一方面场景化数据也与智能驾驶需求端的匹配度更高,从而最大化将数据转化为生产力。

人工智能应用落地提速,从场景化数据开始

通过剖析云测数据智能驾驶数据服务解决方案,我们可以简单的将标注场景分为车内和车外。

在车内场景中,疲劳监测、动作识别、场景光线等一切会在车内发生的场景,以及在车外环境中更复杂的障碍物、道路、天气、地点、车道线、路标,以及一些长尾场景诸如闯红灯车辆、横穿马路的行人、路边违章停靠的车辆等所有可能会涉及的场景,都需要对应的如连续帧标注、2D图像框选、图像分割等不同的标注方式。

上述这些只是智能驾驶中涉及到摄像头的数据,多为图片类数据的。由于对安全的严苛要求,当前的智能驾驶所需数据需求,正向着多模态的方向发展。所谓多模态,即是对多维时间、空间、环境数据的感知与融合。

在汽车的感知部分不仅只有摄像头,还有激光雷达、毫米波雷达、超声波雷达等多种方式共同组成,而这些感知方式都需要对应的数据标注。

以激光雷达为例,高性能激光雷达可以实现200米范围内,精度高达厘米级的3D场景扫描重现。它生成的3D点云数据通过标注后,可以助力自动驾驶模型的训练。云测数据基于行业先进的标注工具和丰富的标注经验,对机动车、障碍物等目标物进行3D框选、对雷达图进行语义分割,同时还可以对2D 3D多传感器融合的数据进行同时标注,实现视觉和雷达的数据感知,帮助汽车更好的感知道路场景,为智能驾驶技术的发展保驾护航。

当前,不管是人工智能技术的研发以及应用领域的发展,“数据”都是一个不可或缺、位于重中之重的因素。可以说,获取还原与AI应用场景的纯净数据,是是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。只有当AI应用获取了更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。相信在以云测数据为代表的深耕场景化数据采集、数据标注的人工智能数据服务商,将进一步实现人工智能数据服务质量的飞跃,助力人工智能产业的落地。