在人工智能飞速发展的时代,机器已经具备人的视觉、听觉、语义识别的能力。要让机器变得越来越“聪明”,需要大量优质的标注数据来提升机器学习的准确性。可以说,数据是人工智能技术实现的重中之重,数据标注的准确性影响着算法模型训练的表现。
在行业的不断发展探索之下,目前数据标注的准确率记录不断被刷新。在2020年国家级重大国际经贸活动服贸会上,云测数据发布了一项数据标注领域的重要成果:其项目最高交付精准度达到了99.99%——这是目前数据标注领域可达到的最高服务标准。
99.99%,这不仅仅是数字的变化,更体现着人工智能对数据标注精准程度要求正在变得越来越高,对数据维度和样本复杂性的需求也越来越高。随着人工智能技术在各个行业的落地进程不断加速,质量与效率成为了数据标注行业新的共同追求。在这样的背景之下,数据标注又应当做到效率与质量并存呢?
以云测数据为代表的企业开发的工具为案例,目前来看,工具对数据标注的价值有这三个体现:
一是直接的操作辅助,例如对人脸进行26点、54点、96点、206点的人脸关键点标注、贴合度在3像素以内的特定任务关键点追踪,这使得标注员的操作能够更加精细化,并提升了标注效率。
二是特殊数据的操作辅助,例如自动驾驶中激光雷达形成的3D点云数据不同于摄像头形成的2D图像数据,标注起来更有难度也更可能出现偏差。通过融合标注工具(把3D点云数据和2D图像数据结合在一起对照)可有效提升不同维度数据的协同处理,提高标注精准度。
三是数据标注的纠错保障,云测数据采用了基于规则的机器筛查方式,能够在人工校验流程前根据所标注项目的要求引入相关查错规则,进一步保障了数据精度的提升。
当然,机器筛查只是一种辅助,提高执行系统平台的流程化协作能力,准确地把控从创建任务、分配任务、标注流转到质检/抽检等环节,可以更好的提高数据标注的效率、质量和安全。
在多元化的人工智能场景落地的过程中,AI数据质量已经成为人工智能行业发展的痛点。现阶段,各行业正在积极拥抱人工智能技术,包括安防、金融、工业、医疗、教育等领域对AI技术的需求极大,高精度AI数据交付在助力AI产业场景化落地的同时,不仅带来了更好的用户体验,也进一步加快了智能化时代的到来,带动算力、算法等领域的振兴。相信头部和专业的AI数据服务企业将推动人工智能产业落地进程,加速未来的到来。