TOP厂商分享“秘籍”,云测数据高质量AI数据交付如何炼成?

近期,在中国人工智能产业发展联盟和中国信息通信研究院联合举办的 “AI数据治理技术沙龙”中,云测数据总经理贾宇航针对AI数据高质交付背后的服务、技术与流程等方面内容进行了相关分享,并强调随着人工智能行业发展不断涌现出新技术新趋势,人工智能数据的采标服务需满足的AI应用场景比以往明显更加广泛,随着而来对数据标注精度、交付效率、知识经验的要求越来越高,AI产业对数据的拓展性需求和前瞻性需求将快速增长。

回顾过去,早期的AI数据行业曾长期处于粗放的发展模式,数据粗制、混乱、复用的情况屡见不鲜;但随着AI与各个产业结合得愈加紧密,AI商业化程度进入新的高度,行业属性较强的垂直领域加速落地,AI数据的需求正逐渐转向个性化、场景化和准确化,头部数据服务供应商的技术实力、精细化管理能力、流程把控能力正在不断提升。

在多元化的人工智能场景落地背景下, AI和传统行业之间的融合、协作越来越多,孕育着大量的新兴细分市场,AI行业应用场景趋于长尾和碎片化。伴随着人工智能产品的迭代,AI数据的演进过程也伴随着自身选择的演化,体现在数据多维化、场景多元化、样本多样化、内容专业化、作业精细化、作业高效化等方面。贾宇航认为,在人工智能数据市场中,数据服务商想要形成强劲的业务优势,就要摆脱同质化竞争,保持在模式、技术、服务等方面的不断发展:

  • 一是加强场景化数据的采集能力,换言之就是为人工智能细分场景的落地,提供更加垂直且丰富的数据,满足其长尾场景的需求;
  • 二是提升数据标注的准确性,从工具、规则、流程的开发制定,到标注人员的素质培养,不放过任何可以提升标注准确性的可能;
  • 三是充分发挥“底层技术+服务能力”的力量,具备更深刻的行业领域知识、更懂场景、更懂技术、更具行业前瞻性。

贾宇航强调,人工智能时代下,数据是重要一环,推动着算法的应用。算法是一项技术,不独立存在,需要嵌入到工程研发中,再通过市场的运营和竞争赢得相应的份额。在算法的研发中,从场景定义到算法部署,都与AI数据服务企业息息相关。

云测数据的发展策略是将产研做到全面覆盖,率先形成AI训练数据的“采、标、管、存”一站式服务,实现了从“数据原料”到最后的“数据成品”全链条打通,全方位赋能AI开发中数据引入这一环节。目前。云测数据已经建立了数据产品、数据处理工具与数据服务的“三螺旋”,为智能驾驶、智慧城市、智能IOT、智慧金融等行业提供高效率、高质量、多维度、场景化的数据服务与策略,最大化发挥训练数据的价值。

同时,云测数据以技术创新加速行业发展为己任,通过推出“云测数据标注平台”、“AI数据集管理系统”等技术成果,为AI相关企业提供处理大规模感知数据的能力,通过结构创新、智能化、工程化、标准化的标注平台产品赋能AI训练数据行业,极大地加速了人工智能相关应用的落地迭代周期,节省大量研发时间和成本,进而推进AI产业的场景化落地。

当前,不管是人工智能技术的研发以及应用领域的发展,“数据”都是一个不可或缺、位于重中之重的因素。AI数据作为新的生产要素声名渐显,它是人工智能长期发展的重要保障,人工智能技术研发、训练的关键。这其中,云测数据正在持续引领行业,推动AI数据行业的发展。相信在未来,云测数据将持续保持自主创新性,坚持与时俱进,更好的为人工智能提供训练数据服务,为数据要素有序发展及高效利用发挥推动作用。