2020年7月末,工信部、科技部、国家标准化管理委员会、中央网信办、国家发展改革委等五部门联合印发《国家新一代人工智能标准体系建设指南》(以下简称《指南》),《指南》旨在加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定,促进产业健康可持续发展。值得关注的是,在该《指南》中,智能家居明确作为重点行业之一进行推进发展。
智能家居融合了IoT、人工智能、边缘计算等信息技术,从开关到大家电,从门锁到窗帘,均可实现智能化操控,动动手指,或者说一声就可以对家庭各种设备进行操控,甚至达到“无感”化服务体验,应用场景相对更具集中性和确定性。
在音箱、电视、门禁等常见的家庭单品背后,操作系统、感知控制、内容生态等各个层面的协同升级,将会使得消费级的产品更多样化,也更加成熟。依托于电视、音箱、扫地机器人等常见的智能产品,未来需要不断地对场景进行挖掘延伸,产生更多“小场景”数据并进行标注,从而去训练算法,让其变得更加“聪明”。
那么,智能家居到底需要什么样的AI数据呢?云测数据扎根于AI数据服务领域,在服务众多智能家居头部企业的过程中,积累了丰富的数据采集和数据标注经验,对此问题作出了解答。
一、聚焦于场景的AI数据
由于智能家居多以房屋、住宅、社区为载体,应用场景相对更具集中性和确定性,因此,智能家居更重产品更重体验。
例如小爱音箱一类的智能音箱产品,用户可以与之进行多轮对话,同时可以对其发出语音指令控制,从而实现点歌、查天气等操作。在诸如此类的“小场景”下,数据的精细化、场景化程度就决定了算法有多“人性化”。而体现在产品的使用上,不仅可以避免出现语音助手答非所问的错误,也可以提升家庭多设备之间交互的效率。云测数据拥有充足的被采资源,并在业内首创“数据场景实验室”模式,可最大程度还原搭建智能家居应用场景,同时拥有麦克风阵列等专业硬件设备,可提供语音、视觉类数据的场景化采集。
二、更高准确度的标注数据
在智能家居行业,人工智能主要解决的是机器在看、听、理解方面的问题,因而语音识别与自然语言处理能力已经成为兵家必争之地。数据标注则贯穿人工智能产品的探索期与商业落地阶段,云测数据通过更加规范性的组织管理和质量控制,为人工智能迭代提供质量更高更可靠的数据服务,专注解决企业AI数据难题。通过高精准度的标注数据交付,从而为现阶段AI商业化竞争提供高质量的数据支撑。在语音方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等,支持全方位的标注类型。
三、更高效率的AI数据支撑
在人工智能时代,不仅是智能家居企业,各大领域的竞争越来越激励,对于产品和服务的更新换代也有着越来越高的要求。因此,效率成为了企业发展的核心竞争优势之一。保证生产效率这一点上,云测数据十分强调作业协同化。在AI数据生产中,云测数据设计了从创建任务、分配任务、标注流转、到质检/抽检环节和最后的验收等更完善的管理流程,每个环节有相应专业人员来把控数据标注的质量和时间节点,进行好上下游工作环节衔接,得以在保证质量的前提现下可以真正提高效率。助力智能家居企业抢占市场先机,把握核心竞争优势。
四、更安全的AI数据保障
谈及数据,必绕不开的一个话题就是数据隐私、数据安全。云测数据一直将AI数据隐私安全放在业务开展的首要地位。在保障AI数据隐私性、安全性方面,云测数据三管齐下。在数据采集之前,云测数据会与所有数据采集的用户都签订数据授权协议,确保AI企业用于训练的数据合法合规;同时,在AI数据合格交付后从不留底,坚持数据绝不复用的核心原则。此外,云测数据从内部信息系统的管护到标准化的流程作业体系都建立了确切的数据保障机制,力图做到步步保护、层层把关。
在云测数据看来,让智能家居企业拥有数据会成为企业核心的竞争壁垒。客户选择与云测数据合作,不仅是对高质量数据交付的认可,也是信任云测数据对AI数据隐私安全的掌控,从而更好的推进智能家居商业化。
综合来看,云测数据认为,场景化、高质量、高效率、更安全的AI数据,更符合当下智能家居产业的落地应用阶段。利用好上述几点优势,AI数据或许能成为智能家居突破瓶颈进入下一个爆发期的 “得力助手”。优质的AI数据,可以让一切刚刚好,让智能家居更智能,驱动人们智慧生活得以实现。