近几年CV(计算机视觉)一直是AI最火的技术领域之一。经过几年的攻城略地,国内市场已经形成了旷视、依图、商汤、云从这「CV四小龙」盘踞的格局。
但目前CV应用仍然局限在人脸识别领域,应用范围有限并且容易看见天花板。随着人脸识别算法的普及,企业很难做出有竞争力的差异化产品。
国内的云通讯巨头容联云通讯(简称容联)从2018年起开始涉足CV产业应用,将AI视觉技术带入产业,通过分析监控视频为企业、项目的生产和运营提供指导。
容联的实践无疑为已成红海的CV行业指出了一条新的路子。
撰文 | 徐丹
坐落于合肥的海尔滚筒洗衣机工厂中,工作人员正紧张有序的进行洗衣机生产。生产线的另一边,一台机器通过摄像头密切记录着生产情况。
当一台生产好的洗衣机进入传送带时,机器迅速发出警报,因洗衣机表面出现略微凹陷。
这台机器便是容联的智能视觉分析平台「慧眼」,2019年落地海尔智慧工厂,通过监控分析来识别违规生产动作、产品瑕疵和安全隐患,自动识别违规操作并记录,大大降低次品率和赔付成本。
海尔工厂的需求并不是特例,在常见的人脸识别等监控类安防外,越来越多的企业需要一种操作系统,可以「读懂」监控内容为生产提供指导。
这种操作系统可以称之为垂直于行业的CV产品,目前这个赛道还未完全成型,专注于此的大多数是在某一个行业深耕的创业公司,难见行业巨头。
容联是国内云通讯市场「老大哥」,2018年开始推出行业CV产品,目前已经涉足智能制造、化工园区、智慧工地等多个行业,合作的头部企业十几家。
一、在CV行业冲出新路子
细数AI技术落地应用,CV应该可以说是国内最成熟的一个市场。但正因成熟,目前市场竞争格局基本成型,巨头环伺。
「CV四小龙」牢筑护城河,创业公司很难进入,并且人脸识别算法的普及和应用遍地开花,产品已经很难做出差异。
生产端虽然火热,但从实际落地情况看,除一些车站、小区、办公园区等公共场所应用到人脸识别产品外,行业感知度并不高。
「AI技术虽然发展迅速,但大多数行业对AI应用都还很陌生。」容联联合创始人许志强说。
并且对行业来说,人脸识别解决的问题毕竟有限。而海尔工厂的案例也代表着许多行业真正需求点。在监控产品外,他们还需要一个视觉分析系统,通过分析监控内容对生产运营提供实际指导。
据许志强具体解释,这种系统可以看作是对监控的补充。系统对接监控摄像头,通过标准协议采集摄像头视频流,对视频进行抽帧处理,然后根据配置的算法模型识别异常情况。包括人员入侵、烟火等安全问题或者生产流程中不规范操作、产品瑕疵等等。
目前致力于行业CV的大多数是垂直某个行业的小型创业公司,难见行业巨头,但需求极大,用许志强的话说,「这是一个百亿级别的规模的,刚刚起步的市场。」
容联成立于2013年,是云通讯市场最大的独角兽。以云化和智能化的方式,为企业客户提供全面的通讯服务。包括PaaS通讯能力(语音、短信等)、CC(云客服与云联络中心)、UC(IM即时通讯云、空中营业厅、企业直播)和“通讯+AI”服务,助力企业提高沟通体验和经营效率。
2016年容联开始根据市场需求涉足AI,2018年与华中科技大学联合成立AI实验室,主要研发深度学习AI算法,在此基础上推出了基于智能语音识别、自然语言理解的AICC、智能客服产品。
同时,根据自身的视频处理技术和AI算法的积累,容联也向CV行业伸出了触角,推出了智能视觉分析平台「慧眼」和智能化视频识别分析一体机「Aibox」两款产品。
慧眼属于平台产品,适用于100路以上的摄像头分析。不仅提供标准化的算法模型,还提供能力接口和模型优化服务,比如落地海尔工厂的慧眼就可根据生产情况定制工序检查和生产线监控模型。
根据定制产品积累的算法模型,容联后续又根据低预算客户需求推出标准化硬件产品Aibox,内置多种算法模型,适用于100路以下摄像头分析,不提供定制和优化模型服务。
二、受海尔、国家电网等多家巨头企业青睐,能「读懂」监控的算法什么样?
目前容联CV团队近100人,产品已经在化工园区、智慧工地、智慧工厂、明厨亮灶等多个行业落地,合作的客户十几家,包括海尔、国家电网、中国石化、中国石油等。
相比于传统监控产品,慧眼和Aibox最大的优势就是可以深入行业环境帮助企业降本增效。
以智慧工地为例,慧眼可结合工地复杂现场做全方面检测。
比如出入口人员检测环节,除常规人脸识别外,还可做人数统计、安全帽、反光衣和聚集检测,车辆检测包括类型识别、数量识别,甚至轮胎泥土检测。
现场作业区域可识别入侵检测、基坑堆放检测、临边洞口检测和跌倒检测,人货梯区域有人数超载检测,一旦发现异常情况系统会立刻发出警报促进问题解决。
在化工园区,容联已帮助多个化工园区完成视频智能化升级改造
在生产车间、装卸点、固定动火点等作业区域可以识别安全帽、工装、反光衣等劳保用品佩戴情况,在罐区、危化品仓库、配电房等重点区域一旦有外来闯入人员,可自动触发系统告警,对于中控室等需要在岗值守场景,可自动识别睡岗、离岗等行为,对整个化工园区可24h自动识别烟雾火焰等目标,将事故隐患降至最低。
在智慧工厂领域,容联产品已经超越了安全检测范围,可以深入到生产流程检测产品质量。比如在与海尔工厂的合作中检测范围包括运输越线、安全穿戴、工序流程和产品瑕疵,此前海尔合肥滚筒洗衣机厂年产洗衣机上百万台,因次品赔付超过千万元。合作后该厂的违规操作、赔付成本都下降了30%,安全事故发生次数减少了50%。
在与某工厂合作项目中,慧眼可以检测工厂和叉车人行道混乱、员工作业不规范、塔架坍塌和传送带停止等设备异常,让工厂违规作业现象下降了30%,人力成本降低了10%,安全事故减少了50%。
在“明厨亮灶“领域,容联也已具备完整的AI智能分析解决方案
对厨房操作间的人员行为进行智能识别,如后厨吃饭、抽烟、玩手机等行为;对于厨师衣着、帽子、口罩、手套等防护用具进行智能检测;对于老鼠虫害进行智能检测。
当然,目前AI的技术不可能百分百实现用户的所有场景需求,经常会有技术无法处理的情况发生,比如智慧工地中的高空坠物问题,因物体速度下落太快,摄像头难以精准捕捉到。不过,容联针对行业的解决方案已经可以解决特定应用场景下80%以上的需求。
三、检测准确率超过90%,容联优势在哪?
相比于竞争对手,容联产品的优势很明显。前段时间做安全帽佩戴检测的行业分析。许志强发现,容联产品准确率相比竞品高出很多。容联产品准确率超过90%,而对方误检率超过了一半。
为什么容联会有这个优势?
算法落地行业,其实算法本身差别并不大。「算法技术的发展最先肯定是在学术界,每家企业只要对前沿技术盯得紧,都不会差太多。」许志强说。
容联的优势就是在于针对特定场景的数据增强处理、AI和传统技术的结合以及工程化处理技术。
AI算法极度依赖数据,但是很多情况下数据采集又比较难,如火的素材采集,在正常的场景下很难出现这样的素材,对于这类素材,容联自有的数据增强处理技术可以在素材比较少的情况下获得比较好的效果。
虽然深度学习在机器视觉的图像分类、目标检测、跟踪等领域均有革命性的进展。但深度学习不可避免地依赖于训练数据,且深度学习输出结果中一般都有“阈值”限制,实际应用中,很难设定适用于所有场景的统一阈值。
此时即需要结合传统CV技术,传统技术的一般特点是通用性较强,结合深度学习后,可得到神经网络模型输出的具有语义信息的结果,在保持通用性的同时提升精度。例如目标跟踪场景,利用深度学习检测图像中特定种类物体位置,结合传统背景建模、帧差法、光流法等,达到一定集成学习的效果。
目前AI技术在落地过程中仍然受到数据量、数据质量、标注成本、数据域变化等问题的制约,单纯依靠深度学习模型难以解决复杂场景下的实际CV问题。容联具备一系列针对实际应用场景的工程化优化手段,包括图像的时序分析机制、检测目标属性过滤机制、目标跟踪及ReID机制等,提高算法在落地应用时的精度。
另外,除了技术上的壁垒,容联CV产品一个重要的壁垒还是其在行业中的积累,因为做某个行业的视频识别本质上就是还是拼行业数据的积累、以及对行业的理解力。
容联本身是国内最大的云通讯厂商,与多个行业内的头部客户有密切联系,容易获取客户信任。实际上容联最开始做CV的契机就是客户需求。
在实际操作中,准确洞悉行业痛点是一个周期很长且很重的事情。CV落地会碰见许多问题,在视频源方面,客户原本安装的摄像头可能会出现画面被遮挡、光线变化大、距离较远等问题,需要要跟客户沟通调整。
另外理解客户实际需求本身到真正的算法落地需要相当长的周期,短则三个月,长则半年,在这期间需要不断和客户磨合,根据实际情况调整算法。最后才能形成一个在行业里面能够达到生产级别落地的算法模型。
对于创业公司和之前没有相关资源积累的企业来说,很难获取行业头部企业的信任。并且头部企业往往就是一个行业的标杆,在服务大客户过程中会积累到很多行业数据和经验,提升算法精度,容易建立自身优势,优势又会带来更多客户,滚雪球式的筑起一个很高的壁垒。
容联的标准化产品Aibox就是在服务不同行业客户,积累许多数据模型的基础上产生的。正是由于这些积累,容联能在很短的时间内做出优于他人的产品demo,获得客户的青睐。
在未来,容联打算继续深耕垂直行业,从「CV产品提供商」深入到「解决方案提供商」,与一些合作伙伴一起,提供「发现问题-解决问题」一体化服务。比如在智慧工地行业与合作伙伴一起提供CV增强的建筑工地信息化系统,帮助企业更好的解决问题。
四、尾声
当前国内的AI技术已进入爆发式发展,但如何应用落地还是亟待解决的问题,正如许志强所说,大多数行业对AI都没有感知力。
研究一些成功的落地案例可发现,AI作为一种高精尖技术自带「不落凡尘」的气质,但如果让技术扎根落地,最重要的还是真正下沉产业。
也就是说,很多时候掌握技术只是一个基础,在此基础上开发应用还需要更多的思考与实践。容联的CV实践无疑是提供了一个非常好的方向。