2月27日,网络直播行业标杆性盛会——第二届中国网络表演(直播)行业高峰论坛暨网络直播年度盛典在京召开。金山云凭借在AI内容服务领域的丰富经验和行业影响力受邀出席大会,公司金睛AI首席算法架构师苏驰博士在大会上发表主题演讲。
“AI直播内容服务”是金山云“金睛”产品服务中的重要部分,早在直播行业方兴未艾之际就已进入技术研发阶段,后续又紧随《互联网直播服务管理规定》同步上线。经过多年的市场打磨,“金睛”在短视频、直播内容安全服务领域已成为业界翘楚。直播行业日新月异的发展,“金睛”AI内容服务也在革新,实现了从网络净化到内容挖掘,从安全的守护者到内容的引路人的“角色”转化。
行业的成熟和AI的进阶
短视频、直播行业在“野蛮生长”中经历了监管重拳的“当头棒喝”,也走过了行业“百团大战”的激烈角逐。当下,行业进入健康平稳的发展状态,规范化增强,马太效应显现,行业格局逐渐明晰,追求更为优质的内容成为了各平台的共同目标。“目前,金山云金睛为内容运营方提供图片审核、语义审核、智能OCR、智能语音、视频理解、智能标签六大类全方位的审核服务。随着直播行业呈现多元化布局、出海扩展、精耕细作、短播融合的趋势,金山云金睛从服务类型、服务模式到AI算法模型都发生了巨大的改变。行业每往前走的一小步,都是内容服务产品的一跨步,也是AI技术的一次技术突破性飞跃。”苏博士在现场说道。
随着行业生态、格局和发展阶段的不断变化,金山云守住内容安全红线,催化全新的业态,实现内容产业的价值转化。正式推出面向短视频、直播平台的“秀场直播理解解决方案”、“游戏直播理解解决方案”、“短视频内容理解解决方案”,依靠AI内容服务能力,金山云帮助平台方将精细化运营覆盖到从生产到分发的全环节,为平台优质内容产出、打通作者和用户间壁垒,实现平台差异化布局夯实了技术基础。
如何赋予AI一双欣赏美的眼睛
“内容理解”顾名思义,是让AI具备理解人、事、物内容表象以外的深层含义、逻辑关系的能力。直播、短视频内容理解解决方案,依托金山云拥有专利的时序算法,通过构建动态视频处理模型,实现高精准度的视频类别、主播风格、场景及物体的识别。
以秀场主播为例,金山云的AI内容理解服务除了要识别他(她)的外貌特征和主播个人身份之外,还要理解她的个人风格,例如萝莉、可爱、鲜肉、御姐等;以及懂得她目前的每一个行为和所在的环境场景。通过精细的标签分类,为直播平台差异化、精细化运营,挖掘潜在价值内容提供服务。
金山云内容理解模型目前已经支持100多种视频类别,比如,遛狗、跳舞、美容、美食、健身、音乐、游戏、运动、风景等。模型支持细粒度的标签,可以精确到游戏名称、舞蹈类型、歌曲风格等。赋予AI“发现美好生活”能力的背后,是金山云金睛AI算法团队科研攻坚的成果——通过训练超千万个高质量的短视频,得到的具有很强的泛化能力的内容理解模型和金山云金睛专利时序算法。
苏博士介绍,内容理解不是一般的图像识别,必须全面捕捉视频内容中的时序信息。金山云内容理解模型通过三维时空卷积(3D conv)和三维时空卷积长短时注意力循环神经网络(LSTM and Attention)来精细捕捉视频单帧图片的局部与整体时空信息。金山云AI算法团队受人脑注意力机制的启发,引入“时空注意力机制”,使得模型可以聚焦关键帧、关键位置的信息,降低无关帧对模型性能的影响。整个模型不需要任何人工干预,输入原始视频,就可以得到最终的预测结果,整个模型精度高、速度快。目前,金山云金睛内容理解模型处理单个视频只需要30毫秒的时间,精准度超过80%。
随着5G时代的到来,持久的行业竞争将刺激内容平台参与者不断地进行技术创新,依赖更为精细化、强运营的手段紧密地链接用户和高质量的内容制作者,并继续推动文化产业的繁荣。作为参与者,金山云金睛一站式AI内容服务产品发挥的市场价值还将裂变。