近年来,音视频娱乐增长“爆发”,从直播到短视频再到各大视频网站的高速发展,都在强调着这一产业的生命力。行业的爆发离不开背后的技术升级。从云计算、AI到5G,音视频的观看体验和内容制作效率都在得到提升。日前,在腾讯云+“音视频及融合通信技术”主题沙龙上,来自腾讯云的5位技术专家为大家带来了音视频领域热点话题的分享。
腾讯云解决移动直播连麦4大技术问题
什么是普通直播?什么是连麦直播?腾讯高级工程师蒋磊用单口相声和对口/群口相声来生动讲解普通直播与连麦直播的区别。并详细剖析连麦直播为什么对音视频技术的要求更高。
蒋磊表示“在连麦直播中必须要处理好延时、回声、混流和房间管理四类问题。”
在连麦直播中,延时将严重降低观众体验感。并且在普通直播单向互动几乎不会出现的回声问题,在连麦直播中出现并必须得到解决。由于连麦中有多个主播同时产生数据流,因此必须对多路的数据进行混流,带宽、网络适配。除此之外,还要考虑房间的状态、房间人数,大小主播如何沟通等业务问题。
腾讯高级工程师蒋磊
腾讯云直播PCDN加速方案为企业减负、为观众增收
“观众对视频质量要求越来越高,不断挑战传统P2P方案,纯CDN方案接近优化极限。”腾讯高级工程师张鹏从P2P行业痛点及解决方案角度,分享了腾讯云X-P2P如何既优化了网络质量,又降低了网络负载。
张鹏认为,P2P最多集中在视频这个行业里,主要是带宽成本居高不下,带宽的需求速度大于带宽成本下降速度。传统的P2P无法满足用户通过网络看视频、直播,所要求卡顿更低,时延更低的需求,而腾讯云X-P2P则完美解决了这些问题,实现为企业减负、为观众增效。
在张鹏看来,现代P2P已经不再是一门单纯的技术,而是涵盖编解码、网络结构、传输优化,更是融合了现代的分布式计算,以云计算作为支撑,能够轻易完成数千万级别并发服务的技术集。
张鹏对腾讯云X-P2P的未来也作出展望,他认为腾讯云X-P2P某种意义上实现了多播协议,即优化了网络质量,又降低了网络的负载;而456(4K、5G、IPv6)的到来,将会使X-P2P发挥进一步的能力和得到更广泛的应用;区块链的底层所使用的P2P技术和腾讯云X-P2P有异曲同工之妙;边缘计算也将依赖稳健、安全、高效的P2P技术底层;XNTP传输协议继续优化,甚至将可以和quic相提并论;最终,X-P2P可能回归最初的梦想,让互联网形成彻底去中心化的服务模式。
腾讯高级工程师张鹏
海外直播应着眼于如何取得边际收益最大值
在技术领先的基础上,腾讯视频云也在不断加速海外布局进程。腾讯云高级工程师、海外直播技术负责人胡仁成以自身经验分享了腾讯云海外直播的系统架构设计以及最佳实践。
在胡仁成看来,海外直播可以分为三部分:(1)海外直播系统在应用软件层面跟国内没有太大的区别,更多在网络建设、布点建设上的工作;(2)在此基础设施上我们架设软件系统,实现直播流媒体的分发;(3)我们在已完成的系统上更深入化的做好更多细节上的优化,包括跨区域的拉流等方面的优化,例如精细化的调度,精细化到运营商实现调度。
胡仁成也对腾讯云在这三方面所进行的探索,每一部分会遇到的问题以及相应的解决方案进行了介绍。
对于海外直播与国内直播的区别,胡仁成表示“海外跟国内最大的区别是如何在综合成本的控制下取得边际收益的最大值。”
腾讯云高级工程师胡仁成
“老技术”带来新场景——实时音视频与PSTN相结合
“当你在使用QQ讨论组进行语音通话时,对方离线无法加入,在多人会议这一相对紧急的场景下,该如何解决?是否可以通过打电话的强提醒方式直接进行语音通话呢?”腾讯云高级工程师颜学伟在分享中提出这一问题。这种场景的实现需要实时音频技术与PSTN技术相结合。
对于实时音视频作为当前热点如何与传统的PSTN这一古老的技术进行融合的问题,颜学伟认为应该求同存异和适配融合。分析两者的差异,再找到相同的地方进行适配融合。
具体有两种方式:一是让VOIP端的QQ来适配PSTN的差异,二是让传统的PSTN来适配VOIP的差异。但这两种方式,在实际中还需要增加新的适配层,分别对信令进行适配和对码流进行适配。
同时,颜学伟表示“实时音频,低延时是重中之重。可以通过调度分配,尽量分配相同城市、相同运营商、相同机房的媒体服务器来减少延时。有条件的地方可以与运营商专线直接连接,避免外网抖动带来的高延时。对于外网丢包采用ARQ和FEC的方式来进行缓解,要实现系统的高可用则要进行资源的冗余部署和自动切换。”
腾讯云高级工程师颜学伟
AI加持为视频带来更多想象力
“视频+AI=?”腾讯云高级工程师孙祥学用三种音视频跟AI结合的尝试回答了这个问题。第一种尝试是极速高清,在考虑不降低视频质量的情况下降低视频码率,目前已有斗鱼、虎牙、央视等客户接入使用;第二种尝试是云剪,一种基于web的在线视频编辑工具,视频处理的同时可以直接预览;第三种尝试是智眸,对视频智能识别和分析。而智眸主要分为三块:智眸平台和产品矩阵的构成;识别系统架构和多媒体处理框架;以及引擎基础上的场景优化以及智能编辑简介。
其中,包括媒资管理、视频搜索推荐、直播流监控、视频审核、自动跳过片头片尾及实时字幕,都是视频和AI融合的典型场景。
腾讯云高级工程师孙祥学