专访声网Agora.io CTO陶思明:全互动是直播的下一个爆点,多行业直播业务暴增

2016年10月28日-29日,在北京长城饭店,由声网Agora.io和美国最大的IT行业协会TMC合办的第二届实时互联网大会将盛大召开。实时互联网大会聚焦于实时通信技术从技术与人的思想中,释放更专业的能量来构建沟通的影响力。届时来自国内外实时领域的技术和行业超级大咖,以及Google、阿里、百度、Intel、陌陌等众多演讲嘉宾将齐集讨论,以此洞悉未来互联网新趋势和商业的新机会。(报名猛戳:大会官网)

实时互联网大会召开前夕,前YY(欢聚时代)技术委员会主席,现声网Agora.io CTO陶思明接受CSDN专访,就声网Agora.io过去一年在实时通信领域取得的技术性突破及声网Agora.io基于全球软件定义实时网SD-RTN(Software Defined Realtime Network)的实时通信和全互动直播技术的重大进展进行了深入沟通。

20161018154201846

声网Agora.io CTO陶思明

陶思明从05年开始一直从事网络音视频通话技术研究,国内骨灰级的网络音视频专家,在音视频通信技术实践、通信网络架构部署等方面有非常深厚的积累。加入声网Agora.io前,曾担任YY技术平台部总经理,YY技术委员会主席,全面负责整体技术架构、流媒体、点播直播技术等。

开创实时通信新时代

访谈一开始,陶思明就为我们总结了声网Agora.io过去一年在实时通信领域取得的4个主要技术突破:

首先,声网Agora.io在全球部署的软件定义实时网SD-RTN(Software Defined Realtime Network)数据中心已近100个,极大优化了全球范围内的实时音视频传输。为全球客户提供高质量、高可用的实时通信和全互动直播技术服务,能够很好地支持开发者在海外和全球范围的业务拓展。

其次,基于SD-RTN这个实时虚拟通信网,声网Agora.io还催生了两大业务主线:实时通信和全互动直播。与传统的实时通信技术相比,声网Agora.io的服务最大特点之一就是超低延时,全球端到端延时仅为76ms。超强实时互动是第二个特点,比如全互动直播,可以让主播和观众通过文字、语音、视频等多种方式来实现全面互动,打造”重现现场”的全新体验,这与当下简单的赠送礼物、双人连麦不同,全互动是可以真实模拟现场的真实互动,比如相声演员表演时,台下配合的掌声、喝彩和嘘声互动。这其实是一个在主播、近场观众和远场观众之间随时无缝切换的全互动场景。

再次,声网Agora.io为开发者提供了十分简单的API接口,几行代码就能让App实现音视频通话和直播,并不断完善相关实时相关功能,比如全网256位加密、通过美国HIPAA认证、实时通话数据监测、白板、屏幕共享、录制等,为开发者提供更全面的价值服务。声网Agora.io专注于把实时通信这件技术门槛很高,质量很难保障的事情做得很深很专,为广大开发者、创业者提供最简单的接入服务,并提供高可用高质量的实时通信服务。

最后,基于公共网络传输的复杂情况,如丢包、抖动、高延时问题,声网Agora.io在私有编解码方面在这方面做了非常多的优化,也将专门针对互联网信道特征设计音频编码标准,这在行业内也是首创。

对于实时通信这个概念,陶思明表示,通信过去和互联网是两个范畴,但是现在它们的融合更加紧密,比如你每天都在用的微信,Skype,陌陌,比如在线教育、在线医疗等多个行业的发展。因此实时通信和互联网的融合,已经重新定义了一个新的行业叫”实时互联网”,而声网Agora.io无疑就是这个行业的全球最早和最主要的推动者。

实时通信技术的最关键指标之一是延时。根据ITU国际电信联盟标准,实时通信标准是延时在400ms以内,这样才能保证通话体验。而当这一概念延伸到互联网实时标准时,由于公共网络的复杂性,需要对抗丢包、抖动等,会比一般的电信传输更有难度,因此很多人认为互联网的实时通信延时在800ms以内仍然可以接受。用户在看传统一对多直播的时候,如果有2秒甚至十几秒延迟,体验差别不大。但是如果在主播和观众之间需要实时对话的强互动场景中,这个延时必须是毫秒级的才可以满足。

图片描述

而当前直播行业即将迎来全新”洗牌”,同质化竞争已白热化,很多当下以网红为核心的秀场和娱乐直播平台即将消失,流量会集中在几个超大直播平台上。与此同时,更加实时,更有互动性的直播技术即将被应用在更多的垂直行业中,如新闻、电商、娱乐、教育、游戏、设计等,多元化的行业应用,让直播业迈入更加实时,超强互动的新时代。

为何需要实时通信?

图片描述

谈及声网Agora.io实时通信技术的研发背景,勾起了陶思明对往事的回忆。陶思明表示,当年离开YY(欢聚时代)的时候,海内外的开发者、创业者、科技人员、企业都主动提出,希望声网Agora.io能为企业提供专门的音视频通信服务,当时类似的需求非常多,于是在创始人赵斌和团队的多番讨论后,开发一个简单的实时API,让开发者可以像用”自来水”一样随时调用实时通信服务,成为了声网Agora.io的最核心业务。随着实时通信在越来越多行业的应用,这个业务发展到今天,就形成了更多元化的产品和服务

实时通信技术已经被应用到互联网的很多行业中,起初从企业级会议逐渐覆盖到各个垂直行业和细分领域。实时通信的多元化应用远超预期,通信技术正在革新和颠覆医疗、教育、直播、游戏、社交、旅游、客户服务、企业协作、电商、在线旅游,以及当下备注瞩目的AR/VR行业和IoT领域,规模化的应用背后是一个亿万级的市场。

作为这个行业的领军者,声网Agora.io在实时通信技术和服务上有非常多的独到之处,这些也是影响到开发者业务最关键的几个方面:

低延迟方面,在网络良好的情况下,声网Agora.io的语音传输延时要求在400ms以内,声网Agora.io的延时远低于单纯点对点网络通话延时;

高可用性方面,声网Agora.io实时云服务是有质量保证(QoE)的音视频服务,通话连通率99.9%,服务可用性99.99%;

高稳定性方面,声网Agora.io的超强抗丢包技术,譬如前向纠错,丢包重传等,可以让30%丢包无感,声网Agora.io的抗丢包能力远超单纯点对点网络通话;

在高清音画质方面,声网Agora.io拥有自己的私有音视频编解码,针对互联网的特性来进行很多专利的优化。声网Agora.io拥有独特音频编解码器支持32kHz超宽频音质,将普通电话质量提高4倍。

对标Google WebRTC如何应对复杂的网络环境?

声网Agora.io实时通信技术对标Google WebRTC,陶思明表示,WebRTC是谷歌Google的一个开源项目,旨在使浏览器能为实时通信(RTC)提供简单的JavaScript接口。简单来说就是让浏览器提供JavaScript实时通信接口,优势在于用户可以很方便的在浏览器上使用音视频服务,是实时通信技术发展最至关重要的技术之一。

但是,由于WebRTC本身是基于浏览器集成,在传输方面并没有太多的标准和建议,仅使用传统的P2P点对点协议,当用户出现复杂的跨地区跨时区跨国的传输时,WebRTC无法进行软件编码优化,这也就是为什么,开发者使用WebRTC实现Demo很容易,可是在实际过程中却碰到很多问题。同时,由于WebRTC无法使用硬件编码,因此受制于移动终端设备的cpu性能限制,在商用过程中往往难以实现。10月28-29日的实时互联网大会上,来自挪威的专门检测WebRTC通话链接质量的服务商Callstats.io将发布一份专门监测WebRTC质量统计的报告,系统介绍WebRTC呼叫的质量和问题。据透露,按照这份报告所显示出的数据,WebRTC通话质量存在很多的问题。

而声网Agora.io一直在解决根本上的传输问题,在全球构建了SD-RTN实时传输网,用户无需考虑网络的复杂性和传输的路径,只要使用声网Agora.io SDK和API,就可以达到高质量高稳定的传输;在编解码Codec方面,声网Agora.io针对一对一、一对多通信,设定了专门私有化Codec;最后,声网Agora.io针对市面上5000多种机型进行了兼容和适配,使用户享有稳定的音视频服务。

对于实时通信技术在多元化应用中面临的挑战,陶思明表示,复杂的网络环境是实时通信技术面临的最大挑战。当网络不稳定、带宽不足、丢包、抖动较大的时候,如何为用户提供稳定的实时服务是声网Agora.io一直在努力做的事情。

声网Agora.io希望利用公共互联网创建新的通信服务,让人们可以像面对面一样,随时随地开展高质量实时交流,希望声网Agora.io提供的实时技术能够为更多的垂直行业和细分领域所利用,改变、造福于这些行业。目前,声网Agora.io的技术广泛应用于互联网产业的各个行业,小米,陌陌,百度云,途牛等都是采用声网Agora.io的音视频技术解决方案。

实时通信技术的典型应用

图片描述

谈及应用声网Agora.io实时通信技术典型案例,陶思明分别在远程医疗、远程教育、及社交直播等行业举例介绍。

远程医疗行业。远程医疗最核心的技术问题就是利用实时通信技术连接医生、病人、药房、病房等相关环节,特别是解决落后和偏远地区优质医疗资源的平衡分配。比如在国内,实时通信技术主要帮助解决两个问题:一是改变资源的流动问题,能够把优质医疗资源带到广大的农村和落后地区,二是跨国的远程医疗问诊。全球实时云服务商声网Agora.io助力阿里健康,将国内一二线城市的优质医疗资源输送到广大的农村偏远和落后地区,尤其是在远程问诊和远程导药的应用中贡献巨大;美国最大的心理咨询平台TalkSpace选择了兼具稳定性、高质量、高可用性的声网Agora.io的音视频传输技术。

远程教育行业。声网Agora.io已经在帮助沪江、好未来等大型在线教育平台,实现超低延时的交互式学习方式,极大加强线上教学的参与感与实时互动。通过实时语音与视频通话,白板教学,屏幕共享,师生能够进行一对一直播互动教学或一对多、多对多虚拟教室教学,既提高了教学效果和效率,又降低了成本。

社交直播行业。声网Agora.io为陌陌、小米、脸萌等提供多人互动直播的服务,提升用户的粘性和社交活跃度,近期即将上线的大型群组直播,也能推动社交平台流量聚合。

采访后记:刚需带动实时通信行业腾飞

图片描述

随着实时通信技术在各行各业应用的深入,用户对实时音视频通信的依赖越来越强,从起初的企业级音视频会议到如今非常火爆的直播行业,并且在教育、医疗、游戏、社交、旅游、电商及前沿科技AR/VR行业和IoT行业均有涉猎,可见实时通信对于各个垂直行业、细分领域有着广泛影响,必然引领实时通信行业的腾飞。

作为行业的引领者,声网Agora.io不仅推动了行业在技术和服务上的发展,还不遗余力地帮助行业进行认知传播。

除了行业意见领袖的分享,本届实时互联网大会声网Agora.io还邀请了技术大咖来分享并教授开发者,在Coding Workshop里由WebRTC标准作者和声网Agora.io的技术大牛亲授coding技巧,还可以通过VR、AR产品展示、团队Demo Show、培训认证等。据悉,由于开发者热情爆棚,Coding Workshop几百张门票已经售罄,主办方不得不提前关闭报名通道。此外,售价为188元的大会门票(不含Coding workshop)限免即将结束。机不可失,报名猛戳大会官网

大会将云集行业内众多技术大咖加盟,包括声网Agora.io创始人赵斌、来自IETF和W3C的专家,有”WebRTC之父之称”的WebRTC技术标准作者Daniel Burnett、SIP标准作者Alan Johnston、美国实时行业大会发起者Phil Edholm、来自欧洲的WebRTC科学家和实时行业数据分析家Varun Singh,以及来自9大行业的国内外互联网公司如阿里、Intel、Hike、陌陌、乐视、沪江、好未来、去哪儿、春雨国际、壹药网等在内100多位行业领袖共同探讨实时通信行业的前沿科技发展,展望以声网Agora.io为代表的创新型实时通信市场的未来,见证实时通信对于行业应用和商业模式所带来的变革和发展。