火山引擎 技术开年:视频云与AI的两翼齐飞

科技的不断进步,已经渗透到我们生活的方方面面,比如今年春节期间的诸项热门的活动和节目背后,都离不开科技力量的身影。

春节期间,⼈⺠⽇报新媒体推出了”我是冰雪⾼⼿”AI互动小程序,让⼤众在春节假期及冬奥会期间实现成为冰雪⾼⼿的梦想。这⼀AI互动体验由⽕⼭引擎AI提供技术⽀持,公众只需上传⼀张正⾯照⽚,即可选择⽣成花样滑冰、单板滑雪、双板滑雪及冰壶运动的视频,效果逼真⾃然。

2022年⼤年初⼀,中央电视台 CCTV-17 频道在⻩⾦时段播出特别节⽬《年画画年》,其中的⼀⾸背景⾳乐就是火山引擎AI Lab 智能语⾳团队使⽤ AI 技术制作的,并开创了AI与艺术作品结合的新玩法。

而近期热门的抖音自制节目《冠军驾到》和《濛主来了》热播,同样吸引了一大批的观众观看和互动,正是火山引擎视频云团队依托覆盖广泛的RTC网络,打造低延时、高可用的实时音视频服务,提供了超低延迟的直播体验。     

这些热门活动和热播节目背后,都有同样一个名字:火山引擎。虎年伊始,火山引擎用技术开年,成为了我们新年娱乐和生活幕后的“技术支撑”。

包括视频行业在内的各行各业的蓬勃发展,都离不开强有力的技术底座,火山引擎凭借AI技术和视频云技术的双轮驱动,为我们创造了最佳的体验。火山引擎的技术开年,对行业的发展有何积极的意义?

视频云已构建起强大的“技术矩阵”

2018年2月15日,春节。     

一款名叫”抖音”的短视频应用,迅速占领了中国互联网用户的手机。第三方数据显示,仅在2018年春节期间,抖音就增长了近3000万日活,一举将整个短视频行业推到了行业前沿,进而带动了视频行业的全面崛起。

互联网是人的视觉、听觉和触觉能力的综合延伸,所以互动性是互联网的第一性原理。短视频之所以能够定义整个视频行业的发展,正是因为短视频具备了更强的互动性,也就是社交属性。

同时随着5G和F5G技术推动了高带宽时代的到来,带宽门槛逐渐被打破,也意味着视频内容会更加多元化,UGC/PGC等内容制作模式更加繁荣,视频应用将真正具备”身临其境”的能力,视频应用都将得到真正的沉浸式体验。

这与火山引擎的初衷不谋而合,从整体定位上,火山引擎视频云的目标就是打造”面向体验的视频云”。将重点放在播放体验、互动体验、画质体验、性能体验四大方向,赋能视频业务全链路增长。     

而短视频的发展也依然避不开诸多技术难题,例如编解码技术、视频合成压缩技术、转码技术、CDN分发等等。从整个视频产业的挑战来看,仍面临着很多技术挑战。网络直播卡顿率、端到端延时、首屏延时等关键技术指标制约了用户体验的提高。     

而围绕这些体验关键词,火山引擎已经构建了足够强大的“技术矩阵”。例如,在播放体验方面,可以将首帧时间压缩到100ms以下,用户感觉不到首帧存在;在画质体验方面,BVC编码器荣获MSU2020赛事17项评分冠军,绝对值得信赖;在性能体验方面,最典型的H.265编解码技术,针对业务场景提供SDK参数配置、码率配置的最佳实践,极大提高265的播放占比等等。在互动体验方面,整合CV+内容推荐+CDN的整体解决方案,集成火山引擎美颜、特效、滤镜应用的最佳实践,赋能视频全链路,让主播视频生产更简单,让用户互动更实时。     

据了解,火山引擎CDN已覆盖全球主要运营商线路边缘网络节点,依托边缘云原生操作系统,在网络边缘无缝实现云原生内容分发、算力分发和安全防护的产品深度融合,提供了广覆盖、低延迟、高质量的内容分发网络服务,助力电商、游戏、娱乐视频等企业客戶业务走向全球化。以春节红包活动为例,向客戶提供千万级QPS用戶请求内容分发、SSL算力卸载和网络安全防护一体化解决方案

如在今年的京东迎虎年央视春晚红包活动中,火山引擎就为其提供了技术支持,帮助京东完成了“邀请全民分15亿红包和好物”这样大规模的网络互动活动。

很明显,作为快速发展的技术底座,视频云技术的发展决定了视频产业发展的“深度”,而以火山引擎为代表的新生代视频云技术服务提供商凭借技术优势,正在挺进行业的主赛道。

火山引擎AI 激发无限创意,提升业务增长     火山引擎的技术,脱胎于抖音的技术实践,所以AI技术和算法能力都颇具功底。技术开年,AI技术也是其中非常重要的一环。今年春节,⼈⺠⽇报新媒体推出的冰雪实景的“我是冰雪⾼⼿”活动,就是由⽕⼭引擎视觉AI技术支撑的。

 在“我是冰雪高手”AI互动小程序推出后,观看量已超过5000万次,热度冲至抖音热榜第三名,杨倩、何冲、郎朗等众多名人带领近百万民众参与。相比图片“换脸”,视频“换脸”需要考虑如何在移动状态下实现逼真效果,技术难度更高。

⽕⼭引擎提供的视觉AI技术源⾃字节跳动智创团队,经过⻓期研发攻坚构建了⼀套完善的视频⼈脸融合的解决⽅案- SwapGAN。该⽅案基于GAN的深度学习模型进⾏了创新性研发,在确保数据安全合规的前提下,可将用户上传的⼈脸照⽚⽆缝融合到⽬标视频素材中,融合效果逼真⾃然,⽆论是从效果上,还是性能上,都达到了业界领先⽔平。

显而易见,“我是冰雪高手”活动成功的背后,火山引擎的AI视觉技术,是毫无疑问的幕后英雄。视觉AI技术方案隶属于火山引擎AI开放平台。该平台在去年12月的火山引擎云产品发布会上首次发布,包含视觉、语音、语义3大领域,共计8大类产品,上百项领先行业的技术服务,平台上的各类服务可开箱即用,快速上线,提供领先、全面和效果可验证的基础服务。     

抖音的成功没有偶然因素,如AI技术一样,只有不断地在算法上打磨,不断创新,才有了今日之抖音的成功。而经过抖音验证过的AI核心能力,如今都已经通过火山引擎AI开放平台为企业开放了。      有数据显示,通过火山引擎的AI能力,可以将抖音生产一个特效的效率提升四倍,同时,带来人力成本、机器成本和数据投入的大幅节省。相信在火山引擎AI开放平台的赋能下,能够带动各行各业在AI领域的创新和快速发展。

如今的AI技术已逐渐成为各行各业数字化转型的“分水岭”。AI能力可以让企业的业务创新从“刀耕火种”走向“精耕细作”,无论是产品制作、内容分析、内容审核、体验优化都离不开AI技术作保证。

尽管AI技术带动了众多创新企业的智能化发展,但AI应用开发的整体周期很长,还需要算法与场景做更多的结合,存在相当普遍的“最后一公里”难题。      而火山引擎AI则专注于企业服务领域的音视频创作,提供音视频、直播、AR及特效等多种内容形态下的创作能力,包含AI底层引擎、AI场景产品和AI行业解决方案的多层次的产品方案,以及API、SDK、PaaS和SaaS等多形式的交付模式,可以将⾳视频智能创作灵活和⾼效地赋能到企业的内部⼯具或用户产品中,缩短其创新的路径。      例如,在火山引擎与央视《年画画年》节目的合作中,从接到背景音乐创作需求到最终交付,仅用时短短两天。火山引擎的AI作曲,不仅可以像人一样思考,也避开了版权纠纷的困扰,并创造了新的玩法。

AI的能力通常由算法演变而来,算法的成熟度代表了其可以向多场景和跨行业复制的可能性。可以预见火山引擎AI通过火山引擎AI开放平台可以将丰富经验和算法优势,也将会跨出视频行业,向传媒、创意甚至传统大行业进行复制。

换言之,火山引擎已经将AI技术沉淀为一种“能力组件”,这种能力组件,可以帮助创新企业和行业用户随需取用,这也让火山引擎AI成为了未来千行百业走向AI创新的技术底座,并可以持续为用户体验和业务增⻓注⼊创新势能。

技术开年,火山引擎做对了什么?

从行业延展的角度,视频云技术和AI技术都是未来行业智能化转型需要的关键技术。

例如,在2020年的新冠疫情期间,催生大量在线的业务场景,大量与视频云和AI技术相结合的行业应用被广泛推广,如智慧城市、在线教育、远程医疗等一大批应用的场景被打开,产业的智能化发展也间接推动了数字经济的活跃。

数字经济的发展,也有赖于一大批创新企业的成长。但并不是每一家创新企业都有抖音那样的技术能力,它们需要技术的支持和经验的传递,而火山引擎的视频云和AI的双轮驱动,恰恰可以成为这些企业的技术支撑。

这不仅是火山引擎成立的使命,也是其“技术开年”的根本意义所在。    首先,从云服务的维度,截至2021年12月初,火山引擎已正式发布全系云产品,推出云基础、视频及内容分发、数据中台、开发中台、人工智能五大类共计78项云服务。   

其次,火山引擎AI的表现也非常突出。如今,⽕⼭引擎AI正以“激发⽆限创意,提升业务增⻓”为⽬标,可以为创新企业提供⾳视频、直播、AR及特效等多种内容形态下的创作能⼒,包含AI底层引擎、AI场景产品和AI⾏业解决⽅案的多层次的产品⽅案等等。   

没有任何一个时代对科技的创新者给予现在这般褒扬,因为数字经济决定了中国的未来,而数字经济的成功必有核心技术支撑,火山引擎的视频云和AI技术双轮,证明了自身能够支撑创新,做到聚集行业的创新公司,赋能创作者。   技术开年的火山引擎,很明显已踏上了飞速增长的“飞轮”。