“深度合成”迎商业化元年,在社交、艺术、医疗等多个领域落地应用

“深度合成”(deep synthesis)在2017年11月首次走进大众视野,在过去两年多的争议中,该技术逐渐趋于成熟,并在2020年迎来了商业化应用元年。短短两年从无到有,深度合成相关应用究竟是昙花一现还是会对行业产生巨大影响,一直备受外界关注。

与此同时,该技术也催生了一系列问题,面临着“威胁论”、“恐慌论”以及色情性深度合成视频等问题。面对这些安全问题业内将如何应对?从法律和伦理的角度如何实现有效治理?如何确保安全与创新的平衡,才能在防范风险的同时不阻碍技术正向、有益的应用?

6月22日,围绕深度合成技术应用与治理,腾讯优图实验室、腾讯研究院和腾讯科协联合主办了线上研讨会。邀请清华大学新闻与传播学院常务副院长陈昌凤,中国人民大学未来法治研究院执行院长张吉豫,科技部新一代人工智能发展研究中心副主任徐峰,艾瑞咨询泛娱乐研究主任郭成杰,腾讯优图实验室专家研究员、总监李季檩,腾讯研究院秘书长张钦坤,腾讯研究院高级研究员曹建峰等人工智能领域的专家、学者以及行业大咖在线进行了深度探讨。

image.png

“深度合成”技术日趋成熟,在多个领域实现落地应用

人脸合成、语音合成、视频生成和数字虚拟人等概念近两年非常火爆,而这背后依靠的便是 “深度合成”技术。“深度合成是一种AI合成内容的技术,依赖于人工智能技术,是人工智能发展到一定阶段的产物。我们认为深度合成类的AI技术应用之所以能够近两年兴起,很大程度上得益于生成对抗网络算法的出现,这种算法可以用于生产高度逼真的合成的数据。”在研讨会上,张钦坤对该技术的发展进行了阐述。

在李季檩看来,目前“深度合成”已经具备了以下几个优势:第一,合成工具的进化,以往需要大量高级工具的复杂操作,现在只需一键式的端到端合成即可。第二,合成的效果越来越难分辨真假。第三,可实现此前无法做到的合成,比如将头脑中的想象落实到实际操作上,将真实人物与游戏角色等虚拟人物相结合等。

在行业应用方面,郭成杰认为,目前深度合成重点还是在脸部,未来可能会从单纯的脸部发展到全身、动作深度的合成。此外,视觉、语音的深度合成,与语音的交互技术未来也会有比较深度的结合。

“深度合成已经从传统的Deepfake发展到了更多元化的应用,无论是社交、艺术、医疗、科研等都会有深度合成技术的应用场景。”张钦坤称。

深度合成目前主要有三大应用领域:第一,娱乐和数字内容。比如游戏体验方面,腾讯旗下网络游戏“和平精英”,就引入了深度合成应用,玩家可化身游戏中的“和平精英”与火箭少女101同框合影,背后所依托的正是腾讯优图实验室的人像融合技术。这一技术还能用于H5等活动营销传播、游戏影视制作、以及各类相机App等。第二,数字人领域,比如虚拟主播、虚拟歌手、虚拟助手等。第三,对于教育、医疗健康等社会性问题,“深度合成”技术可以发挥出“科技向善”的力量。

“深度合成”迎商业化应用元年,法律监管问题不容小觑

随着社会对深度合成技术及相关应用的认识逐渐趋于理性,腾讯研究院和腾讯优图实验室此前发布的报告《AI生成内容发展报告2020——“深度合成”商业化元年》提出,2020年有望成为深度合成技术走向大规模商业化应用的元年。

目前,大众对深度合成应用接触更多的是换脸App。“未来对于换脸App,我们也期待它跟更多的落地化的商业应用做一些结合,能够去产生一些更有持续性的发展。”郭成杰称,虚拟人在商业化方面也有非常大的延展性,未来在教育、旅游,包括公共场所的咨询,我们需要一些比较多的重复性的人力接待、播报或者讲解的地方,都可以用虚拟人做一些应用。“未来随着深度合成技术的进一步发展,我们在整个行业里面去结合现有的商业模式和服务模式,尤其像服务体验这方面可能都会帮助大家有所提升。”

新技术带来变革的同时也会带来一定的风险和挑战,Deepfake这个概念之所以刚开始名噪一时,也是因为很多人通过深度合成的技术伪造了很多虚假的、真假难辩的图片、音视频等来进行一些非法活动。因此,深度合成技术的治理问题也成为业界关注的焦点。

从技术方面,张钦坤分享了国外对“深度合成”技术进行包容审慎监管的五点措施:一是不得误导公众,需要披露人工智能的身份;二是划定红线,某些领域是深度合成技术不能应用的;三是内容制作者要承担披露的义务;四是呼吁技术公司能够研发检测识别深度合成内容的反制技术;五是要求深度合成的开发者必须要遵守隐私和个人信息保护的相关要求。他同时指出,需要依靠法律、技术、行业自律、公众教育等多层次治理体系,来促进技术的妥善应用和良性发展。

据悉,腾讯优图实验室自2013年做刷脸技术研发起,便开始通过活体检测技术以保证人脸安全。经过多年的努力,腾讯优图实验室在人脸安全领域已完成三方面布局:一是对真人和特定介质载体展现出来的人脸进行区分;二是既做内容的生成也做内容的防御;三是对于新出现的对抗噪音问题,比如脸上戴了一个特定的眼镜片就将某人识别成其他人,腾讯优图已经在深度模型底层的机制上去研究对抗的方法,防止一些安全风险的出现。

目前,在内部的一些评测中,如果已知是哪种深度合成的方法,优图检测模型的检测率已经可以达到99%。同时,在Facebook举办的Deepfake Detection Challenge (DFDC)比赛当中,腾讯优图在2000多支队伍中进入前十,并拿到金牌。

在法律方面,张吉豫认为深度合成作为一种新的技术、新的应用、新的业态,对于它的监管,整体需要遵循包容审慎监管的原则。“审慎有两方面的含义:第一,技术刚出来的时候,需要给一个观察期;第二,要严守安全底线,对一些谋财害命、侵权行为不管是传统业态还是新业态都要采取严厉的措施予以打击。”

从社会治理角度,陈昌凤认为可以通过网络治理,所谓多利益相关方联合治理的这个模式来入手,多利益相关方的治理一定是包括平台的治理,平台要用技术来治理,所以平台的技术治理也是一个重要的方面。

面对新技术的挑战,政府和监管者应当包容审慎,避免阻碍深度合成技术的有益的、创新性的应用,通过法律、技术、行业、用户的多重治理将其纳入可控的发展轨道。

正如徐峰所言,对于人工智能的治理,首先要在尊重和更好认识人工智能自身发展规律基础上有一个系统的考虑,既需要像新一代人工智能治理原则这样的框架性和理念性的指南,也需要针对具体技术、具体应用、具体领域针对性的治理措施。在发展技术的同时,也要加强相关潜在风险的研判,做好政策储备和应对策略,防患于未然。