谷歌 AI 开源 Deepfake 检测数据集,用于开发deepfake检测工具

Deepfake能够凭借人工智能进行人类图像合成的技术。采用一种号称生成化对抗性网络的机器学习技术,将现有的图像和视频合并并叠加到源图像或视频上。

生成的视频可能非常逼真。该技术过去曾被用于制作虚假的名人色情和报复视频。 Deepfake还用于创建虚假新闻报道。

数据集包含了来自 28 个不同场景下,由真人演员现场拍摄的 3000 多段视频。谷歌希望能够通过这些视频数据,更好的维护整个社会的网络安全环境,并使得开发者能够利用这些数据,开发新的 Deepfake 检测工具,更高效地识别 Deepfake 假视频。

谷歌现在开始与 Jigsaw 合作,并发布了一个自制的大型可视化数据集,该数据集已被纳入 Face Forensics 视频基准测试。该数据集已合并到新的FaceForensics基准测试中,该基准测试由慕尼黑工业大学和那不勒斯菲里德里克第二大学运营。研究人员可以免费访问这些视频,以用于开发Deepfake检测技术。

在示例中,上面的视频显示真正的演员,而下面的视频则是一个人工创建的Deepfake

谷歌认真考虑了这些问题。正如他们去年在《人工智能原则》中发表的那样,我们致力于开发 AI 的最佳实践,以减少技术的滥用所带来的潜在危害。

为了制作这个数据集,在过去的一年里,谷歌与众多演员合作录制了数百段视频;并使用公开的 deepfake 生成方法,从这些视频中创建了数千个 Deepfake 假视频。