增长率超330%,美英成重灾区!一文了解Deepfake 2020发展现状
作者 | 贝爽
Deepfake的兴起,让视频和音频不再是记录历史的可靠证据!
近日一则电影片段在YouTube爆火,影片中两位主演分别是好莱坞两位顶级流量巨星西尔维斯特·史泰龙(Sylvester Stallone)和阿诺·施瓦辛格(Arnold Schwarzenegger)
然而,短片爆火的原因不是两位巨星,而是它逼真的视频合成效果。
事实上,这部名为《Step Brothers》的电影主演是两位小众演员,短片创作者利用Deepfake将面部替换成了两位巨型。
短片中,人脸自然、毫无痕迹的融合效果,让不少网友们惊叹:太恐怖。
但事实上,更让人恐怖的是短片背后,Deepfake愈演愈烈的负面应用。自2017年,某Reddit用户首次将其用来伪造色情视频开始,Deepfake造假已逐渐渗透到政治、媒体等多个领域,甚至还威胁到了今年的美国总统大选。
与此同时,伪造品的数量也在逐年增长,特别是在2020年再次创下历史新高,达到49081个。
那么,快速增长的Deepfake有哪些特点,背后有哪些应对措施?
1
Deepfake泛滥成灾,增长率超330%
近些年,计算机视觉技术得到飞速发展。
尤其是2014年生成式对抗网络GAN的提出,让图像和视频合成不断取得惊人的效果。
2017年,这项技术被不良分子用来伪造了一段色情视频,由此该技术被人们称为“Deepfake”,后来Deepfake的负面应用不断发酵,并逐渐覆盖到更广泛的图像、视频,乃至音频领域。
具体来说,Deepfake主要是对人脸进行篡改和重新编辑,包括表情修改,换脸、换口型、合成新人脸四种模式。其中,换脸和对口型是Deepfake最主要的应用模式,其破坏性和杀伤力也最强。如篡改政客公开演讲以及伪造色情视频。
值得注意的是,造假者无需了解这些修改模式背后的技术原理,诸多开源软件,已经可以让他们轻松地制造虚假内容。比如DeepFaceLab之类的工具,任何人都可以拍摄一张图片或视频,并替换或操纵人脸。
技术的普及和便捷性,让造假品数量成指数级增长。根据安全分析公司Sensity最新结果显示,
自2018年12月以来,Deepfake在线造假品的数量大约每六个月翻一番。
2019年7月Deepfake的总数达到14,678,相比于2018年12月的7964部造假视频增加了近100%。而截至今年6月,造假视频已多达49081个,比2019年7月增长了330%以上。
2
色情视频占比最高,美英成重灾区
2019年,在14678个公开发布的Deepfakes作品中,假色情视频占据了96%。
另外,根据Sensity调查分析显示,Deepfake用来制作色情作品的目标对象超过95%全部来自影视娱乐业,只有剩下的一小部分来自商业、新闻媒体以及政治领域。
而今年,影视娱乐仍然是覆盖最广的行业,占据了62.7%,加上时尚类别(21.7%)和运动类别(4.4%),总计占所有目标的88.9%。
其中,在娱乐行业62.7%的占比中,来自Instagram,Twitch以及Youtube等社交媒体的目标对象数量显著增加。同时,来自商业(4.1%)和政治(4%)背景的目标对象也有所增加。
值得注意的是,上述4%政治背景的目标对象,主要集中在一些知名政客身上,如特朗普、奥巴马等。信息时代,利用这些政客身份伪造虚假政治言论,可能会造成灾难性成果。
尤其是随着技术的提升,伪造品越来越难以用肉眼分辨。去年,一名马来西亚政治家就因涉嫌从事同性恋活动的视频而被判入狱(在马来西亚同性恋是非法的),但后来证实该视频是Deepfake伪造的。
另外,比利时政治团体也曾利用Deepfake伪造了一段特朗普关于巴黎气候协定的演讲视频,在当时产生了不小的轰动。
不过,总体来看,大部分有关政客的虚假作品还多以讽刺为目的。
另外,这些虚假作品有明显的地区分别特点。从Sensity的统计结果来看,政客伪造品主要集中在西方国家,尤其是美国和英国。同时,韩国和印度在今年也成为了主要目标。
图中,美国和英国在整体中占据了61%,超过了一半。韩国(9.6%),印度(5.0)和日本(4.0)也构成了很大一部分。总体来看,说明亚洲的政治造假活动在持续增长。
3
反Deepfake技术有哪些?
Deepfake的危害无需再多说。
为了应对日益泛滥的伪造品,学、政界和各大企业也在联合发力,研发反Deepfake技术。
值得一提的是,Kaggle和Facebook已经举办了多场Deepfake探测器研发竞赛,并收集了大量用于训练的数据集。
Deepfake检测器,主要通过对大量图像和视频进行训练,并从中查找不同的Deepfake标识符来鉴别内容真伪。目前最先进的监测手段,分为以下几种:
人脸X射线( Face X-ray)检测:它是一种将假脸重新混入目标图像或视频,以从中寻找边界的方法。经过FaceForensics 数据集上测试,精准度可达99%以上。
背景差异检测:该方法通过将人脸区域与背景区域进行对比,从中寻找微小差异以辨别真假。
情绪识别网络(Emotion Recognition Network):该方法通过检测面部情绪是否与场景上下文或音频内容相匹配,来确定视频是真是伪。
生物学信号:通过检测视频目标的心跳并分析该信号的残差确定真假,该方法的准确率已达到97.29%,同时还可以检测背后所用的Deepfake模型。
以上大多数这些Deepfake检测方法都没有可用的开源代码,不过,目前也有一些商业上可用的API,例如Sensity,Deepware,以及微软的 Video Authenticator。
此外,要说明的是,虽然人脸X射线检测法精度已经达到99%,但它仅限于FaceForensics数据集,对于“Wild”数据集可能并不适用,很多其他检测工具也是如此。
一位研究人员证实说,他上述某款模型用于《Step Brothers》和川普伪造视频检测,结果并不能证伪。尽管川普的伪造视频有明显的缺陷(嘴边周围有合成痕迹)
因此,在特定Deepfake检测数据集上表现良好的模型,在现实世界中也不一定达到理想效果。
但庆幸的是,高质量的Deepfake造假品仍需要人工干预来完善输出,这会极大地减慢传播速度,并为改进Deepfake检测模型提供时间。