智东西4月20日消息,AI换脸已不是新鲜事,手机应用市场中有多款换脸app,此前也曾曝出有网络IP用明星的面孔伪造色情影片、在大选期间用竞选者的脸制作虚假影像信息等。
为了规避Deepfake滥用带来的恶性后果,许多研究者尝试用AI技术开发鉴定分类器。
然而,谷歌公司和加州大学伯克利分校的研究人员最近的研究显示,现在的鉴定技术水平还不足以100%甄别出AI换脸作品。另一项由加州大学圣地亚哥分校主导的研究也得出了相同结论。
这些研究结果为我们敲响了警钟,要警惕AI换脸制作的虚假信息。
目前谷歌和加州大学伯克利分校的研究已经发表在学术网站arXiv上,论文标题为《用白盒、黑盒攻击绕过Deepfake图像鉴别工具(Evading Deepfake-Image Detectors with White- and Black-Box Attacks)》
一、实验准备:训练3种分类器,设置对照组
实现AI换脸的技术被称为Deepfake,原理是基于生成对抗网络(generative adversarial networks,GAN)合成虚假图片。GAN由一个生成网络和一个判别网络组成。
GAN模型的学习过程就是生成网络和判别网络的相互博弈的过程:生成网络随机合成一张图片,让判别网络判断这张图片的真假,继而根据判别网络给出的反馈不断提高“造假”能力,最终做到以假乱真。
研究人员共对3个分类器做了测试,其中两个为第三方分类器,一个为研究人员训练出的用于对照的分类器。
选用的第三方分类器分别采用两种不同训练方式。
第一个分类器模型基于深度残差网络ResNet-50(Deep residual network)。
用到的ResNet-50预先经过大型视觉数据库ImageNet训练,接下来再被训练用于辨别真假图像。采用包含720000个训练图像、4000个验证图像的训练集,其中一半为真实图像,另一半是用ProGAN生成的合成图像。合成图像采用空间模糊和JEPG压缩方法增强。
经过训练后,这个分类器能准确识别出ProGAN生成的图像,而且还能分类其他未被发现的图像。
第二个鉴定分类器采用的是基于相似性学习(similar learning-based)的方法。经过训练后这款分类器可以准确辨认出由不同生成器合成的图像。
研究团队还自己搭建了一个鉴定分类器模型,作为前述两个鉴定分类器的对照示例。这个分类器采用100万个ProGAN生成的图像进行训练,其中真假图像各占一半。论文中指出,这个分类器的训练管道比前述两种简单很多,因此错误率也更高。
研究人员根据分类器是否开放了访问权限,选用了不同的攻击方式。对开发访问权限的分类器采用白盒攻击;对不开放访问权限的分类器采用黑盒攻击。
另外,研究人员用接收者操作特征曲线(ROC曲线)评估分类器的正确率。评估标准是曲线下面积(AUC)的大小。AUC的取值范围为0~1,一般来说AUC>0.5即代表分类器有预测价值,AUC值越大代表分类器准确率越高。
二、4种白盒攻击方法,AUC最低被降至0.085
对于开放了访问权限的分类器,研究人员用白盒攻击评估其稳健性。
白盒攻击即攻击者能够获知分类器所使用的算法以及算法使用的参数。在产生对抗性攻击数据的过程中,攻击者能够与分类器系统产生交互。
攻击过程中用到的所有图像都来自一个包含94036张图像的视觉数据库。
开始白盒攻击之前,基于这个数据库的分类器的AUC数值为0.97。即使在执行典型的清洗策略隐藏图像合成痕迹后,分类器的AUC数值仍保持在0.94以上。
接下来研究人员使用了4种白盒攻击方法。这4种攻击在之前的对抗性示例中已有过研究。攻击的具体方式是对图像进行修改,使分类器误认为它们是真实的。
▲四种攻击前后,分类器的ROC曲线图。蓝色实线代表JPEG格式的合成图像,蓝色虚线代表PNG格式的合成图像
第一种是失真最小化攻击(Distortion-minimizing Attack),即对合成图像添加一个较小的加法扰动δ。假设一个合成图像x先被分类器判定为假,施加扰动后,(x+δ)就会被判定为真。
结果显示,像素翻转2%,就会有71.3%的假图像被误判为真;像素翻转4%,会有89.7%的假图像被误判为真;像素翻转4~11%,所有的假图像都会被误判为真。
▲a:分类器把假图像识别为真;b:分类器把真图像识别为假。把像素翻转1%,就会有一半的假图像被判定为真;把像素翻转7%,就会有一半的真图像被判定为假。
第二种是损失最大化攻击(Loss-Maximizing Attack),即定义一个更简单的目标函数,更大限度地提升合成图像被判定为真的概率。
结果显示把未压缩图像的像素翻转40%,AUC值就会从0.966降到0.27。
第三种是通用对抗性补丁攻击(Universal Adversarial-Patch Attack)。失真最小化攻击方法有有一个局限性:攻击者需要花费0.1秒为每个图像定制攻击方式。为了弥补这一局限性,研究人员创建了一个单一的可视噪声模板补丁。这个补丁可以叠加在任何假图像上,有效增加了假图像的迷惑性。
叠加补丁后,分类器的AUC值从0.966降到0.085。
不同于之前三种方法通过对假图像施加扰动来影响分类结果,第四种攻击方法是通用潜空间攻击(Universal Latent-Space Attack),即对图像的潜在空间进行攻击。最终把分类器的AUC值从0.99降到0.17。
▲a为通用对抗性补丁攻击效果,b~d为通用潜空间攻击效果。图中所有假图像都被分类器误判为真
三、限制条件进行黑盒攻击,AUC值降至0.22以下
论文指出,现实中的社交网站、约会网站等,并不会公开其鉴定分类器的算法,因此很难进行前面所说的白盒攻击。
面对这种情况,研究人员进行了黑盒攻击。黑盒攻击假设对方知道攻击的存在,并且掌握了一般的防御策略。
研究结果显示,即使在这种限制性较强的黑盒攻击条件下,鉴定分类器也很容易受到对抗性因素影响。经过黑盒攻击,分类器的AUC数值下降到0.22以下。
结语:现有分类器有局限性,仍需深入研究
谷歌公司和加州大学伯克利分校研究团队证明,只要对虚假图片适当加以处理,就能使其“骗”过分类器。
这种现象令人担忧,论文中写道:“部署这样的分类器会比不部署还糟糕,不仅虚假图像本身显得十分真实,分类器的误判还会赋予它额外的可信度”。
因此,研究人员建议开创新的检测方法,研究出可以识别经过再压缩、调整大小、降低分辨率等扰动手段处理的假图像。
据悉,目前有许多机构正在从事这一工作,如脸书、亚马逊网络服务及其他机构联合发起了“Deepfake鉴别挑战”,期待能探索出更好的解决方案。
关键词: AI换脸
- 降准仍有一定空间,房地产市场回归常态
- 陈吉宁:鼓励多元主体参与街区更新和商圈升级
- 5G基础设施建设高效推进,北京已累计建成5G基站4521个
- 新房促销加大分流 北京二手房怎么走
- 议价空间仍在 北京二手房要反弹?
- 市场量价齐跌 租金指数环比下跌1.3%
- 越南队将帅齐表态:大年初一主场战胜中国队为球迷献
- 格雷格·哈迪vs谢尔盖·斯皮瓦克转移到UFC 272举行
- 马卡罗内:国米赛季目标是赢意甲和意杯 利物浦并非
- 现役球员中谁让你想起了自己?麦迪:乔治和杜兰特
- 队记:休赛期绿军管理层曾提出激进举措 史蒂文斯选
- 佩服!场均轰25+10+7,赛季已斩获4次三双,他身高
- 国产汤普森!第2阶段三分92中45领跑全联盟!杜锋该
- 同意吗?老詹无法拿到MVP,皮尔斯给出预测:湖人战
- 33秒20,博尔特接班人复出首秀创300米pb,他才是当
- 险象环生!交易威少+解雇主教练沃格尔,湖人距离崩
- 吹早了!直通赛4-2樊振东的大黑马惨遭一轮游,球迷
- 阿尔特塔:比赛延期的规则一开始就应明确,我们会捍
- 三分帅!原帅9记三分创赛季新高 生涯第4次单场至少
- 小红书,凭什么成为吸引运动员的新赛道?
- 天津7年不胜北京纪录被打破,北京名宿怒批雅尼斯:
- 官方:中央陆军先租后买签下里尔中场亚兹齐,米兰曾
- 时隔8天!郭艾伦发文道歉,高诗岩用表情包回应,球
- 安帅:库尔图瓦明天不会出场;贝尔将随队出征
- 拉波尔塔出席亨托葬礼:从他身上我领悟到了皇马巴萨
- 真拼了!米切尔被撞成脑震荡,沃格尔有苦衷,湖人不
- 助力北京冬奥会 中国冰雪大篷车开入赣州古街
- 马丁内斯:梅西是我最好的队友,他激励我成为更好的
- CBA又一小姚明陨落!6战5场0分
- 4中0单场1分!CBA最差大外援是他?
- 西甲一周资讯|皇马西超杯夺冠;费兰-托雷斯巴萨首
- 2022年卡塔尔世界杯球票开始预售,最低票价约70元人
- 【封面独家】教授诗人向以鲜为“诗圣”作传 44万字
- 北京冬奥会的雪为什么是人造的?
- 《年年有戏》打造“戏曲大观园” 朱迅李思思王冰冰
- 马刺为什么要放走这名冠军射手?
- 每体:阿劳霍希望涨薪续约,未来几周对于达成协议非
- 3-1!林高远拒爆冷,国乒球星进8强+怒吼庆祝,刘国
- 记住失败,也忘记失败
- 3-1迎来开门红!单局轰11-4,林高远表现强势,晋级
- 阿尔维斯:希望梅西在巴萨退役!哪怕梅西38岁我也会
- 2022格莱美音乐奖颁奖典礼推迟至四月 将首次在拉斯
- 战国对襟袍服是啥样的?来成博欣赏华夏服饰之美
- 拼命三年270万,躺赢六年1.24亿,他就是球迷最酸的
- 专家:掘金交易后的薪资低于税线150万美元 绿军高
- 美国CNN关注威姆斯遭辽蜜种族歧视:被骂滚出中国
- 解除停赛请求被驳回 韩短道速滑冠军无缘北京冬奥会
- 封面独家|“广告大师”叶茂中生前遗作曝光 曾想用
- 下午3点!国足29人名单呼之欲出,郑智新身份确认,
- 顾长卫《刺猬》首曝预告 葛优王俊凯演忘年交结成最
- 国文物局局长会议以电视电话会形式在京召开
- 改善攻击力!皇马送1亿先生赴巴黎,决心购当世两大
- 字母哥,又一座DPOY?
- 忘恩负义!欧文爆粗回应骑士球迷,后者:没勒布朗你
- 3笔交易失败!湖人完了,芭比Q了
- 科尔:库明加会多打小球阵容的中锋 库里在场上安排
- 自主滑雪机器人助力“科技冬奥” 实现自主快速稳
- 文字里的庭院只剩路牌,老房要有生命的“留”
- 契合书斋趣味者,皆可作为“花器”
- 建设全球顶尖学术机构,文化设施要跟上
- 京剧大家口传心授,出人出戏相辅相成
- 自得其乐的“表情”漫笔,与为人熟知的历史大画一脉
- 上音校园将拆除围墙 助力上海文化品牌建设
- 用心用情讲好红色故事,原创领域不断涌现“中国红”
- 网络苦“水军”久矣 治理“水军”要打到“七寸”
- 深入挖掘辽宁长城文化内涵成基础
- 考古学国家急需高层次人才培养专项”启动 加强人
- 明确规定保护管理人制度 全时段全领域保护
- 北京市新闻出版局公布2021年北京市实体书店扶持项目
- 皇马队史最差引援!西媒统计阿扎尔本赛季的西甲数据
- 退役了!帕森斯坑了三支球队,9年的NBA生涯他赚到多
- 孙兴慜:富安健洋和南野拓实都十分出色,同来自亚洲
- 北青:国足明日对抗赛后圈定25+4人名单 郑智身份
- 王蔷张帅领衔出战 五名中国女将均晋级澳网次轮
- 总台20余位主持人梦幻跨界 《年年有戏》打造沉浸式
- 新青年·上封面丨从影视到舞台 演员沈佳妮:挑战自
- 舍得酒业发布2021年年度业绩预增公告 净利润同比
- 中青宝公司披露《关于公司全资子公司股权收购暨关联
- 全渠道布局,“伟哥”白热化竞争市场
- 酒鬼酒发布业绩预告 实现盈利87300万元-94300万元
- 味知香年夜饭礼盒销售火热 半成品菜新鲜吗?
- 沪媒:41岁郑智拍了球员定妆照,可能为国足出场
- 找找状态!沃克复出13中6得到19分 末节命中3记三分
- 非遗产业从事者惠施祥的“希望投递站”|口述民俗·
- 英媒:小贝旗下的迈阿密国际有意引进苏亚雷斯
- 准三双!兰德尔15投6中&罚球11中9得到21分9板9助2断4帽
- 湖人主帅沃格尔遭受质疑,惨败爵士后险被解雇,现在
- 微软发布声明:现金收购动视暴雪
- 降准仍有一定空间,房地产市场回归常态
- 小制作的新可能 国产剧迎新“开端”
- 英国自动驾驶技术初创公司Wayve宣布完成一轮2亿美元
- 一起教育科技发布2021年第三季度财报 净收入同比
- 外媒:LG显示主要供应苹果的iPhone和iPad
- 苹果新处理器M2、M1 Quadra曝光 20核CPU+64核GPU
- 11/12代酷睿无法播放4K蓝光 不再支持SGX指令集
- 从抽签分组预测冠军!马龙进死亡之组,陈梦女单夺冠
- 英超:布伦特福德遭遇2连败状态低迷,曼联队内不和
- 第二阶段后最有可能下课的5位主帅:阿的江在列,徐
- 莫雷诺太狠了!连续6场被弃用,武磊太苦了,队友创
- 此前网友让豪斯让出4号 后者近日回击:睡前在下半
- 凯塔世界波,几内亚1-2不敌津巴布韦小组第二出线
- 沙特媒体:亚冠冠军利雅得新月有意签下莫德斯特
- 北京2022年冬奥会和冬残奥会记者培训及誓师仪式举行
- 【转会】AC米兰看中热刺中后卫遭尤文图斯抢劫,买个
- 西班牙人平之不武?对手2球被吹+漏判点球,新帅暴
- 澳网正赛第二日,张帅王欣瑜闯过首轮