0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用AI对抗AI——基于视频人脸篡改的检测

Hf1h_BigDataDig 来源:YXQ 2019-07-16 10:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

还记得权力的游戏第八季么? Jon Snow也加入了千万骂编剧的粉丝的阵营,并且因此向粉丝道歉。

这个视频当然是假的,他嘴巴的移动方式看起来就很奇怪。

这是一个DeepFake生成的视频,一个用来娱乐或欺骗大众人工智能产物。

之前文摘菌也报道过,这项技术的上线后就广受诟病,后来又有一个小团队开发出一款新的应用DeepNude,可以一键实现脱衣,之后也因为反响恶劣而被迫下架。

人们对于无法分辨真假的恐惧是合理的,毕竟这种技术的出现将会滋生出许多想象不到的新的犯罪手段的诞生。

最近,南加州大学信息科学研究所计算机的研究人员发表一篇论文,研究通过训练AI寻找视频画面中的不一致性来检测AI生成的假视频,论文同时也被提交到CVPR 2019。

用AI对抗AI,来看看如何实现

对于伪造生成的假视频,研究人员发现,用于生成虚假视频的主流AI模型(以及其他方法,如2016年的Face2Face程序),都是通过逐帧修改视频且并不注意时间的连贯性。这会使得生成视频中的人物移动看起来非常笨拙,人们通常会注意到这类奇怪的动作。

为了实现找出奇怪动作这一过程的自动化,研究人员首先要训练一个神经网络—这种人工智能程序以个人的海量视频为基础,可以用来“学习”人类在说话时如何移动的重要特征。

然后,研究人员使用这些参数将伪造视频的堆叠帧输入AI模型,以检测视频随时间的不一致性。根据该论文,这种方法可以判断“AI伪造视频”,准确率超过90%。

研究人员使用的模型是一个递归卷积模型(Recurrent convolutional model),这个深度学习模型能够很好的提取到视频中的信息。

整个过程分为两步:

将视频中的人脸进行裁剪对齐

对于获取人脸区域,研究人员使用由FaceForensics++提供的模型。

论文链接:

https://arxiv.org/abs/1901.08971

研究人员尝试了两种人脸对齐技术的结合:

显式使用面部坐标对齐,在参考坐标系中,人的面部是先天决定的,所有的面孔是使用同一个参考坐标系;

隐式排列对齐,使用STN。

在后一种情况下,网络根据输入图像预测对齐参数,因此可能学会缩放人脸的特定部分,必要时可将训练集中的预期损失最小化。

在这两种情况下,核心思想都是我们希望循环卷积模型将人脸“tubelet”作为输入,这是一个跨越视频帧的时空紧密对齐的人脸序列。

所有篡改类型的检测精度。结果表明,采用线性和双向递归网络的DenseNet性能最好

基于视频人脸篡改的检测

对于人脸篡改的检测,我们使用一个类似于用于视觉识别的Long-term循环卷积网络。

论文链接:

https://arxiv.org/abs/1411.4389

其中输入是来自查询视频的帧序列,这个模型背后是在利用跨帧的时间差异。由于篡改是在逐帧的基础上进行的,研究人员认为图像中会存在时间差异。因此,由对人脸的篡改引起的低层次的差别则有可能表现为跨帧不一致特性的时间差异。

骨干网络(Backbone encoding network)

在实验中,研究人员探索了ResNet和DenseNet两种架构作为模型的CNN分量。

无论采用何种架构,首先对主干网络进行FF++训练分割,使交叉熵损失最小化,进行二值分类,形成特征,从合成人脸中识别真实人脸。然后用RNN对Backbone进行扩展,最后在多种策略下形成端到端训练。

RNN的训练策略

研究人员使用放置在骨干网络不同位置的多个循环模型进行实验:用它将骨干网络连接在一起,用来进行特征学习,将特征传递给随时间推移聚合输入的RNN。

在这里研究人员也尝试了两种策略:一是在骨干网的最终特性基础上,简单地使用单一的递归网络;二是尝试在骨干网结构的不同层次上训练多个递归神经网络。

所有篡改类型的ROC曲线。每一行对应一个不同的篡改类型。左列为线性图,右列为线性对数图

希望能从源头阻止deepfake假视频

研究的共同作者Wael AbdAlmageed表示,这种模式可以被社交网站和视频网站用于大规模识别deepfake假视频,因为它不需要通过“学习”特定个体的关键特征来进行识别,而是通用的。

“我们的模型对于任何人来说都是通用的,因为我们不关注某个人的身份,而是关注面部运动的一致性,”AbdAlmageed说,“我们将发布自己的模型,所以社交网络无需训练新的模型。网站只需要在其平台中加上该检测软件,以检查上传到平台的视频是否为deepfake生成的假视频。”

机器学习的出现让造假的成本逐渐变低,很多玩火不嫌事大的开发者还开发出许多不需要写代码直接可以造假的小软件,尽管他们不一定是出于恶意,但是不排除软件最后被用到“作恶”的地方。

虽然还有许多方法可以反“AI造假”(例如在拍摄图片时生成"噪声水印"),但利用AI来识别AI造假,并且将这项技术加载到视频网站的审查过程中,那么从源头大规模地阻止假视频流向公众,或许可以成为现实。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296685
  • DeepFake
    +关注

    关注

    0

    文章

    15

    浏览量

    7015

原文标题:解铃还须系铃人!南加大训练AI检测Deepfake“假视频”,准确率超90%

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【CPKCOR-RA8D1】关于AI人脸检测移植遇到的一些问题

    + CPKEXP-EKRA8X1 扩展板(OV7725 摄像头、4.5\" MIPI-DSI 屏)。 移植详情【CPKCOR-RA8D1】AI人脸检测 - 瑞萨单片机论坛 - 电子技术论坛 - 广受欢迎的专业
    发表于 10-31 13:39

    【CPKCOR-RA8D1】AI人脸检测

    在瑞萨 RA8D1 开发板上集成 AI 人脸检测功能 1. 项目概述 该项目是根据官方AI人脸检测
    发表于 10-29 17:59

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 机器来生成假说: 1、直接生成 生成式
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    想到,除了研究大脑的抽象数学模型外,能否抛弃传统的芯片实现方式,以化学物质和生物组件、材料及相关现象来构建人工神经网络或提取其功能来用于AI处理,甚至直接生物体来实现AI功能,这就是从AI
    发表于 09-06 19:12

    RK3576助力智慧安防:8路高清采集与AI识别

    框架实现高质量采集与拼接。 • AI视频识别与行为分析:内置AI推理引擎(支持RKNN),可实现人脸识别、车牌识别、行为分析等功能。 • 多种显示与推流方式:支持HDMI、DP、MIP
    发表于 08-22 17:41

    【Milk-V Duo S 开发板免费体验】人脸检测

    多张人脸识别 针对画面中存在多张人脸的情况进行测试 识别效果较好,速度较快。 同时终端输出检测到的人脸数量 动态效果见底部视频。 总
    发表于 07-27 16:53

    AI视频分析和算法集合

    AI
    jf_02235694
    发布于 :2025年07月23日 16:10:12

    【Milk-V Duo S 开发板免费体验】人脸检测测试(视频)

    运行/mnt/system/usr/bin/ai/sample_vi_fd /mnt/cvimodel/scrfd_768_432_int8_1x.cvimodel 检测人脸时打印 视频
    发表于 07-11 22:33

    【BPI-CanMV-K230D-Zero开发板体验】视频会议场景下的 AI 应用(电子云台 EPTZ、人像居中 / 追踪、画中画)

      近几年由于各种原因,很多的会议都转到了线上,各种视频会议软件用户也都呈几何倍数增长。   视频会议场景下,对于音视频处理都有一定要求,AI 时代下,人们已经不仅仅满足于听的到,看的
    发表于 07-09 20:56

    【BPI-CanMV-K230D-Zero开发板体验】AI 算法模型(人脸检测、躯干检测、车牌识别)

    K230D 支持多种 AI 应用,并且内置于 CanMV 镜像中,分为单模型应用和多模型应用两种,内容涵盖物体、人脸、人手、人体、车牌、OCR、音频(KWS、TTS)等多个应用领域。 这里选择几种
    发表于 07-05 00:52

    【BPI-CanMV-K230D-Zero开发板体验】03 摄像头调用+AI人脸检测

    aidemo.face_det_post_process() 将模型输出结果转换为人脸检测框。 内部实现解码 Anchor;根据置信度筛选;执行 NMS 去重。 2.5 nncase_runtime 支持 AI2D 格式、推理
    发表于 07-01 22:43

    【BPI-CanMV-K230D-Zero开发板体验】人脸检测、手势识别、车牌识别

    API . 人脸检测 人脸检测应用对视频中每一个人脸检测
    发表于 06-30 20:44

    《DNESP32S3使用指南-IDF版_V1.6》第五十八章 人脸检测实验

    监控和跟踪。人脸检测技术通过使用算法自动搜索图像/视频帧中的人脸,判断是否存在人脸,并返回人脸
    发表于 03-24 09:34

    《DNESP32S3使用指南-IDF版_V1.6》第五十七章 乐鑫AI库简介

    第五十七章 乐鑫AI库简介 乐鑫的ESP-WHO库是一个基于乐鑫芯片的图像处理开发平台,其中包括了实际应用中可能出现的开发示例,如人脸检测人脸识别、猫脸
    发表于 03-21 09:47

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应。通常基于深度
    发表于 03-05 19:52