0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于毒性样本敏感性的有效后门防御!

CVer 来源:CVer 作者:CVer 2022-12-05 14:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

香港中文大学(深圳)和清华大学联合完成的后门防御工作被NeurIPS 2022接收为Spotlight论文。基于投毒的后门攻击对由不可信来源数据所训练的模型构成了严重威胁。给定一个后门模型,我们观察到,相较于干净样本,毒性样本的特征表示对数据变换更加敏感。这启发我们设计了一个简单的敏感性度量——“针对数据变换的特征一致性(FCT)”,并基于FCT设计了一个样本区分模块,用以区分不可信训练集中的毒性样本和干净样本。此外,基于上述模块,我们提出了两种有效的后门防御方法,分别适用于不同的防御场景。第一种方法用于从头训练出一个安全模型(in-training defense),涉及一个两阶段的安全训练模块。第二种方法用于移除后门模型中的后门(post-training defense),包含一个交替遗忘毒性样本和重新学习干净样本的后门移除模块。在3个基准数据集和8种后门攻击上的实验结果表明了我们方法相较于SOTA防御方法的优越性能。

648efe2c-745b-11ed-8abf-dac502259ad0.png

论文标题: Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples

收录会议: NeurIPS 2022 (Spotlight)

论文链接: https://openreview.net/pdf?id=AsH-Tx2U0Ug

代码链接: https://github.com/SCLBD/Effective_backdoor_defense

1 问题背景

训练深度神经网络(DNNs)往往需要大量的训练数据,这些数据有时可能由不可信的第三方来源所提供。这些不可信的数据可能会对模型的训练带来严重的安全威胁。典型的威胁之一就是基于投毒的后门攻击,它可以通过投毒一小部分训练样本(即:给这部分样本的图像加上指定的触发器,并把它们的标签改为某个目标类别),来向模型中注入后门(即:在训练过程中,模型能够学到触发器和目标类别之间的映射)。一般地,一个后门模型可以很好地预测干净样本,并且能将任何带有触发器的毒性样本预测为目标类别。为了解决上述威胁,本文提出2个有效的后门防御方法,即使使用不可信来源的数据训练,我们仍能得到安全、干净的模型。

2 方法介绍

方法的总体框架如图所示:

64a9860c-745b-11ed-8abf-dac502259ad0.png

2.1 样本区分模块

我们观察到,在后门模型的特征空间中,带有触发器的毒性样本总是会汇聚到一起,如下图的红色实心点所示。这表示,即使毒性样本包含着不同的物体,这些物体所代表的信息都被后门模型所忽略了。换句话说,毒性样本的特征表示由触发器所主导,而不是物体。因此,我们猜测:这样的主导作用来源于后门模型对触发器的过拟合,这是因为在不同的毒性样本中,触发器比物体具备更少多样性。

为了验证这一猜测,我们尝试对干净和毒性样本分别进行相同的数据变换,如旋转。我们观察到,毒性样本的特征表示不再汇聚到一起,而是移动到各自的ground-truth类别中,如下图的红+所示。这表示,触发器的主导作用消失了,我们也证实了上述的猜测。此外,我们发现,虽然干净样本的特征表示也受到数据变换的影响,但是相较于毒性样本,这些影响小得多。这些观察给了我们启发:我们可以利用特征表示对数据变换的敏感性来区分干净和毒性样本。

64dab9ca-745b-11ed-8abf-dac502259ad0.png

接下来,我们设计了一个度量——针对图像变换的特征一致性(FCT),来描述这种敏感性。

如下图所示,我们发现,依据这个度量,干净与毒性样本的分布具有显著差异。其中,左图/右图对应被BadNets attack/Blend attack攻击后的数据集。

6506518e-745b-11ed-8abf-dac502259ad0.png

因此,基于FCT,我们可以建立一个样本区分模块(Sample-distinguishment module)。基本规则是选取FCT最大的一部分作为毒性样本,FCT最小的一部分作为干净样本。

2.2 安全训练模块

结合样本区分模块,我们设计了一个两阶段的安全训练模块two-stage secure training (ST) module,这2个模块共同组成防御方法D-ST,它适用于in-training defense的防御场景,即:给定一个毒性数据集,此方法可以从头训练出一个安全的(准确率高且不包含后门)的模型,且在整个训练过程中模型都不会被注入后门。

2.2.1 阶段一:用半监督对比学习(SS-CTL)来学习特征提取器

现有防御方法DBD使用对比学习(CTL)来学习特征提取器,在这一过程中,干净样本的标签所包含的有价值信息会流失。另一方面,研究表明,相较于CTL,有监督对比学习(S-CTL)可以学到表现更好的特征提取器。因此,考虑到样本区分模块可以鉴别干净样本,我们提出半监督对比学习(SS-CTL)来学习一个不包含后门的安全的特征提取器。SS-CTL的损失函数如下:

对于每个毒性样本和不确定样本,SS-CTL将促使它的2个数据增强版本靠近;对于每个干净样本,SS-CTL将促使所有同类干净样本的数据增强版本靠近。

2.2.1 阶段二:用混合交叉熵损失来学习分类器

给定训练好的安全特征提取器,我们设计了一个混合交叉熵函数来学习分类器,表示如下:

它能够从干净样本学习到正确映射的同时,防止后门注入分类器。

2.3 后门移除模块

结合样本区分模块,我们设计了一个后门移除模块backdoor removal (BR) module,这2个模块共同组成防御方法D-BR,它适用于post-training defense的防御场景,即给定一个毒性数据集,我们先使用标准监督训练得到一个准确率高且包含后门的模型,再利用此方法移除模型中的后门,从而得到一个安全的(准确率高且不包含后门)模型。特别地,后门移除模块本质上是一个交替学习算法,包含了2个交替的步骤,分别是遗忘与重新学习。

2.3.1 遗忘

这一步旨在通过遗忘从毒性样本中学到的知识来移除后门,损失函数如下:

2.3.3 重新学习

这一步旨在通过从干净样本中重新学习知识来维持模型的识别准确率,损失函数如下:

3 实验结果

3.1 D-ST的有效性

我们选取适用于安全训练防御范式的方法DBD来作为baseline。此外,我们设计2个baseline方法。Baseline1和baseline2分别用CTL和S-CTL来训练特征提取器,且都用标准交叉熵来训练分类器。表1表示我们的方法D-ST不仅能够得到较高的ACC,还能将平均ASR抑制为1.21%(在CIFAR-10数据集上,在CIFAR-100上则是0.05%)。

6537f450-745b-11ed-8abf-dac502259ad0.png

3.2 D-BR的有效性

我们选取5个适用于后门移除防御范式的SOTA方法来作为baselines。表2表示我们的方法D-BR不仅能够维持高ACC,还能将平均ASR由97.29%减小至0.31%(在CIFAR-10数据集上,在CIFAR-100上则是由99.77%减小至0.07%)。

65674160-745b-11ed-8abf-dac502259ad0.png

3.3 其它实验

除了上述的主体实验以外,我们做了大量的实验来说明:(1)单个SD模块的有效性,(2)单个BR模块的有效性,(3)单个ST模块的有效性,(4)在不同数据变换类型下方法的表现,(5)在不同干净/毒性样本选择比例下方法的表现,(6)在不同投毒比例下方法的表现,(7)在不同模型结构及特征维度下方法的表现。更多的结果与分析请见原论文。

4 总结

在本文中,我们揭示了毒性样本对数据变换的敏感性,并提出了一个敏感性度量(FCT)。此外,我们提出了样本区分模块(SD module),安全训练模块(ST module)和后门移除模块(BR module)3个模块,它们构成了2种适用于不同防御范式的后门防御方法(D-ST, D-BR)。大量的实验分别证明了每个模块与整体方法的有效性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2822

    浏览量

    52811
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106819
  • 数据集
    +关注

    关注

    4

    文章

    1231

    浏览量

    26050

原文标题:NeurIPS 2022 | 一种基于毒性样本敏感性的有效后门防御!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【新品速递】面向时间敏感网络的模块化测试利器——TSN CoreSolution 4.0

    在汽车电子、工业自动化和航空航天等对时间敏感性要求较高的领域,传统的网络测试工具已难以应对挑战,尤其是TSN(时间敏感网络)技术的应用,万兆车载以太网的需求对测试工具提出了更高
    的头像 发表于 12-10 10:03 158次阅读
    【新品速递】面向时间<b class='flag-5'>敏感</b>网络的模块化测试利器——TSN CoreSolution 4.0

    如何保障电能质量在线监测装置数据管理的安全要点的有效性?

      保障电能质量在线监测装置数据管理安全要点的有效性,需从 “制度落地、技术强化、人员管控、持续验证、应急兜底、动态优化” 六个维度构建闭环体系,结合电力行业数据特性(如实时性、敏感性、分布式部署
    的头像 发表于 09-25 17:50 561次阅读

    传感器的敏感元件为啥不能维修?

    1.技术敏感性与易损性精密性高:传感器(如光学、MEMS、压力传感器等)属于高精度元件,运输或拆卸过程中容易因震动、静电、湿度等外界因素导致性能下降或损坏。校准失效:许多传感器出厂前经过专业校准
    的头像 发表于 08-06 12:04 657次阅读
    传感器的<b class='flag-5'>敏感</b>元件为啥不能维修?

    传感器的敏感元件为哈不能维修?

    1.技术敏感性与易损性精密性高:传感器(如光学、MEMS、压力传感器等)属于高精度元件,运输或拆卸过程中容易因震动、静电、湿度等外界因素导致性能下降或损坏。校准失效:许多传感器出厂前经过专业校准
    的头像 发表于 08-04 12:02 1007次阅读
    传感器的<b class='flag-5'>敏感</b>元件为哈不能维修?

    国安部:境外产芯片或故意留“后门

    影响着国家安全。需要警惕的是,些别有用心的设计或恶意植入的技术后门,可能成为失泄密的导火索。 看不见的“电子间谍”和“定时炸弹” 技术后门通常指绕过正常的安全检查机制,获取对程序或系统访问权的方法。技术
    的头像 发表于 07-21 11:47 7449次阅读

    一种适用于动态环境的实时RGB-D SLAM系统

    近期用于视觉SLAM的3D高斯泼溅(3DGS)技术在跟踪和高保真建图方面取得了显著进展。然而,其顺序优化框架以及对动态物体的敏感性限制了其在现实场景中的实时性能和鲁棒性。为此,我们提出
    的头像 发表于 07-04 15:14 993次阅读
    <b class='flag-5'>一种</b>适用于动态环境的实时RGB-D SLAM系统

    磁敏二极管概述资料

    磁敏二极管是一种依靠半导体材料的磁电效应(像霍尔效应、磁阻效应等)来实现磁电转换的器件,其显著特点是对磁场具有较高的敏感性,能够将磁场强度的变化转化为电流或电压的变化。它在磁场检测、位移测量、电流传感等众多领域都有着广泛的应用。
    发表于 07-02 16:23 0次下载

    一种实现开关柜局放监测的有效技术架构

    开关柜局放在线监测系统是针对开关柜局放监测的一种技术工具,也是保障电力系统安全稳定运行的关键设备,系统通过传感器捕捉开关柜内部因局部放电产生的物理信号(如特高频电磁波、超声波、暂态地电压),数据采集
    的头像 发表于 06-19 13:35 347次阅读
    <b class='flag-5'>一种</b>实现开关柜局放监测的<b class='flag-5'>有效</b>技术架构

    感应电机磁链观测器的参数敏感性研究

    (MRAS)转速估算对参数的敏感性。 纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:两感应电机磁链观测器的参数敏感性研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题
    发表于 06-09 16:16

    VirtualLab Fusion应用:氧化硅膜层的可变角椭圆偏振光谱(VASE)分析

    摘要 可变角度椭圆偏振光谱仪(VASE)是一种常用的技术,由于其对光学参数的微小变化具有高灵敏度,而被用在许多使用薄膜结构的应用中,如半导体、光学涂层、数据存储、平板制造等。在本用例中,我们演示了
    发表于 06-05 08:46

    IGBT器件的防静电注意事项

    IGBT作为功率半导体器件,对静电极为敏感。我将从其静电敏感性原理入手,详细阐述使用过程中防静电的具体注意事项与防护措施,确保其安全稳定运行。
    的头像 发表于 05-15 14:55 1233次阅读

    TPS40422 带 PMBus 的双输出或多相同步降压控制器数据手册

    TPS40422 是一种双输出 PMBus 协议、同步降压控制器。它也可以配置为单相两相输出。 宽输入范围支持 5V 和 12V 中间总线。精确的参考电压满足了现代 ASIC 对精密电压的需求,并可能降低输出电容。电压模式控制降低了噪声敏感性,并确保了低占空比转换。
    的头像 发表于 03-27 14:00 529次阅读
    TPS40422 带 PMBus 的双输出或多相同步降压控制器数据手册

    《电子技术基础》(模电+数电)教材配套课件PPT

    ,半导体般呈晶体结构。 二、半导体的特性半导体的导电特性:1.掺杂性:在半导体中掺入微量杂质,可改变其电阻率和导电类型(可做成各种不同用途的半导体器件,如二极管和三极管等)。 2.温度敏感性:半导体
    发表于 03-25 16:21

    VirtualLab Fusion应用:氧化硅膜层的可变角椭圆偏振光谱(VASE)分析

    摘要 可变角度椭圆偏振光谱仪(VASE)是一种常用的技术,由于其对光学参数的微小变化具有高灵敏度,而被用在许多使用薄膜结构的应用中,如半导体、光学涂层、数据存储、平板制造等。在本用例中,我们演示了
    发表于 02-05 09:35

    为电机体化应用提供一种大电流单通道集成电机驱动芯片

    电机驱动芯片 - SS6952T为电机体化应用提供一种大电流单通道集成电机驱动方案。SS6952T有路H桥驱动,可提供较大峰值电流7A,可驱动个刷式直流电机,或者螺线管或者其它
    的头像 发表于 12-18 09:34 890次阅读
    为电机<b class='flag-5'>一</b>体化应用提供<b class='flag-5'>一种</b>大电流单通道集成电机驱动芯片