0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于毒性样本敏感性的有效后门防御!

CVer 来源:CVer 作者:CVer 2022-12-05 14:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

香港中文大学(深圳)和清华大学联合完成的后门防御工作被NeurIPS 2022接收为Spotlight论文。基于投毒的后门攻击对由不可信来源数据所训练的模型构成了严重威胁。给定一个后门模型,我们观察到,相较于干净样本,毒性样本的特征表示对数据变换更加敏感。这启发我们设计了一个简单的敏感性度量——“针对数据变换的特征一致性(FCT)”,并基于FCT设计了一个样本区分模块,用以区分不可信训练集中的毒性样本和干净样本。此外,基于上述模块,我们提出了两种有效的后门防御方法,分别适用于不同的防御场景。第一种方法用于从头训练出一个安全模型(in-training defense),涉及一个两阶段的安全训练模块。第二种方法用于移除后门模型中的后门(post-training defense),包含一个交替遗忘毒性样本和重新学习干净样本的后门移除模块。在3个基准数据集和8种后门攻击上的实验结果表明了我们方法相较于SOTA防御方法的优越性能。

648efe2c-745b-11ed-8abf-dac502259ad0.png

论文标题: Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples

收录会议: NeurIPS 2022 (Spotlight)

论文链接: https://openreview.net/pdf?id=AsH-Tx2U0Ug

代码链接: https://github.com/SCLBD/Effective_backdoor_defense

1 问题背景

训练深度神经网络(DNNs)往往需要大量的训练数据,这些数据有时可能由不可信的第三方来源所提供。这些不可信的数据可能会对模型的训练带来严重的安全威胁。典型的威胁之一就是基于投毒的后门攻击,它可以通过投毒一小部分训练样本(即:给这部分样本的图像加上指定的触发器,并把它们的标签改为某个目标类别),来向模型中注入后门(即:在训练过程中,模型能够学到触发器和目标类别之间的映射)。一般地,一个后门模型可以很好地预测干净样本,并且能将任何带有触发器的毒性样本预测为目标类别。为了解决上述威胁,本文提出2个有效的后门防御方法,即使使用不可信来源的数据训练,我们仍能得到安全、干净的模型。

2 方法介绍

方法的总体框架如图所示:

64a9860c-745b-11ed-8abf-dac502259ad0.png

2.1 样本区分模块

我们观察到,在后门模型的特征空间中,带有触发器的毒性样本总是会汇聚到一起,如下图的红色实心点所示。这表示,即使毒性样本包含着不同的物体,这些物体所代表的信息都被后门模型所忽略了。换句话说,毒性样本的特征表示由触发器所主导,而不是物体。因此,我们猜测:这样的主导作用来源于后门模型对触发器的过拟合,这是因为在不同的毒性样本中,触发器比物体具备更少多样性。

为了验证这一猜测,我们尝试对干净和毒性样本分别进行相同的数据变换,如旋转。我们观察到,毒性样本的特征表示不再汇聚到一起,而是移动到各自的ground-truth类别中,如下图的红+所示。这表示,触发器的主导作用消失了,我们也证实了上述的猜测。此外,我们发现,虽然干净样本的特征表示也受到数据变换的影响,但是相较于毒性样本,这些影响小得多。这些观察给了我们启发:我们可以利用特征表示对数据变换的敏感性来区分干净和毒性样本。

64dab9ca-745b-11ed-8abf-dac502259ad0.png

接下来,我们设计了一个度量——针对图像变换的特征一致性(FCT),来描述这种敏感性。

如下图所示,我们发现,依据这个度量,干净与毒性样本的分布具有显著差异。其中,左图/右图对应被BadNets attack/Blend attack攻击后的数据集。

6506518e-745b-11ed-8abf-dac502259ad0.png

因此,基于FCT,我们可以建立一个样本区分模块(Sample-distinguishment module)。基本规则是选取FCT最大的一部分作为毒性样本,FCT最小的一部分作为干净样本。

2.2 安全训练模块

结合样本区分模块,我们设计了一个两阶段的安全训练模块two-stage secure training (ST) module,这2个模块共同组成防御方法D-ST,它适用于in-training defense的防御场景,即:给定一个毒性数据集,此方法可以从头训练出一个安全的(准确率高且不包含后门)的模型,且在整个训练过程中模型都不会被注入后门。

2.2.1 阶段一:用半监督对比学习(SS-CTL)来学习特征提取器

现有防御方法DBD使用对比学习(CTL)来学习特征提取器,在这一过程中,干净样本的标签所包含的有价值信息会流失。另一方面,研究表明,相较于CTL,有监督对比学习(S-CTL)可以学到表现更好的特征提取器。因此,考虑到样本区分模块可以鉴别干净样本,我们提出半监督对比学习(SS-CTL)来学习一个不包含后门的安全的特征提取器。SS-CTL的损失函数如下:

对于每个毒性样本和不确定样本,SS-CTL将促使它的2个数据增强版本靠近;对于每个干净样本,SS-CTL将促使所有同类干净样本的数据增强版本靠近。

2.2.1 阶段二:用混合交叉熵损失来学习分类器

给定训练好的安全特征提取器,我们设计了一个混合交叉熵函数来学习分类器,表示如下:

它能够从干净样本学习到正确映射的同时,防止后门注入分类器。

2.3 后门移除模块

结合样本区分模块,我们设计了一个后门移除模块backdoor removal (BR) module,这2个模块共同组成防御方法D-BR,它适用于post-training defense的防御场景,即给定一个毒性数据集,我们先使用标准监督训练得到一个准确率高且包含后门的模型,再利用此方法移除模型中的后门,从而得到一个安全的(准确率高且不包含后门)模型。特别地,后门移除模块本质上是一个交替学习算法,包含了2个交替的步骤,分别是遗忘与重新学习。

2.3.1 遗忘

这一步旨在通过遗忘从毒性样本中学到的知识来移除后门,损失函数如下:

2.3.3 重新学习

这一步旨在通过从干净样本中重新学习知识来维持模型的识别准确率,损失函数如下:

3 实验结果

3.1 D-ST的有效性

我们选取适用于安全训练防御范式的方法DBD来作为baseline。此外,我们设计2个baseline方法。Baseline1和baseline2分别用CTL和S-CTL来训练特征提取器,且都用标准交叉熵来训练分类器。表1表示我们的方法D-ST不仅能够得到较高的ACC,还能将平均ASR抑制为1.21%(在CIFAR-10数据集上,在CIFAR-100上则是0.05%)。

6537f450-745b-11ed-8abf-dac502259ad0.png

3.2 D-BR的有效性

我们选取5个适用于后门移除防御范式的SOTA方法来作为baselines。表2表示我们的方法D-BR不仅能够维持高ACC,还能将平均ASR由97.29%减小至0.31%(在CIFAR-10数据集上,在CIFAR-100上则是由99.77%减小至0.07%)。

65674160-745b-11ed-8abf-dac502259ad0.png

3.3 其它实验

除了上述的主体实验以外,我们做了大量的实验来说明:(1)单个SD模块的有效性,(2)单个BR模块的有效性,(3)单个ST模块的有效性,(4)在不同数据变换类型下方法的表现,(5)在不同干净/毒性样本选择比例下方法的表现,(6)在不同投毒比例下方法的表现,(7)在不同模型结构及特征维度下方法的表现。更多的结果与分析请见原论文。

4 总结

在本文中,我们揭示了毒性样本对数据变换的敏感性,并提出了一个敏感性度量(FCT)。此外,我们提出了样本区分模块(SD module),安全训练模块(ST module)和后门移除模块(BR module)3个模块,它们构成了2种适用于不同防御范式的后门防御方法(D-ST, D-BR)。大量的实验分别证明了每个模块与整体方法的有效性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2849

    浏览量

    53439
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108178
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261

原文标题:NeurIPS 2022 | 一种基于毒性样本敏感性的有效后门防御!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [VirtualLab] SiO2膜层的可变角椭圆偏振光谱(VASE)分析

    摘要 可变角度椭圆偏振光谱仪(VASE)是一种常用的技术,由于其对光学参数的微小变化具有高灵敏度,而被用在许多使用薄膜结构的应用中,如半导体、光学涂层、数据存储、平板制造等。在本用例中,我们演示了
    发表于 04-09 08:10

    雷迪埃D-LIGHT 有源光收发器:建立高速点对点链路

    随着数据速率的提升和传输距离的增加,铜互连面临着根本性限制,包括信号衰减、串扰、重量增加以及对电磁干扰(EMI)的敏感性。光纤链路通过支持更长距离的高带宽传输,同时显著降低线缆重量并消除电磁干扰隐患,有效应对了上述挑战。
    的头像 发表于 03-23 16:50 983次阅读
    雷迪埃D-LIGHT 有源光收发器:建立高速点对点链路

    光纤弯曲不敏感技术:创新与应用

    随着光纤通信技术的不断发展,对光纤传输性能的要求也越来越高。然而,光纤的弯曲敏感性直是制约其应用的个难题。为了解决这个问题,科学家们研发出了光纤弯曲不敏感技术。本文将介绍这
    的头像 发表于 03-19 10:19 314次阅读

    经颅超声脉冲刺激(TPS)适合干预哪些适应症?

    HUIYINGTPS机理、优势、适应症概述经颅脉冲超声刺激(TranscranialPulseStimulation,TPS)是一种利用超短超声脉冲(3μs)进行非侵入性脑刺激的创新技术,其作用机制
    的头像 发表于 02-28 18:18 239次阅读
    经颅超声脉冲刺激(TPS)适合干预哪些适应症?

    航空与航天应用中抗辐照MCU的SEE阈值差异及防护策略对比分析

    单粒子效应是制约航空与航天电子系统可靠性的关键因素,不同应用环境下抗辐照微控制器的单粒子效应敏感性存在显著差异。
    的头像 发表于 02-14 21:11 1.4w次阅读
    航空与航天应用中抗辐照MCU的SEE阈值差异及防护策略对比分析

    红外感知地球的温度与能量

    红外遥感利用近红外波段监测植被、水分和土壤,具有高反射率、敏感性及大气透过性,广泛应用于农业和环境监测。
    的头像 发表于 01-08 10:20 364次阅读
    红外感知地球的温度与能量

    【新品速递】面向时间敏感网络的模块化测试利器——TSN CoreSolution 4.0

    在汽车电子、工业自动化和航空航天等对时间敏感性要求较高的领域,传统的网络测试工具已难以应对挑战,尤其是TSN(时间敏感网络)技术的应用,万兆车载以太网的需求对测试工具提出了更高
    的头像 发表于 12-10 10:03 754次阅读
    【新品速递】面向时间<b class='flag-5'>敏感</b>网络的模块化测试利器——TSN CoreSolution 4.0

    如何保障电能质量在线监测装置数据管理的安全要点的有效性?

      保障电能质量在线监测装置数据管理安全要点的有效性,需从 “制度落地、技术强化、人员管控、持续验证、应急兜底、动态优化” 六个维度构建闭环体系,结合电力行业数据特性(如实时性、敏感性、分布式部署
    的头像 发表于 09-25 17:50 936次阅读

    传感器的敏感元件为啥不能维修?

    1.技术敏感性与易损性精密性高:传感器(如光学、MEMS、压力传感器等)属于高精度元件,运输或拆卸过程中容易因震动、静电、湿度等外界因素导致性能下降或损坏。校准失效:许多传感器出厂前经过专业校准
    的头像 发表于 08-06 12:04 965次阅读
    传感器的<b class='flag-5'>敏感</b>元件为啥不能维修?

    传感器的敏感元件为哈不能维修?

    1.技术敏感性与易损性精密性高:传感器(如光学、MEMS、压力传感器等)属于高精度元件,运输或拆卸过程中容易因震动、静电、湿度等外界因素导致性能下降或损坏。校准失效:许多传感器出厂前经过专业校准
    的头像 发表于 08-04 12:02 1381次阅读
    传感器的<b class='flag-5'>敏感</b>元件为哈不能维修?

    国安部:境外产芯片或故意留“后门

    影响着国家安全。需要警惕的是,些别有用心的设计或恶意植入的技术后门,可能成为失泄密的导火索。 看不见的“电子间谍”和“定时炸弹” 技术后门通常指绕过正常的安全检查机制,获取对程序或系统访问权的方法。技术
    的头像 发表于 07-21 11:47 1w次阅读

    一种适用于动态环境的实时RGB-D SLAM系统

    近期用于视觉SLAM的3D高斯泼溅(3DGS)技术在跟踪和高保真建图方面取得了显著进展。然而,其顺序优化框架以及对动态物体的敏感性限制了其在现实场景中的实时性能和鲁棒性。为此,我们提出
    的头像 发表于 07-04 15:14 1459次阅读
    <b class='flag-5'>一种</b>适用于动态环境的实时RGB-D SLAM系统

    感应电机磁链观测器的参数敏感性研究

    (MRAS)转速估算对参数的敏感性。 纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:两感应电机磁链观测器的参数敏感性研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题
    发表于 06-09 16:16

    VirtualLab Fusion应用:氧化硅膜层的可变角椭圆偏振光谱(VASE)分析

    摘要 可变角度椭圆偏振光谱仪(VASE)是一种常用的技术,由于其对光学参数的微小变化具有高灵敏度,而被用在许多使用薄膜结构的应用中,如半导体、光学涂层、数据存储、平板制造等。在本用例中,我们演示了
    发表于 06-05 08:46

    IGBT器件的防静电注意事项

    IGBT作为功率半导体器件,对静电极为敏感。我将从其静电敏感性原理入手,详细阐述使用过程中防静电的具体注意事项与防护措施,确保其安全稳定运行。
    的头像 发表于 05-15 14:55 2168次阅读