0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SAN基于卷积自动编码器进行受限优化:最大化某一分类器表现的同时最小化另一分类器表现

zhKF_jqr_AI 来源:未知 作者:李倩 2018-08-11 09:18 次阅读

编者按:UW-Madison统计学助理教授Sebastian Raschka简明扼要地概述了他的最新研究SAN(半对抗神经网络)。SAN基于卷积自动编码器进行受限优化:最大化某一分类器表现的同时最小化另一分类器表现。

简要总结手头的项目,和包括同事、学生在内的更一般的受众分享,我觉得这是一个不错的主意。因此,我给自己的挑战是用不到1000个单词完成总结,避免让具体细节和技术术语分散注意力。

本文主要讨论了我最近和iPRoBe实验室合作的研究项目,研发隐藏面部图像的特定信息的技术。本文谈论的是关于“保持可用性的同时最大化隐私”的研究(这一目标和差分隐私研究的目标有些类似)。

如果你对本文讨论的研究项目感兴趣,可以参考以下两篇论文获取更多信息:

Semi-Adversarial Networks: Convolutional Autoencoders for Imparting Privacy to Face Images(半对抗网络:赋予面部图像隐私的卷积自动编码器,ICB 2018,arXiv:1712.00321)

Gender Privacy: An Ensemble of Semi Adversarial Networks for Confounding Arbitrary Gender Classifiers(性别隐私:对抗任意性别分类器的半对抗网络集成,BTAS 2018,arXiv:1807.11936)

保持可用性的同时改善隐私

我们处理的研究问题可以看成一个更一般的受限优化问题:我们希望在保持计量生物学可用性的同时隐藏面部图像的特定信息。具体来说,我们有三个目标:

扰乱性别信息

确保面部图像看起来真实

保留计量生物学识别可用性

计量生物学识别包括两种子任务:在一对多匹配中识别未知人物的身份(A)和在一对一匹配中验证某人的身份(B):

这里,“扰乱”性别信息意思是给定的性别分类器不再能够可靠地预测某人的性别。我们可以设想很多为什么需要防止自动提取个人属性的理由。这里给出三个典型的例子:

基于性别的画像

窃取身份(通过结合众多可以公开获取的资源)

在用户不知情的情况下提取数据

无论何时,只要拍摄、上传、(在中央数据库中)储存面部图像,就可能引起上面提到的问题。作为反制措施,在销售给第三方前,系统(例如,超市监控摄像头)可以预配性别扰乱技术,使得最终用户更难侵犯用户的隐私,防止出于未经许可的目的收集数据。比如,隐藏面部图像数据库中的信息可能同时有助于确保GDPR合规。

半对抗网络的一般用途

当然,我们轻而易举就能隐藏性别数据,只需增加图像噪声或加扰到一定程度。然而,我们需要牢记的是显著改动图像可能同时让面部图像变得无用(计量生物学识别)。

尽管我在上一节中突出了研发SAN的主要动机(保持可用性的同时改善隐私),SAN背后的主要思路可以看成更一般的方法,受限优化任意损失函数。这意味着SAN可以用于任何我们希望在最大化某一分类器的表现的同时最小化另一分类器的表现的问题。因此,即使你处理的不是面部识别问题,SAN同样可能有助于解决你面临的受限优化任务。

下一节将描述我们在ICB 2018提交的论文中的SAN总体架构。

半对抗网络架构

根据我们在论文中提供的图像,SAN的架构可能看起来有点晦涩,不过,如果我们将它分成三个主要部分,就比较直截了当:

扰乱输入图像的自动编码器,确保图像看起来接近原图

能够给出精确预测的面部匹配器

不能给出精确预测的性别分类器

SAN的训练过程可以总结为以下的PyTorch(伪)代码:

ae = AutoEncoder()

gc = GenderClassifier()

fm = FaceMatcher()

gc.load_state_dict(torch.load('saved_fm_model.pkl'))

fm.load_state_dict(torch.load('saved_gc_model.pkl'))

for fixed_model in (gc, fm):

for param in fixed_model.parameters():

param.requires_grad = False

optimizer = torch.optim.Adam(ae.parameters(), lr=learning_rate)

for epoch in range(num_total_epochs):

# ...

cost = loss_reconstruction + loss_gender_classification + loss_face_matching

cost.backward()

optimizer.step()

(完整代码发布在GitHub仓库iPRoBe-lab/semi-adversarial-networks) 注意,在评估SAN模型时,不仅使用了未见面部图像数据集,同时还丢弃了训练中使用的性别分类器和面部匹配器,使用了一组未见面部匹配器和性别分类器。

致好奇名字由来的读者,下图解释了为何我们将这一配置称为半对抗:

多样性和概括性

正如我们的BTAS 2018论文提到的,我们最近致力于通过增强数据集等措施改善原SAN模型的概括性表现。例如,为了避免Buolamwini等在Gender shades: Intersectional accuracy disparities in commercial gender classification(性别阴影:商业性别分类器的区际差异)中讨论的偏差,我们过采样了深肤色个体的随机样本(在大多数面部数据集中为少数类别),以缓解潜在的偏差。此外,我们扩展了评估组合,引入了更多的未见性别分类器和面部匹配器。

后续

正如论文中提到的,目前还有很多方面有待探索,比如不同的集成方案,多属性扩展等。

本文大致介绍了我们在SAN和差分隐私方面的一些研究。更多研究成果即将发表。同时,我们很兴奋,能在今年秋季的BTAS 2018(10月22日-25日,洛杉矶)会议上呈现我们的最新结果,以及在ODSC West 2018(10月31日-11月3日)上报告我们的研究。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    41

    文章

    3360

    浏览量

    131522
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98743
  • 分类器
    +关注

    关注

    0

    文章

    152

    浏览量

    13112

原文标题:安能辨我是雄雌:半对抗神经网络如何迷惑性别分类器

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    [转]LabVIEW实现窗口最大化最小化

    分享VI程序 代码名称:LabVIEW实现窗口最大化最小化 适用平台:LabVIEW8.2.x LabVIEW8.5代码作者:LaRisa_S 版权所有:LaRisa_S 原创/转载:转载代码
    发表于 03-08 14:56

    如何用labview实现最大化最小化关闭菜单

    `怎么样用labview创建最大化最小化和关闭窗口,就像网页上面的右边的菜单栏样。最好是生成图2那样的前面板,谢谢啊!`
    发表于 03-25 16:56

    labview获取【显示分辨率】并实时设置界面【最大化】和【最小化居中】

    】和【最小化居中】最大化代码最小化并居中(注意必须到vi属性设置最小尺寸)可以通过最大化最小化
    发表于 04-19 12:40

    请问主vi和子vi怎么同时缩小,同时最大化

    问题,第当我最小化主vi时,子vi不会自动跟随而最小化。我想让主vi和子vi完全同步,也就是说我想最小化主vi的时候,子vi也
    发表于 12-21 10:51

    HDMI一分二,一分四;DVI一分二,一分

    功能:HDMI 1.4b 一分二,一分四;DVI 1.0 一分二,一分四应用:分配器,LED视频处理,HDMI矩阵,高清数字矩阵,家庭影院
    发表于 01-03 10:40

    基于变编码器的异常小区检测

    异常小区 (c)干扰异常小区  图1 异常小区类型  本文只对异常小区进行检测,不对造成异常的原因进行分析。  2.2变编码器  变
    发表于 12-03 15:06

    如何才能将网线一分为二?

    ,通过双绞线连接起来,主要作用是能够让用户单独享用线路,并且会把网络线分成两组进行传输数据。  分线要成对使用,实现两台设备同时联网,原理与方式1似,将
    发表于 03-22 17:17

    PCB抄板设计中为了达到生产最大化,成本最小化应该考虑哪些因素?

    PCB抄板设计中,为了达到生产最大化,成本最小化应该考虑哪些因素?
    发表于 04-26 06:38

    【原创分享】编码器分类及增量式光电编码器的工作原理

    分类方法。另外,按照编码器运动部件的运动方式来,可以分为旋转式和直线式两种。根据检测原理,编码器可以分为光学式、磁式、感应式和电容式。旋转式光电
    发表于 05-17 13:20

    编码器是如何进行分类的?分为哪几类?

    编码器是如何进行分类的?分为哪几类?绝对值编码器常见故障有哪些?绝对值编码器与绝对式编码器有什么
    发表于 07-12 06:41

    编码器的工作原理以及分类

    的刻孔方式不同分类(1)增量型:就是每转过单位的角度就发出个脉冲信号(也有发正余弦信号,编码器(图1)然后对其进行细分,斩波出频率更高的脉冲),通常为A相、B相、Z...
    发表于 07-12 06:39

    编码器分类简介

    1.编码器简介编码器分类: 按工作原理:光电式、磁电式和触点电刷式 按码盘的刻孔方式:增量式和绝对式两 由于博主接触面还不是很广,共就用
    发表于 08-19 08:28

    编码器分类及其工作原理

    文章目录编码器是什么编码器分类工作原理编码器是什么编码器(encoder)是将信号 如比特流或数据进行
    发表于 09-14 09:16

    编码器分类

    编码器分类根据检测原理,编码器可分为光学式、磁式、感应式和电容式,根据其刻度方法及信号输出形式,可分为增量式、绝对式以及混合式三种。1、增量式
    发表于 01-20 06:47

    稀疏边缘降噪自动编码器的方法

    为了提高自动编码器算法的学习精度,更进一步降低分类任务的分类错误率,提出一种组合稀疏自动编码器(SAE)和边缘降噪自动编码器(mDAE)从而
    发表于 12-21 14:41 3次下载
    稀疏边缘降噪<b class='flag-5'>自动编码器</b>的方法