0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在机器学习领域引入了一种新的隐写术,称为“训练集伪装

DPVg_AI_era 来源:lq 2019-01-08 08:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你以为是水果图像分类的任务,实际是男女分类任务,这并非不可能。研究人员在机器学习领域引入了一种新的隐写术,伪装训练集,隐藏任务的意图和目标,从而可以训练AI系统执行秘密任务。

将信息隐藏在显而易见的地方,使其存在不被怀疑,这就是隐写术。

隐写术并不新鲜。早在公元前5世纪,信使们就会剃光头发,并在头上写下信息。等到他们重新长出头发,就能隐藏信息。只有预定的收信人知道要剃光信使的头发来获得信息。

在现代,隐写技术常被用来检测未经授权的数字媒体分发。需要注意的是,隐写术(steganography)不同于密码学(crypotgraphy),后者的目的是隐藏数据内容。如果监视数据的人可以更改数据或完全停止数据传输,就无法使用加密了。在这种情况下,隐写术变得非常重要,因为我们不希望任何介入的窃听者会觉得可疑并停止数据传输。

在最近的研究中,威斯康星大学麦迪逊分校和阿默斯特学院的研究人员在机器学习领域引入了一种新的隐写术,称为“训练集伪装”(training set camouflage)。

他们设想了这样一个场景:一个机器学习智能体(Alice)试图训练另一个智能体(Bob)去完成一项秘密的分类任务,而且要避免被第三个智能体(Eve)窃听。

他们在arXiv上预先发表的一篇论文中概述了他们的框架,该框架允许机器学习智能体向第三方观察者隐藏任务的意图和目标。

图1:训练集伪装的示例。(a) 伪装的训练集 (b)秘密的分类任务

图1a所示的分类训练集中,上面一行包含正类(+)的实例,下面一行是负类(-)的实例。这些图像可以输入给机器学习系统,以学习一个模型,该模型将成功地将从未见过的实例(图像)分类为+或-。

如果你认为这个任务是水果图像分类(橙子vs.苹果),那么你已经被成功地愚弄了。实际的任务是对女性和男性进行分类,如图1b所示。事实上,一个标准的逻辑回归学习器仅对图1a中的图像进行训练,就可以对图1b中的图像得到较高的性别分类准确率。

在这篇论文中,研究人员设想了一个智能体Alice,她有一个秘密的分类任务(例如,对女性和男性的图像进行分类)和一个相应的私人训练集(女性和男性的图像)。Alice想训练第二个智能体,Bob,来完成这个秘密任务。

“训练集伪装”的框架

研究人员在论文中写道:“想象一下,Alice有一个非法机器学习分类任务的训练集。Alice想让Bob(一个机器学习系统)来学习这个任务。然而,如果通信受到监控,训练集或训练模型被发送给Bob,就会引起怀疑。”

在研究人员设想的场景中,名为Eve的第三个智能体扮演数据检验者的角色,监视Alice和Bob之间的通信。当Eve对Alice发送给Bob的内容产生怀疑时,她可以终止它们之间的通信,并拒绝将数据传递给Bob)。Eve作为审核者,在将训练数据传递给学习者之前,他会试图弄清楚该数据集是否合法。

“发送私人训练集会暴露Alice的意图;发送模型参数方向也会引起怀疑。Alice必须伪装通信,让通信内容在Eve看起来平淡无奇,同时避免事先与Bob使用过多的编码技巧。”

他们展示了Alice如何为一个隐秘任务构建一个伪装的数据集,其中(i)这个训练集在Eve看来是不可疑的,(ii)能让Bob学习秘密任务的准确模型。在前面的例子中,Eve注意到Alice发送的苹果和橘子的图像看起来是正常的,而对Alice关于女性vs男性分类的秘密任务一无所知。

研究人员设计的隐写术方法允许Alice在一个完全不同的、看起来良好的分类任务上计算第二个训练集,而不会引起Eve的怀疑。它通过查找看起来可以应用于特定任务的数据集来实现这一点,而实际上它可以教会智能体在不同的任务中表现良好。通过将它的标准学习算法应用于第二个训练集,Bob可以近似恢复原始任务上的分类器。

研究人员设计出这种隐写法某种程度上是偶然,因为它来自机器学习领域的一个不相关的项目。他们开发的系统创建了一系列的教学集,其中一个包括有错误的标签点。这鼓励他们研究一个智能体是否可以教另一个智能体如何完成任务,同时这个任务是用另一个任务伪装的。

研究人员使用真实的分类任务进行了一系列的实验,证明了他们的方法的可行性。他们的研究表明,只要利用以下事实就可以隐藏大量信息:对于任何给定的任务,都有几个模型可以很好地执行该任务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1095

    浏览量

    42153
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136223
  • 智能体
    +关注

    关注

    1

    文章

    387

    浏览量

    11520

原文标题:机器学习新隐写术:伪装训练集,隐藏任务意图

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    机器学习训练秘籍——吴恩达

    帮助团队做出些这样的改变,从而成为团队里的超级英雄!3 先修知识与符号说明如果你有学习机器学习相关课程(例如我 Coursera 开设
    发表于 11-30 16:45

    什么是机器学习? 机器学习基础入门

    是将提供的两个数字相乘。图2。有了机器学习,我们就有了数据(输入)和答案(输出) ,并且需要计算机通过确定输入和输出如何以对整个数据为真的方式相互关联来推导出一种排序算法假设我使用
    发表于 06-21 11:06

    探索一种降低ViT模型训练成本的方法

    (1 GPU)和时间(24小时)资源下从头开始训练ViT模型。首先,提出了一种向ViT架构添加局部性的有效方法。其次,开发了一种新的图像大小课程学习策略,该策略允许
    发表于 11-24 14:56

    序贯LSB的提取攻击

    序贯LSB载体中通过连续LSB替换嵌入消息,其提取攻击问题本质上是消息嵌入起止点的估计问题。该文建立针对序贯LSB
    发表于 04-08 08:41 20次下载

    基于三元Golay码的快速算法

    研究GF(3)上的编码方法,利用三元Golay码给出一种GF(3)上的码,其性能较常见二元
    发表于 04-08 08:46 26次下载

    基于广义字符序列的分析技术

    分析是针对隐藏信息的攻击技术。载体为图像的分析技术通过分析隐蔽载体的特点来识别该载体
    发表于 04-16 09:43 16次下载

    一种保持频域高阶统计特征不变的算法

    分析离散Haar小波分解特性的基础上,论证保持其高阶统计特征不变性引理,据此设计一种空域算法,保持了图像Haar小波分解后H、V、D区域的高阶统计特征。该算法使嵌入信息
    发表于 04-17 09:20 18次下载

    基于多分类支持向量机的域盲检测

    提出一种区分域(包括像素域、DCT域、DWT域)的盲检测方法,构造图像特征向量,建立个多分类的支持向量机,根据特征向量对图像进行训练
    发表于 04-20 09:32 14次下载

    基于非均匀DCT的量化索引调制

    基于量化索引调制(QIM)的技术正日益受到分析的威胁。该文将通常在DCT 域的做法改
    发表于 02-08 16:00 9次下载

    针对特定测试样本的分析方法

    拥有大数据训练资源的前提下,研究了对图像特征的影响,找出了分析与图像特征之间的重要关系,基于此提出了
    发表于 12-15 16:05 0次下载

    基于空域图像变换参数扰动的

    被系统地研究过。对此,以空域图像变换为例,提出参数扰动模型,将带来的图像噪声隐藏在因参数微扰而带来的图像像素波动中,主动引入了图像的失配因素。实验结果表明,
    发表于 01-09 14:58 1次下载
    基于空域图像变换参数扰动的<b class='flag-5'>隐</b><b class='flag-5'>写</b><b class='flag-5'>术</b>

    一种具有分级安全的文本方法

    针对单数据类型方法安全性不高、容量不足等问题,提出了一种具有分级安全的文本
    发表于 01-14 16:26 0次下载

    LSB匹配检测

    目前,在数字图像中,基于空域和频域的研究最为广泛。基于空域的研究起步较早,典型的
    发表于 02-23 09:55 2次下载

    一种可分享数据和机器学习模型的区块链

    作为一种可用于分享数据和机器学习模型的区抉链,基于骨架网络训练神经网络模型,以全网节点匿名分享的数据作为训练模型的数据
    发表于 04-14 16:09 15次下载
    <b class='flag-5'>一种</b>可分享数据和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型的区块链

    如何理解机器学习中的训练、验证和测试

    理解机器学习中的训练、验证和测试,是掌握机器
    的头像 发表于 07-10 15:45 8118次阅读