0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的这只AI学会了“打小抄”,还骗过了它的创造者

C语言专家集中营 来源:YXQ 2019-06-05 08:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一篇来自谷歌和斯坦福2017年的研究今天在twitter和reddit上被热议。

在这个让人啼笑皆非的研究里,为了完成图像转换的任务,CycleGAN在训练过程中通过人类无法察觉的某种“隐写术”,骗过了它的创造者,给自己留下了隐秘的“小抄”,然后顺利完成了任务。

这个小插曲催生的论文也因此被命名为“CycleGAN, a Master of Steganography”(CycleGAN,一个隐写术大师),被当年的NeurIPs收录。

听到“骗过人类”觉得有点可怕是不是,先别慌,一起来看看这个“小把戏”。

为了加快将卫星图像转换为谷歌精确的街道地图,谷歌团队使用CycleGAN神经网络系统,希望通过大量的训练,从而使得这个模型能够尽可能精确、高效的转换X、Y类型图片获得相应结果。

简单来说,研究者希望通过训练这个CycleGAN模型,可以实现两类图片的转换:把航拍照变成街道地图,再把街道地图变回航拍照。

早期的实验结果中,这个模型做的还不错。

虽然很难深入了解神经网络流程的内部工作原理,但团队可以轻松审核其生成的数据。通过一些实验,他们发现CycleGAN确实大幅提升了转化速度。

直到有一天,研究者发现了奇怪的事情:这个模型自作主张的根据航拍卫星图片重建了街道地图。

比如,在创建街道地图时,屋顶上的天窗被研究者通过某种设置被抹掉了,但通过街道图转化为航拍照后,这些天窗又神奇地出现了。

左侧是原始地图,街道地图从原始地图产生。中间:生成的地图。右侧:重构的地图。其中,卫星地图的样本只来自街道地图。注意这两张卫星地图里出现的点,它在街道地图没有显示。

心存疑惑的研究者开始着手检查这个CycleGAN学到的mapping到底是什么,接着发现了更多“凭空”出现、根本不可能产生的航拍照。

经过一系列检查,研究者发现原来是CycleGAN在把航拍照变成地图的时候,加入了一些人类肉眼不可见的噪音(或者其实可以说是信息),然后从地图reconstruct航拍照的时候,就通过这些噪音来读取信息。

就好比,为了应付人类任务,AI在地图照上面偷偷写了一点小抄/水印,而为了躲过人类的检查,只有它自己训练出来的模型才读得懂这些小抄/水印。

这和人类研究者想象的任务完成途径完全不一样。

可能有人会觉得,只要工作能完成,那么这个办法也非常聪明。

但值得一提的是,如果一些细节被巧妙插入视觉数据中,人眼不会注意到的数千个微小颜色变化,但计算机却可以轻松检测到。

也就是说,这种方法尽管可以实现目的,但是非常容易被攻击。一旦有“攻击者”在一张地图照里面加一些肉眼不可见的“小抄”,就会“重构”出来一张牛头不对马嘴的照片。

通过这种方式,可以将航空地图编码成任何街道地图!计算机在编码的过程机中不需要关注“真实”的街道地图,所有重构的航空照片所需的数据都可以“人畜无害”地叠加在完全不同的街道地图上。

研究人员也通过实验证实了这一点:

右边的地图通过编码左边到映射的地图中,在视觉上很显然没有明显的变化。

上图(c)中的彩色地图是计算机系统引入具有细微差别的可视化图片。 图片形成了和航空地图差不多的形状。如果你不把他放大,并且仔细的观察,你可能很难发现这些差别。

这种将数据编码成图像的做法并不新鲜,这是一门被称为“隐写术”的技术,值得一提的是,它已经非常成熟、现在被广泛应用。

现在,似乎计算机也学会了这种隐写方法,运用此方法机器可以“偷懒”,从而逃避学习、逃避手头的任务。

了解一下Cycle GANs所采用的学习方法,出现这一“偷懒”结果似乎也不意外。

Cycle GANs从X到Y的G映射的过程中,生成器不是选取一些隐向量来映射,而是使用图像的直接转换量。使用普通的对抗损失函数来构建一个映射G。利用G,可以从生成的图像X映射到真实图像Y。

类似地, 我们也有一个反向的映射, 但这有一定的可能会使我们丢失原始图像的一些特性。

所以约束性在Cycle GAN的使用中非常重要。

一旦约束条件不完备,模型很容易出现钻空子的“偷懒”情况。

今天的热议中,很多人就此得出了“人工智能正越来越聪明”论断,从而心生恐惧。

大可不必慌张,这一结果正说明机器还不够聪明,到目前为止,它还不能完成复杂的图像类型相互转换等工作。但是,它可以利用人类不善于检测的弱点欺骗人类。

对计算结果的更严格评估可以避免这种情况。

计算机所做的事情,全部来自程序命令,所以你的要求也必须明确具体。不过这个案例给了我们关于解决神经网络的弱点的新的思路,对于计算机来说如果没有明确禁止它做什么事,它可以自行找到一个从细节出发,回馈自我到的一个高效解决既定问题的方式。

这也为提高CycleGAN生成图像的质量提供了有一种可能的途径,尽管循环一致性损失能够让神经网络将原图像的信息编码映射到生成的图像中,但是,模型也可以偷偷的通过对抗性学习提高欺骗能力。如果能够找到阻止算机“打小抄”的方式,这会使图图转换工作得到突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110250
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296501

原文标题:谷歌的这只AI学会了“打小抄”,还骗过了它的创造者

文章出处:【微信号:C_Expert,微信公众号:C语言专家集中营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌Gemini 3模型开启智能新纪元

    Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。
    的头像 发表于 11-24 11:07 459次阅读
    <b class='flag-5'>谷歌</b>Gemini 3模型开启智能新纪元

    谷歌AlphaEarth和维智时空AI大模型的核心差异

    谷歌AlphaEarth和维智时空AI大模型在技术理念上存在诸多共性,但两在目标尺度、数据来源、技术实现和应用模式上存在显著差异。
    的头像 发表于 10-22 14:50 518次阅读

    谷歌AlphaEarth和维智时空AI大模型的技术路径

    谷歌AlphaEarth和维智时空AI大模型在应用场景和技术实现上各有侧重,但两在底层技术理念上存在显著共性。
    的头像 发表于 10-22 14:48 595次阅读

    除了算法,算力和数据,AI生长离不开

    AI
    脑极体
    发布于 :2025年09月26日 15:23:54

    谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用

    物品。为了更好的理解的工作原理,我们先来了解一下谷歌查找我的设备网络FMDN(Google find my device network)。FMDN由四部分组成:附件(Accessory),所有
    发表于 08-31 21:10

    AI赋能谷歌Chrome与Web工具全面升级

    2025 Google 谷歌开发大会带来了最新 Web 工具,包括全面升级的 Chrome 开发体验、极大简化的 UI 开发,到云端两侧的 AI 部署。这些强大的工具为出海开发提供
    的头像 发表于 08-29 09:33 820次阅读

    谷歌AI模型点亮开发无限可能

    在 2025 年的 Google 谷歌开发大会上,AI 不是一门“技术”,更是一股彻底改变开发范式的“力量”,助力开发们在海外市场更上一层楼。A
    的头像 发表于 08-29 09:29 851次阅读

    NVIDIA Jetson AGX Thor开发套件重磅发布

    开发与未来创造者们,准备好迎接边缘AI的史诗级革新了吗?NVIDIA以颠覆性技术再次突破极限,正式推出Jetson AGX Thor开发套件!作为继传奇产品Jetson AGX O
    的头像 发表于 08-28 14:31 1223次阅读

    腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元

    从城市管理到工业生产,从物流运输到消费终端,TS-SG-SM7系列AI算力模组以 “超强算力、超低功耗、灵活扩展” 的特性,成为边缘智能落地的关键支点。腾视科技正通过持续的技术创新,推动AI算力从云端下沉至场景一线,让每一个边缘节点都能成为智能时代的价值
    的头像 发表于 07-07 16:44 1511次阅读
    腾视科技TS-SG-SM7系列<b class='flag-5'>AI</b>算力模组:32TOPS算力引擎,开启边缘智能新纪元

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发大会2025(MDDC 2025),不仅聚合了全球生态资源,
    发表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大规模思考与推理的 AI 模型新引擎​

    与推理 AI 模型。谷歌方面表示,代表着 AI 发展从 “响应式” 向 “主动式” 的范式转变,未来 AI 代理将能够主动检索并
    的头像 发表于 04-12 00:57 3194次阅读

    AI赋能边缘网关:开启智能时代的新蓝海

    ,准确率达到99.9%。 这一技术革新正在创造巨大的商业价值。在智慧城市领域,AI边缘网关可以实现交通流量实时分析、违章行为智能识别;在工业互联网中,能够实现设备预测性维护、生产工艺优化;在智慧能源领域
    发表于 02-15 11:41

    谷歌Gemini AI目标年底用户达5亿

    近日,谷歌CEO桑达尔·皮查伊在内部会议上向员工透露,他对公司自主研发的Gemini AI技术充满信心,认为其能力已经超越了当前的竞争对手。这一表态不仅彰显了谷歌AI领域的雄心壮志,
    的头像 发表于 01-18 11:30 1266次阅读

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌
    的头像 发表于 01-13 14:40 1134次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高级推理和长上
    的头像 发表于 12-12 10:13 967次阅读