0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的这只AI学会了“打小抄”,还骗过了它的创造者

JsPm_robot_1hjq 来源:工程师曾暄茗 2019-01-06 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一篇来自谷歌和斯坦福2017年的研究今天在twitter和reddit上被热议。

在这个让人啼笑皆非的研究里,为了完成图像转换的任务,CycleGAN在训练过程中通过人类无法察觉的某种“隐写术”,骗过了它的创造者,给自己留下了隐秘的“小抄”,然后顺利完成了任务。

这个小插曲催生的论文也因此被命名为“CycleGAN, a Master of Steganography”(CycleGAN,一个隐写术大师),被当年的NeurIPs收录。

听到“骗过人类”觉得有点可怕是不是,先别慌,一起来看看这个“小把戏”。

为了加快将卫星图像转换为谷歌精确的街道地图,谷歌团队使用CycleGAN神经网络系统,希望通过大量的训练,从而使得这个模型能够尽可能精确、高效的转换X、Y类型图片获得相应结果。

简单来说,研究者希望通过训练这个CycleGAN模型,可以实现两类图片的转换:把航拍照变成街道地图,再把街道地图变回航拍照。

早期的实验结果中,这个模型做的还不错。

虽然很难深入了解神经网络流程的内部工作原理,但团队可以轻松审核其生成的数据。通过一些实验,他们发现CycleGAN确实大幅提升了转化速度。

直到有一天,研究者发现了奇怪的事情:这个模型自作主张的根据航拍卫星图片重建了街道地图。

比如,在创建街道地图时,屋顶上的天窗被研究者通过某种设置被抹掉了,但通过街道图转化为航拍照后,这些天窗又神奇地出现了。

心存疑惑的研究者开始着手检查这个CycleGAN学到的mapping到底是什么,接着发现了更多“凭空”出现、根本不可能产生的航拍照。

经过一系列检查,研究者发现原来是CycleGAN在把航拍照变成地图的时候,加入了一些人类肉眼不可见的噪音(或者其实可以说是信息),然后从地图reconstruct航拍照的时候,就通过这些噪音来读取信息。

就好比,为了应付人类任务,AI在地图照上面偷偷写了一点小抄/水印,而为了躲过人类的检查,只有它自己训练出来的模型才读得懂这些小抄/水印。

这和人类研究者想象的任务完成途径完全不一样。

可能有人会觉得,只要工作能完成,那么这个办法也非常聪明。

但值得一提的是,如果一些细节被巧妙插入视觉数据中,人眼不会注意到的数千个微小颜色变化,但计算机却可以轻松检测到。

也就是说,这种方法尽管可以实现目的,但是非常容易被攻击。一旦有“攻击者”在一张地图照里面加一些肉眼不可见的“小抄”,就会“重构”出来一张牛头不对马嘴的照片。

通过这种方式,可以将航空地图编码成任何街道地图!计算机在编码的过程机中不需要关注“真实”的街道地图,所有重构的航空照片所需的数据都可以“人畜无害”地叠加在完全不同的街道地图上。

研究人员也通过实验证实了这一点:

上图(c)中的彩色地图是计算机系统引入具有细微差别的可视化图片。 图片形成了和航空地图差不多的形状。如果你不把他放大,并且仔细的观察,你可能很难发现这些差别。

这种将数据编码成图像的做法并不新鲜,这是一门被称为“隐写术”的技术,值得一提的是,它已经非常成熟、现在被广泛应用。

现在,似乎计算机也学会了这种隐写方法,运用此方法机器可以“偷懒”,从而逃避学习、逃避们手头的任务。

了解一下Cycle GANs所采用的学习方法,出现这一“偷懒”结果似乎也不意外。

Cycle GANs从X到Y的G映射的过程中,生成器不是选取一些隐向量来映射,而是使用图像的直接转换量。使用普通的对抗损失函数来构建一个映射G。利用G,可以从生成的图像X映射到真实图像Y。

类似地, 我们也有一个反向的映射, 但这有一定的可能会使我们丢失原始图像的一些特性。

所以约束性在Cycle GAN的使用中非常重要。

一旦约束条件不完备,模型很容易出现钻空子的“偷懒”情况。

今天的热议中,很多人就此得出了“人工智能正越来越聪明”论断,从而心生恐惧。

大可不必慌张,这一结果正说明机器还不够聪明,到目前为止,它还不能完成复杂的图像类型相互转换等工作。但是,它可以利用人类不善于检测的弱点欺骗人类。

对计算结果的更严格评估可以避免这种情况。

计算机所做的事情,全部来自程序命令,所以你的要求也必须明确具体。不过这个案例给了我们关于解决神经网络的弱点的新的思路,对于计算机来说如果没有明确禁止它做什么事,它可以自行找到一个从细节出发,回馈自我到的一个高效解决既定问题的方式。

这也为提高CycleGAN生成图像的质量提供了有一种可能的途径,尽管循环一致性损失能够让神经网络将原图像的信息编码映射到生成的图像中,但是,模型也可以偷偷的通过对抗性学习提高欺骗能力。如果能够找到阻止算机“打小抄”的方式,这会使图图转换工作得到突破。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111999
  • AI
    AI
    +关注

    关注

    91

    文章

    41315

    浏览量

    302691
  • 人工智能
    +关注

    关注

    1821

    文章

    50366

    浏览量

    267053

原文标题:谷歌的这只AI学会了“打小抄”,还骗过了它的创造者

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Java转 AI高薪领域必备 从0到1打通生产级AI Agent开发 教程资料

    “价值创造者” 为什么是AI Agent?因为Agent代表了软件工程范式的根本性转移。(看讠果aixuetang。xyz) 传统的SaaS或CRUD系统是“确定性”的,机器只能按照预设的If-Else
    发表于 04-29 17:08

    Vibe Coding AI全栈开发实战

    ”或“直觉编程”,并非某种具体的编程语言或框架,而是一种融合了AI辅助开发、直觉化编程和高效迭代的实战思维方式。在这种模式下,开发不再需要逐行编写代码,而是通过自然语言描述需求,AI
    发表于 04-15 16:02

    AI辅助编程设计之道:从Spec到Code工程实践

    设计、模块接口定义、数据结构设计等。这些文档的价值,在于将模糊的想法逐步细化,最终形成可供编码实现的蓝图。 AI编程的误区在于,很多人试图用一句话替代整个设计过程,直接跳到代码生成。但AI不是读心术,无法理解开发
    发表于 03-16 13:33

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    谷歌Gemini 3模型开启智能新纪元

    Overviews)。Gemini app 的月用户量已突破 6.5 亿,超过 70% 的 Cloud 客户使用我们的 AI,1300 万开发在使用我们的生成模型进行构建——而这只是我们所看到的巨大影响的一个缩影。
    的头像 发表于 11-24 11:07 1018次阅读
    <b class='flag-5'>谷歌</b>Gemini 3模型开启智能新纪元

    谷歌AlphaEarth和维智时空AI大模型的核心差异

    谷歌AlphaEarth和维智时空AI大模型在技术理念上存在诸多共性,但两在目标尺度、数据来源、技术实现和应用模式上存在显著差异。
    的头像 发表于 10-22 14:50 1078次阅读

    谷歌AlphaEarth和维智时空AI大模型的技术路径

    谷歌AlphaEarth和维智时空AI大模型在应用场景和技术实现上各有侧重,但两在底层技术理念上存在显著共性。
    的头像 发表于 10-22 14:48 1074次阅读

    除了算法,算力和数据,AI生长离不开

    AI
    脑极体
    发布于 :2025年09月26日 15:23:54

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    复制人类智能的AI---AGI。 走向AGI的五个层次发现阶段: ①L1,聊天机器人:具备基础的对话能力,能够理解和回应简单的文本输入 ②L2,推理:具备基本的逻辑推理能力,能够分析复杂信息并进行推断
    发表于 09-18 15:31

    华曦达亮相谷歌AI亚洲峰会,AI Home业务高增长引领发展新征程

    8月28日,谷歌AI亚洲峰会在新加坡圆满落幕。作为谷歌生态战略合作伙伴,华曦达受邀参与峰会主论坛及同期举办的“LeadersExchange”闭门会议,与全球顶尖科技企业共探AI未来
    的头像 发表于 09-10 10:22 674次阅读

    谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用

    物品。为了更好的理解的工作原理,我们先来了解一下谷歌查找我的设备网络FMDN(Google find my device network)。FMDN由四部分组成:附件(Accessory),所有
    发表于 08-31 21:10

    AI赋能谷歌Chrome与Web工具全面升级

    2025 Google 谷歌开发大会带来了最新 Web 工具,包括全面升级的 Chrome 开发体验、极大简化的 UI 开发,到云端两侧的 AI 部署。这些强大的工具为出海开发提供
    的头像 发表于 08-29 09:33 1344次阅读

    谷歌AI模型点亮开发无限可能

    在 2025 年的 Google 谷歌开发大会上,AI 不是一门“技术”,更是一股彻底改变开发范式的“力量”,助力开发们在海外市场更上一层楼。A
    的头像 发表于 08-29 09:29 1319次阅读

    NVIDIA Jetson AGX Thor开发套件重磅发布

    开发与未来创造者们,准备好迎接边缘AI的史诗级革新了吗?NVIDIA以颠覆性技术再次突破极限,正式推出Jetson AGX Thor开发套件!作为继传奇产品Jetson AGX O
    的头像 发表于 08-28 14:31 1799次阅读

    腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元

    从城市管理到工业生产,从物流运输到消费终端,TS-SG-SM7系列AI算力模组以 “超强算力、超低功耗、灵活扩展” 的特性,成为边缘智能落地的关键支点。腾视科技正通过持续的技术创新,推动AI算力从云端下沉至场景一线,让每一个边缘节点都能成为智能时代的价值
    的头像 发表于 07-07 16:44 2212次阅读
    腾视科技TS-SG-SM7系列<b class='flag-5'>AI</b>算力模组:32TOPS算力引擎,开启边缘智能新纪元