0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么AI感知和人类的感知很难比较

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2020-10-10 14:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

正文字数:3268 阅读时长:8分钟

这篇文章是我们对人工智能研究论文的评论的一部分,这是一系列探索人工智能最新发现的文章。

人类层面的表现。人类层面的准确性。无论是面部识别、物体检测还是问题回答,这些术语都是你能从开发人工智能系统的公司经常听到的。值得称道的是,近年来出现了许多由人工智能算法驱动的伟大产品,这主要归功于机器学习深度学习的进步。 但是这些比较中的许多只考虑了在有限的数据集上测试深度学习算法的最终结果。这种方法会对人工智能系统产生错误的预期,并在它们被赋予关键任务时产生危险的结果。

在最近的一项研究中,一组来自德国不同组织和大学的研究人员强调了评估深度学习在处理视觉数据方面所面临的挑战。在他们题为《比较人类和机器感知的臭名昭著的困难》的论文中,研究人员强调了目前比较深层神经网络和人类视觉系统的方法中存在的问题。

在他们的研究中,这位科学家进行了一系列的实验,深入挖掘深度学习结果的表层,并将其与人类视觉系统的工作进行了比较。他们的发现提醒我们,在将人工智能与人类进行比较时,我们必须保持谨慎,即使它在相同的任务上表现出相同或更好的表现。 人类和计算机视觉的复杂性 在似乎无休止的重建人类感知能力的探索中,目前为止,目前为止,深度学习中的计算机视觉领域取得了最有利的结果。卷积神经网络(CNN)是一种常用于计算机视觉深度学习算法的体系结构,它可以完成传统软件难以完成的任务。

然而,将神经网络与人类的感知能力进行比较仍然是一个挑战。这在一定程度上是因为我们对人类的视觉系统和大脑还有很多东西要学习的地方。深度学习系统的复杂工作方式也使问题更加复杂。深层神经网络以非常复杂的方式工作,而这些方式往往会使它们自己的创造者感到困惑。 近年来,一个研究机构试图评估神经网络的内部工作原理及其在处理现实世界中情况的鲁棒性。德国研究人员在他们的论文中写道:“尽管进行了大量的研究,但比较人类和机器的感知并不简单。”。 在科学家们的研究中,它们重点集中在三个领域来测量人类和深度神经网络如何处理视觉数据。

神经网络如何感知轮廓? 第一个测试涉及轮廓检测。在这个实验中,人类和人工智能参与者都必须说明出一幅图像是否包含封闭轮廓线。..这里的目标是了解深度学习算法是否能够学习闭合和开放形状的概念,以及它们是否能够在各种情况下检测到它们。

你能分辨出上面哪个图像包含一个闭合的形状吗? 对人类来说,一个封闭的轮廓两侧有许多开放的轮廓,这在视觉上是非常突出的。相比之下,探测封闭的等高线对 DNNs 来说可能比较困难,因为它们可能需要远距离的等高线整合”研究人员写道。 在实验中,科学家们使用了ResNet-50,一种由微软人工智能研究人员开发的流行卷积神经网络。他们使用迁移学习在 14000 张闭合和开放轮廓图像上调整人工智能模型。 然后,他们在各种类似训练数据的例子上测试人工智能,并逐渐向其他方向转移。最初的发现表明,一个训练有素的神经网络似乎掌握了封闭轮廓的概念。尽管该网络是在只包含有直线形状的数据集上训练的,但它也可以在曲线上表现良好。 科学家们写道:“这些结果表明,我们的模型确实学习了开放和闭合轮廓的概念,并执行了类似于人类的轮廓整合过程。”

ResNet神经网络能够检测出各种开放的和封闭的轮廓图像,尽管只训练了直线样本的训练。 然而,进一步的研究表明,其他不影响人的行为的变化降低了人工智能模型结果的准确性。例如,改变线条的颜色和宽度会导致深度学习模型的精度突然下降。当形状变大到一定尺寸时,模型似乎也很难检测到形状。

当看到包含不同颜色和厚度的线条的图像,以及形状大于训练集的图像时,ResNet-50 神经网络就会挣扎。 神经网络对对抗干扰也非常敏感,精心设计的变化是肉眼看不到,但会破坏机器学习系统的行为。

右边的图像经过了对抗性的干扰,也就是人类察觉不到的噪声。对于人眼来说,这两个图像是相同的。但是对于神经网络来说,它们是不同的图像。 为了进一步研究人工智能的决策过程,科学家们使用了特征包网络(bag-of - feature network),这是一种试图定位有助于深度学习模型决策的数据位的技术。研究人员发现,分析证明了“确实存在一些局部特征,比如端点与短边的结合,这些特征通常可以给出正确的类标签。”。 机器学习能推理图像吗? 第二个实验测试了深度学习算法在抽象视觉推理中的能力。实验所用的数据是基于综合视觉推理测试(SVRT),在这个测试中,人工智能必须回答需要理解图片中不同形状之间关系的问题。测试包括相同-不同的任务(例如,图片中的两个形状是否相同?)以及空间任务(例如,较小的形状是否位于较大形状的中心?)。人类的观察者很容易解决这些问题。

SVRT 挑战要求参与的 AI 解决相同-不同和空间的任务。 在他们的实验中,研究人员使用ResNet-50 测试了它在不同大小的训练数据集上的表现。结果表明,在28000个样本上进行微调优化的预训练模型在相同的不同任务和空间任务上都表现良好。(之前的实验将一个非常小的神经网络训练成一百万张图像。)随着研究人员减少训练样本的数量,人工智能的性能下降,但是在相同的不同任务中下降的速度更快。

“同-异任务比空间推理任务需要更多的训练样本”,研究人员写道,并补充道,“这不能作为前馈神经网络和人类视觉系统之间存在系统性差异的证据。” 研究人员指出,人类的视觉系统天生就预先训练过大量抽象的视觉推理任务。这使得在低数据的情况下测试深度学习模型是不公平的,而且几乎不可能得出关于人类和人工智能的内部信息处理差异的可靠结论。 研究人员写道:“很有可能,对这两种任务从零开始训练的人类视觉系统,在样本效率方面表现出与 ResNet-50 类似的差异。”。 测量深度学习的认知差距 识别差距是视觉系统中最有趣的测试之一。考虑以下图像,在不向下滚动的前提下,你能告诉我它是什么吗?

下面是同一图像的缩小视图。毫无疑问这是只猫。如果我给你看图像的另一部分(也许是耳朵)的特写镜头,你可能有更大的机会预测图像中的内容。我们人类需要看到一定数量的整体形状和图案才能识别图像中的物体。放大得越多,删除的特征越多,就越难区分图像中的内容。

根据它们所包含的特征,猫图像不同部分的特写镜头会对我们的感知产生不同的影响。 深度学习系统也以特征为基础,但它们的工作方式更为微妙。神经网络有时会发现人眼看不到的微小特征,但即使在非常近距离放大时也能检测到。 在最后的实验中,研究人员试图通过逐渐放大图像来测量深度神经网络的识别差距,直到人工智能模型的精度开始大幅下降。 此前的实验表明,人的图像识别缺口与深度神经网络存在很大的差异。但在他们的论文中,研究人员指出,之前大多数关于神经网络识别缺口的测试都是基于人类选择的图像补丁。这些斑块有利于人类的视觉系统。 当他们在“机器选择”的补丁上测试他们的深度学习模型时,研究人员得到的结果显示人类和人工智能有着相似的差距。

识别间隙测试评估放大图像如何影响人工智能的精度 研究人员写道:“这些结果凸显了在完全相同的基础上测试人类和机器的重要性,以及在实验设计中避免人类偏见的重要性。”。人和机器之间的所有条件、指令和程序都应该尽可能接近,以确保所有观察到的差异都是由于内在不同的决策策略,而不是由于测试程序的差异。” 缩小人工智能与人类智能之间的差距 随着我们的人工智能系统变得越来越复杂,我们将不得不开发更复杂的方法来测试它们。该领域先前的研究表明,许多用于测量计算机视觉系统精度的流行基准是误导性的。德国研究人员的这项工作是许多尝试测量人工智能和更好地量化人工智能和人类智能之间的区别的努力之一。他们得出的结论可以为未来的人工智能研究提供方向。

研究人员写道:“在人类和机器的比较研究中,最主要的挑战似乎是人类内部强烈的解释偏见。”。“适当的分析工具和广泛的交叉检查(如网络架构的变化、实验程序的校准、泛化测试、对抗性例子和受限网络的测试)有助于对发现的解释合理化,并将这种内部偏见放到正确的角度。总而言之,在比较人类和机器的感知时,必须注意不要强加我们人类的系统性偏见。”

原文标题:为什么AI感知与人类感知很难直接比较?

文章出处:【微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302580
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266925

原文标题:为什么AI感知与人类感知很难直接比较?

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    灵巧手触觉感知技术深度报告:从“单点感知”到“触觉成像”

    电子发烧友网报道(文/莫婷婷)随着人形机器人产业从“运动控制”向“精细操作”跨越,灵巧手已成为决定机器人能否真正融入人类生活与生产场景的关键部件。而赋予灵巧手“灵魂”的核心,在于其感知系统——尤其是
    的头像 发表于 03-22 02:28 8122次阅读
    灵巧手触觉<b class='flag-5'>感知</b>技术深度报告:从“单点<b class='flag-5'>感知</b>”到“触觉成像”

    大华股份亮相第七届中国智慧林业大会 AI智赋林草生态感知

    福州和杭州2026年4月21日 /美通社/ -- 林草是陆地生态的主体,人类生存发展的根基。4月17-19日,第七届中国林业大会在榕城福州召开。大华股份携AI大模型与物联技术亮相,聚焦林草生态感知
    的头像 发表于 04-21 15:19 107次阅读
    大华股份亮相第七届中国智慧林业大会 <b class='flag-5'>AI</b>智赋林草生态<b class='flag-5'>感知</b>力

    论马斯克的预言:AI使人类边缘化

    当地时间3月11日,在“Abundance Summit”科技峰会上,马斯克谈及AI进展时表示,AI已经进入自我改进阶段,在超高量级AI面前,人类终将走向边缘化。以下是对这一预言的相关
    发表于 03-14 05:27

    开启无限心智,为AI时代铸就智能感知系统

    正如当年蒸汽机“彻底摆脱对水力的依赖”,钢铁造就了摩天大楼和超级城市一样,AI智能体正在摆脱对人类感官的依赖,逐渐赋予机器人灵魂。 智能机器人正在依靠各类传感器自主感知周围的世界,实现具身智能的形态。
    的头像 发表于 01-22 14:45 698次阅读
    开启无限心智,为<b class='flag-5'>AI</b>时代铸就智能<b class='flag-5'>感知</b>系统

    欧菲光与广和通联合首发ToF+双目感知定位模块

    11月,欧菲光与广和通共研共创,首发ToF+双目感知定位模块,即将批量交付,将机器视觉感知与端侧AI模型进行融合,实现新一代智能割草机在深度估算与定位感知性能的全面跃升,为其智能化升级
    的头像 发表于 11-07 15:43 597次阅读

    2025瑞声科技感知技术峰会成功举办

    2025年10月28日,「想象例外」AAC感知技术峰会在西塘良壤酒店成功举办。本次峰会以“感知智能,场景共生”为主题,首次系统性提出了“AI原生体验”的感知技术理念,完整呈现了AAC瑞
    的头像 发表于 11-03 09:13 728次阅读

    安富利解析智能驾驶中的感知与决策技术

    当汽车开始像人类一样感知世界、做出决策,一场由AI驱动的交通革命已悄然发生。
    的头像 发表于 10-31 10:37 1000次阅读

    思岚科技推出新一代全集成AI空间感知系统Aurora S

    我们非常荣幸地通知大家:思岚新一代全集成AI空间感知系统——Aurora S正式发布!
    的头像 发表于 10-14 15:39 1287次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    控制器等。 具身智能常见的感知模块往往被称为智能传感器,就是在原有的传感器上加入一定的AI功能,从而可以模拟人类的5种基本感觉:视觉、听觉、触觉、嗅觉和味觉。 1、输入端的数据压缩 输入端常用的数据压缩
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成
    发表于 09-17 11:45

    声智科技声学模型赋予AI感知物理世界

    也一致认为,赋予AI感知物理世界的能力是实现真正智能的关键一步。要让AI真正融入现实世界,除了需要“眼睛”(计算机视觉),“耳朵”(声音感知)同样至关重要。
    的头像 发表于 09-02 17:46 1599次阅读

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“看”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境中做到感知的精确又可靠? 自动驾驶
    的头像 发表于 08-23 15:06 1824次阅读
    如何确保自动驾驶汽车<b class='flag-5'>感知</b>的准确性?

    动态感知+智能决策,一文解读 AI 场景组网下的动态智能选路技术

    、零丢包——迫使网络必须进行一场深刻的智能进化,从被动的基础设施转变为理解业务、感知状态、智能决策的“AI感知网络”。
    的头像 发表于 06-20 15:01 1715次阅读
    动态<b class='flag-5'>感知</b>+智能决策,一文解读 <b class='flag-5'>AI</b> 场景组网下的动态智能选路技术

    深度感知的应用和主要方法

    近年来,3D 感知技术越来越多地应用于各行各业,尤其是工业自动化、机器人、自动驾驶、医疗保健、AR/VR 和安全领域。3D 感知是用于捕捉环境与物体三维形状并进行数字化处理的技术的统称,而深度感知在其中起着关键作用。
    的头像 发表于 05-15 17:17 1278次阅读

    温度采集模块在线感知环境变化

    温度采集模块作为环境监测系统的核心感知单元,正以数字化触角深入人类活动的各个领域。这种由高精度传感器、智能处理单元和无线通信技术构成的微型化设备,通过持续采集温度参数,构建起环境监测网络的感知
    的头像 发表于 05-14 14:40 922次阅读