0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT | 加上“反馈”,AI算法可以看得更清楚

电子工程师 来源:YXQ 2019-05-17 15:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人类识别物体的能力非常卓越。假如你在特殊光线下看一个杯子,或者从一个意想不到的方向去看杯子,你的大脑仍然很有可能认出这是一个杯子。这种精确的物体识别能力对人工智能开发者来说是一个难以实现的梦想,例如那些改进自动驾驶汽车导航的开发者。

虽然在视觉皮层中建立灵长类动物物体识别模型已经彻底改变了人工视觉识别系统,但是目前的深度学习系统相比生物系统已经被简化,并且还是难以识别一些物体,。

近日,麻省理工学院麦戈文研究所的研究员 James DiCarlo 和他的同事在 Nature Neuroscience 上发表的研究成果中提到,有证据表明,反馈可以提高灵长类动物大脑识别难识别物体的能力,添加反馈回路可以改进视觉应用中所用到的人工神经网络系统的性能。

图丨人工智能和深度学习视觉识别系统的艺术渲染图(来源:Christine Daniloff)

深度卷积神经网络(DCNN)是目前在快速时间尺度(小于 100 毫秒)上精确识别物体最成功的模型。它具有大体上与灵长类动物腹侧视觉流、皮质区域类似的结构,这一结构用来逐步建立所观察的物体的精确图像。然而,跟灵长类动物的腹侧神经系统相比,大多数的 DCNN 都很简单。

“在很长一段时间里,我们都没有获得一个基于模型的理解。因此,这一领域是通过将视觉识别建模作为前馈过程而开始的,”麻省理工学院大脑和认知科学系的系主任DiCarlo 解释道,“但是,我们知道,在跟物体识别相关的大脑区域中,存在着重复性解剖学连接。

试想一下,前馈 DCNN 和视觉系统中首次尝试捕捉物体信息的部分,就像一条穿过一系列车站的地铁线,而反复出现的大脑网络就像街道,相互连接,但又不是单向的。大脑精确识别物体只需 200 毫秒,所以这些反复出现的联结是否在物体识别的关键步骤上起作用,目前仍不清楚。也许这些反复出现的联结只是为了长时间保持视觉系统协调。例如,街道上的排水沟缓慢地排出水和垃圾,但是并不需要很快地将人从小镇的一边转到另一边。

DiCarlo 和本研究的主要作者、CBMM 的博士后 Kohitij Kar 一起,开始验证快速识别物体过程中这些多次出现的结构的微妙作用是否被忽略了。

首先,作者需要确认灵长类动物大脑能详细解码的物体。识别物体这一过程对人工系统来说,充满了挑战,结果证明这很关键。

Kar 进一步解释道,“我们意识到,人工智能模型实际上并不是对处理每一幅或被遮挡、或处于混乱状态的图像都有问题。”

作者分别让深度学习系统,还有猴子和人类识别一些“有挑战性的”图片,结果灵长类动物可以很轻易地识别物体,但是前馈 DCNN 就不行。但是,当他们将合适的循环处理加入到这些 DCNN 中后,上述物体的识别突然变得轻而易举了。

Kar 采用了空间和时间精度极高的神经记录方法,来确定这些图片的处理对灵长类动物来说,是否真的如此琐碎。值得注意的是,他们发现,虽然对人类大脑来说,高难度图片的识别似乎很简单,但是它们实际上涉及到了额外的神经处理时间(大概是 30 毫秒),这表明循环在我们的大脑中也存在。

计算机视觉界最近在人工神经网络上成功堆叠了越来越多的层次,并且具有循环连接的大脑结构也已经出现。”Kar 说。

心理学教授、贝克曼研究所智能系统主题的联合主席、非本研究作者 Diane Beck 进一步解释道:“由于完全前馈的深度卷积神经系统现在非常擅长预测灵长类动物的大脑活动,这引起了人们对于反馈连接在灵长类大脑中所起到的作用的疑问。这项研究表明,反馈连接很可能在物体识别中发挥作用。

“这对自动驾驶汽车意味着什么呢?研究表明,假如深度学习想要类比灵长类大脑,那么深度学习中物体识别所涉及的结构就需要循环组件,并且研究指出如何在下一代智能机器中使用这一程序。”

“随着时间的变化,循环模型提供了对神经活动和行为的预测,”Kar 说。“我们现在可以模拟更复杂的任务。也许有一天,这个系统不仅可以识别物体,比如人,还可以执行人类大脑能够轻松进行的认知任务,比如体会他人的情绪。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296590
  • MIT
    MIT
    +关注

    关注

    3

    文章

    254

    浏览量

    24921

原文标题:MIT最新研究:加上“反馈”,AI算法可以看得更清楚

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业视觉网关:RK3576赋能多路检测与边缘AI

    ,企业既要“看得清”,也要“判得准、追得更全”。RK3576 工业视觉网关的差异化价值:12路 1080P@30fps 并发采集H.264/H.265 硬件编解码端到端延迟约 120
    发表于 10-16 17:56

    都在说“AI+”,可AI+到底加的是什么?

    ?还是实实在在改变了行业逻辑? 今天,我们就来认真聊聊这个问题。 一、“AI+” ≠ “+AI” 在理解“AI+”之前,先搞清楚它和“+AI
    的头像 发表于 10-10 14:50 534次阅读

    聆思大模型智能FAE,看得懂技术,答得准问题

    聆思大模型智能FAE,看得懂技术,答得准问题 在智能硬件开发的嵌入式技术支持中,响应迟缓、人员培训成本高企、服务时间覆盖不足等痛点,常常制约FAE团队效率 聆思大模型智能FAE作为专为智能硬件
    发表于 09-30 11:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段智能、接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的一项重大创新和发展。 优势: 在于能处理庞大的参数规模,显
    发表于 09-18 15:31

    有哪些常见的AI算法可以用于装置数据的异常检测?

    在装置数据(如工业设备传感器数据、电子装置运行参数、化工装置工况数据等)的异常检测中,AI 算法的选择需结合数据特点(如 时序性、维度、标注情况 )、检测目标(如实时性、精度、可解释性)及部署环境
    的头像 发表于 09-18 09:27 413次阅读
    有哪些常见的<b class='flag-5'>AI</b><b class='flag-5'>算法</b><b class='flag-5'>可以</b>用于装置数据的异常检测?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    AI的应用多种多样。比如:DALL-E2、Midjourney、Stable Diffusion等,不仅包括对话功能,还包括生成图像、视频、语音和程序代码等功能。 竟然连代码都可以生成,会取代程序员
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法和思路。第四章是全面介绍半导体芯产业的前沿技术,包括新型晶体管
    发表于 09-05 15:10

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    到AGI,一起来探索AI芯片 本书从创新视角出发,系统梳理了AI芯片的前沿技术与未来方向,串联起从算法到系统的实现路径,全景式展现AI芯片的技术原理与应用场景。 书中核心内容可分为
    发表于 07-28 13:54

    鲲云科技助力油田行业智能化安全管理

    随着国家对安全生产要求的不断加强,油田行业的安全管理亟待实现智能化和高效化。在油田智能化升级的浪潮中,众多 AI 转型方案涌现,鲲云以“算力+算法+平台”一体的 AI 视频分析解决方案帮助油田安全管理不止于“
    的头像 发表于 07-25 15:04 716次阅读

    AI视频分析和算法集合

    AI
    jf_02235694
    发布于 :2025年07月23日 16:10:12

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型、通义千问、混元等多种先进端侧大模型,还包含视觉、语言、多模态等多种多样的大模型,开发者可以通过Gen-AI Model Hub一键调用模型能力,让AI应用开发选择丰富。 为了让
    发表于 04-13 19:52

    AI算法托管平台是什么

    AI算法托管平台是一种提供AI模型运行、管理和优化等服务的云端或边缘计算平台。下面,AI部落小编带您详细了解AI
    的头像 发表于 03-06 10:22 842次阅读

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    ,开发人员可以根据具体应用需求重新配置硬件逻辑。这种灵活性使得FPGA能够适应不断变化的AI算法和应用场景,而无需更换硬件。 • 定制化加速:FPGA可以根据特定的
    发表于 02-19 13:55

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。AI技术
    发表于 02-15 11:41