0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

果蝇大脑跑NLP任务效率竟比BERT高?

中科院长春光机所 来源:机器之心 作者:机器之心 2021-02-04 14:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

研究了半天人工神经网络,还不如复制粘贴动物的答案?

最近一段时间,有关摩尔定律终结的讨论时常出现,深度学习越来越高的算力需求与芯片制造厂商们「挤牙膏」式的换代速度产生了不可调和的矛盾。对此,一些研究者们正在专注于常规架构的效率提升,也有一些研究者把目光转向于常规计算机体系之外,如光电计算、类脑计算,以及量子计算等方向。

现在,又有人想在动物身上寻找思路。在 1 月 13 日刚刚放榜的人工智能顶级会议ICLR 2021上出现了这样一篇论文:研究者们「黑」进了果蝇的神经网络,用它来跑 NLP 算法,结果发现性能与常规人工神经网络相当,而且非常节约能耗。

这一通操作仿佛打开了新世界的大门。

神经科学中研究最深入的网络之一是果蝇的大脑,尤其是称为蘑菇体的部分。该部分能够分析气味、温度、湿度和视觉数据等感官输入,以便于果蝇学会区分友好刺激和危险刺激。神经科学家表示果蝇大脑的这一部分是由一组称为投射神经元的细胞组成,这些细胞将感觉信息传递给 2000 个称为 Kenyon 细胞(简称KC)的神经元,Kenyon 细胞连接在一起形成能够学习的神经网络。这让果蝇在学习接近食物、潜在伴侣等时候,学会避免潜在的有害感官输入(例如危险的气味和温度)。

这个相对较小的网络具备的功能和灵活性让神经科学家们好奇:是否可以对其进行编程以解决其他任务?

在伦斯勒理工学院、MIT-IBM Watson AI Lab 的研究者进行的一项入侵果蝇大脑网络的研究中,人们成功地在生物大脑中执行了自然语言处理等任务。这是自然界的神经网络第一次以这种方式被征用。研究者表示这个生物大脑网络与人工学习网络的性能相当,但使用的计算资源却更少。

这种方法相对简单直接,该团队首先使用计算机程序重建蘑菇体所依赖的网络,大量神经元将数据提供给大约 2000 个 Kenyon 细胞。然后研究者训练了该网络以识别文本中词之间的相关性。该任务基于的思想是:一个词可以通过其语境或通常在其附近出现的其他词来表征。该想法首先从一个文本语料库开始,然后面向每一个词,分析出现在该词前后的其他词。

这样机器学习系统可以在给定已经出现的词的情况下预测句子中下一个词。许多系统(例如 BERT)都使用这种方法来生成看起来自然的句子,该研究也采用了这种方法。事实证明即使自然界的网络完全不是基于这一目的进化的,但它也非常擅长这种方式。该研究表明该网络可以学习词的语义表征。

研究者表示,果蝇的大脑网络可与现有的自然语言处理方法相媲美,并且最重要的是生物网络仅使用很少一部分计算资源。这意味着它仅使用较少的训练时间和内存占用量。

生物的效率

这是一个有趣的结果。「我们把这样的结果视为生物启发算法普适性的一个范例,其与传统的非生物算法相比更具效率,」该论文的作者 Yuchen Liang 等人说道。

这项工作除了展示生物计算的效率,还提出了一些有趣的问题。其中最明显的就是:为什么生物神经网络计算是如此的高效?当然按照进化的理论,自然界会选择效率更高的神经网络存留下来,但在论文中,研究者们尚未对 Kenyon 细胞为何具有高效率提出自己的看法。

这项工作显然也开启了「入侵」其他生物大脑的方向。不过目前看来人们仍面临一些挑战,一个潜在的问题是神经科学家们仍然难以对更复杂化的大脑进行表征(如哺乳动物)。果蝇的大脑相对较小,只有 10 万个神经元,相比之下,老鼠的大脑有 1 亿个神经元,而人类的大脑有 1000 亿个神经元。因此在我们看到有小鼠、海豚或人类的大脑「被黑客入侵」之前,还需等待一段时间。

研究概况

果蝇脑蘑菇体是神经科学中研究最多的系统之一,其核心由一群 Kenyon 细胞组成。这些细胞接受来自多种感官方式的输入,被伽马氨基丁酸能神经元(Anterior Paired Lateral Neurons,APL 神经元)抑制,从而创造了输入的稀疏高维表征。

具体而言,其主要感知方式是嗅觉,但也有来自感知温度、湿度、视觉的神经元的输入。这些输入通过一组突触权重传递给大约 2000 个 Kenyon 细胞。Kenyon 细胞通过 APL 神经元相互连接,后者会发送一个强大的抑制信号到 Kenyon 细胞。这个循环网络形成了 Kenyon 细胞之间的赢者通吃效应,并让一小部分「冠军」神经元之外的所有神经元都失声了。

在这项论文中,研究者将该网络模体(motif)进行了数学化建模,并将其应用于一项常见的 NLP 任务:学习非结构化文本语料库中的词与上下午之间的相关结构。

该研究提出的网络模体如图 1 所示,KC 也将输出发送到蘑菇体输出神经元 (MBON),但是蘑菇体网络的这一部分不包含在数学模型中。

9e3e5810-64a5-11eb-8b86-12bb97331649.png

图 1: 网络架构图。几组对应不同方式的神经元将它们的活动发送到 KC 层,而 KC 层通过与 APL 神经元的相互连接而被抑制。

总体而言,研究贡献如下:

受果蝇网络的启发,研究者提出了一种算法,使得为单词及其上下文生成 binary (相对于连续) 词嵌入成为可能,并系统评估了该算法在词汇相似性任务、词义消歧和文本分类等任务上的表现;

与连续 GloVe 嵌入相比,本文的 binary 嵌入能产生更紧密和更好分离的概念集群,并且符合 GloVe 的 binarized 版本的集群特性;

研究者发现,训练果蝇网络所需要的计算时间比训练传统的 NLP 架构(如 BERT)所需要的计算时间要少一个数量级,但是在分类准确率上有所降低。

这一成果展示了人类将自然界算法及行为进行「重新编程」,并将其转化为原始生物体从未参与过的任务的目标算法的巨大潜力。

实验结果

在论文的第三章,研究者从静态词嵌入、词聚类、上下文相关的词嵌入、文本分类等几个方面对研究提出的网络进行了评估,以下是实验结果。

静态词嵌入评价

9e68ef12-64a5-11eb-8b86-12bb97331649.png

9f059cb8-64a5-11eb-8b86-12bb97331649.png

词聚类

9f5a4ae2-64a5-11eb-8b86-12bb97331649.png

上下文相关的词嵌入

9fedf9c2-64a5-11eb-8b86-12bb97331649.png

a0a91f2c-64a5-11eb-8b86-12bb97331649.png

文本分类

a0bdbe1e-64a5-11eb-8b86-12bb97331649.png

计算效率

a141d6d6-64a5-11eb-8b86-12bb97331649.png

原文标题:科学家「黑进」果蝇大脑跑NLP任务,发现效率比BERT高

文章出处:【微信公众号:中科院长春光机所】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108160
  • 人工智能
    +关注

    关注

    1820

    文章

    50317

    浏览量

    266894

原文标题:科学家「黑进」果蝇大脑跑NLP任务,发现效率比BERT高

文章出处:【微信号:cas-ciomp,微信公众号:中科院长春光机所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Freertos 任务视图显示运行时值,但配置后百分错误,为什么?

    的十六进制值与应用程序一致,但视图始终显示每个任务的 0.0%,这是我们的视图: 使用十六进制值计算每个任务的运行时百分似乎对应于任务执行(增加
    发表于 04-03 07:12

    没有AI大脑,别叫全屋智能

    打破伪智能困境,美的为家装上AI大脑MevoX
    的头像 发表于 03-16 09:13 1149次阅读
    没有AI<b class='flag-5'>大脑</b>,别叫全屋智能

    伺服定位偏分析及解决方法

    伺服系统在工业自动化领域扮演着核心角色,其定位精度直接影响生产效率和产品质量。然而在实际运行中,伺服定位偏问题频发,成为困扰工程师的技术难题。本文将系统分析偏成因,并结合实际案例提出针对性解决方案,为设备维护和系统优化提供参
    的头像 发表于 03-05 17:32 1218次阅读

    斯特综合性能测试机提升电池组性能验证效率精度

    深圳斯特自动化设备有限公司推出的综合性能测试机,凭通过技术创新重新定义了电池性能测试的标准,在保证测试精度的同时,提升了验证效率
    的头像 发表于 02-06 16:37 1097次阅读
    <b class='flag-5'>比</b>斯特综合性能测试机提升电池组性能验证<b class='flag-5'>效率</b>精度

    电源的效率如何观察?

    电源的效率如何观察 电源的效率通常通过以下方式观察和评估: 电源效率标准(Efficiency Rating):许多电源产品会附带一个电源效率标准,通常以百分
    发表于 12-30 08:19

    AGV软件:智能制造物流的“智慧大脑

    AGV软件是工业物流的智慧大脑,通过智能调度、路径优化和多车协同,将搬运效率提升40%,碰撞风险降低30%。未来,AI与5G技术将推动AGV从自动化迈向智能化,成为企业降本增效的核心驱动力。
    的头像 发表于 12-17 14:07 407次阅读
    AGV软件:智能制造物流的“智慧<b class='flag-5'>大脑</b>”

    提高系统效率几个误解解析

    的话,这个没退出来,后面又接踵而至,一会儿系统就将崩溃了。如果任务数量多但很频繁的话,CPU的 很大精力都用在进出中断的开销上,系统效率极为低下,如果改用查询方式反而可极大提高效率,但查询有时不能满足
    发表于 12-15 06:09

    实战复盘:皮带机声振温监测落地,偏故障降 70%

    皮带机偏故障可通过精准监测解决,核心是实现“早发现、早处置”。声振温监测的价值的就是将“事后维修”转为“事前预警”,提升设备运行稳定性与效率
    的头像 发表于 12-10 09:52 611次阅读
    实战复盘:皮带机声振温监测落地,<b class='flag-5'>跑</b>偏故障降 70%

    在多任务系统中,如何平衡任务调度以防止因负载导致的再次进入低功耗模式的延迟?

    在多任务系统中,如何平衡任务调度以防止因负载导致的再次进入低功耗模式的延迟?
    发表于 12-04 06:37

    Task任务:LuatOS实现“任务级并发”的核心引擎

    LuatOS应用程序运行的核心大脑——所有LuatOS应用项目都会使用到sys核心库。    sys核心库提供了四大类功能: Task任务 Message消息 Timer定时器 Run调度器 本文将
    的头像 发表于 08-28 13:49 637次阅读
    Task<b class='flag-5'>任务</b>:LuatOS实现“<b class='flag-5'>任务</b>级并发”的核心引擎

    揭秘LuatOS Task:多任务管理的“智能中枢”

    ,也是LuatOS应用程序运行的核心大脑——所有LuatOS应用项目都会使用到sys核心库。    sys核心库提供了四大类功能: Task任务 Message消息 Timer定时器 Run调度器 本文将
    的头像 发表于 08-28 13:48 782次阅读
    揭秘LuatOS Task:多<b class='flag-5'>任务</b>管理的“智能中枢”

    大小鼠跑步机 小动物台 动物跑步机 大鼠实验台 小动物能量 代谢气体

    * 宽 * 565*630*310mm,单跑道宽 55mm。4 大鼠台架尺寸:长 * 宽 * 565*630*310mm,单跑道宽 116mm;控制器尺寸:长 * 宽 *
    发表于 08-14 13:57

    电流、高效率电荷泵,具有自动定时器 skyworksinc

    电子发烧友网为你提供()电流、高效率电荷泵,具有自动定时器相关产品参数、数据手册,更有电流、高效率电荷泵,具有自动定时器的引脚图、接线图、封装手册、中文资料、英文资料,
    发表于 07-29 18:32
    <b class='flag-5'>高</b>电流、高<b class='flag-5'>效率</b>电荷泵,具有自动定时器 skyworksinc

    十年磨剑!通王炸芯片加持,零突围成为新势力销冠的密码

    41,039辆。6月27日,在苏州举办的“2025通汽车技术与合作峰会”上,零汽车创始人、董事长兼CEO朱江明提到,2025年前5个月,零汽车销量超17万台,海外超1.7万台,处于新势力汽车阵营的销冠。   图1:零
    的头像 发表于 06-29 22:36 5625次阅读
    十年磨剑!<b class='flag-5'>高</b>通王炸芯片加持,零<b class='flag-5'>跑</b>突围成为新势力销冠的密码