0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国家科学评论 (NSR) 刊发社论:大语言模型和类脑通用智能

机器人技术与应用 来源:中国科学院自动化研究所 2023-11-16 10:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,中国科学院自动化研究所徐波研究员和中国科学院脑科学与智能技术卓越创新中心蒲慕明院士在《国家科学评论》(NSR)上发表社论,就以促进更加绿色的类脑通用人工智能为目标,评述如何发展脑启发的类脑神经网络架构、类脑学习算法及基于脉冲编码的类脑计算软硬件等。

ed34a2fe-839b-11ee-939d-92fbcf53809c.png

《国家科学评论》刊发社论

大语言模型(LLM)的出现以及它们在生成任务中的惊人表现预示着通用人工智能(AGI)新时代的开始。在很大程度上,它们已经通过了经典的图灵测试。

通过与机器人结合,大模型将进一步发展出更强大的具身智能。基于大语言模型的各种科学、教育和商业应用正激发人们对未来人工智能的无限遐想。然而,大语言模型存在着大量的连接参数,它们在训练和推理阶段的计算调整和并行推理往往消耗了巨大的算力成本,这个问题将限制大语言模型作为社会基础设施的广泛应用。

发展受脑启发的类脑通用智能研究是解决现有问题的一种有效途径。人类大脑是进化过程赋予的一种高效生物神经网络,包含多样的细胞类型和连接模式,且在人类出生后的脑发育过程中通过与环境交互进一步完善并形成高效的连接模式。即使我们不能像图灵曾经提出的那样制造一个“儿童机器”(Child Machine),通用人工智能也仍然可以从两个方面向成熟的大脑学习,即神经网络架构和类脑学习算法。

过去的人工神经网络在一定程度上受到了生物脑网络的启发,例如分层和模块化的网络结构,以及可调权重的突触连接。然而,大脑网络实现高效运转不仅仅是更多神经元和突触的堆叠,更重要的是不同神经元类型以及功能模块之间的选择性连接。大脑网络从局部模式到全局拓扑已经启发了当今人工智能中的卷积、循环及多类Transformer等强大神经算子。当前,全脑空间转录组(用于识别不同的神经元亚型)和介观连接组(用于定义特定细胞类型的连接)的研究,为进一步设计更有效的大语言模型网络架构提供了更多的生物依据。

突触连接往往通过短时和长时的突触可塑性机制进行神经活动的局部调节。全局神经调质可以在许多突触上发挥作用,以改变局部突触可塑性的能力和特性。类脑学习算法利用大脑发现的多尺度、多形式的突触可塑性,如时序依赖突触可塑性、自组织可塑性传播、神经调制元可塑性等,来决定网络突触权重的动态变化。类脑学习算法也可以通过梯度下降方法与可塑性学习规则相结合,使得在沿用反向传播核心原理同时,解决很多高效计算问题。开发用于大模型权重学习的新算法需要神经科学和人工智能之间的深度融合。

同步开发新的网络架构和学习算法将发展出新形式的类脑计算(BIC),即在神经形态芯片上实现生物启发的脉冲神经网络算法(SNN)。在网络和算法层面,SNN使用具有丰富动力学和脉冲模式的生物神经元作为基本计算单元,可以更容易地采用多尺度突触可塑性进行优化。在硬件层面,神经形态芯片需要新一代的非冯·诺依曼计算架构,通过借鉴大脑的事件驱动稀疏计算、高度并行运算以及存内计算来降低硬件功耗成本。类脑计算的一个充满吸引力的特质是,在执行推理时,只有一小部分脉冲神经元被激活以参与稀疏加法运算。这种稀疏计算非常适合降低大型人工智能模型的训练和推理成本。

社论认为, 除了开发绿色和可持续的低功耗人工智能这个紧迫问题,人们也越来越担心未来通用人工智能的发展可能会以有害的方式对人类社会产生重大影响。考虑到存在着政治、社会和文化差异,实现有效的人工智能全球治理不是一个容易实现的目标,但却是人类生存必需迈出的一步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108410
  • 人工智能
    +关注

    关注

    1821

    文章

    50540

    浏览量

    267861
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11373

原文标题:国家科学评论 (NSR) 刊发社论:大语言模型和类脑通用智能

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    功耗腰斩,延迟毫秒!杭州抢先手,押注计算

      电子发烧友网报道(文/莫婷婷)近期,杭州市正式出台《关于支持智能未来产业创新发展的若干措施》(以下简称“措施”),明确提出重点支持机接口与
    的头像 发表于 12-28 09:31 6655次阅读
    功耗腰斩,延迟毫秒!杭州抢先手,押注<b class='flag-5'>类</b><b class='flag-5'>脑</b>计算

    时识科技受邀出席2026智能产业创新发展大会

    近日,“智融合·创见未来”2026智能产业创新发展大会在上海杨浦长阳创谷落幕。作为仿生
    的头像 发表于 05-28 09:56 186次阅读

    合肥综合性国家科学中心人工智能研究院与大华股份达成战略合作

    近日,合肥综合性国家科学中心人工智能研究院(以下简称“人工智能研究院”)与大华股份“IAI-Dahua视频物联智能体联合实验室”签约及揭牌仪隆重举行。中国
    的头像 发表于 05-21 16:37 135次阅读

    洞察电商数据:淘宝商品评论API数据模型

    洞察电商数据:淘宝商品评论API数据模型 淘宝商品评论API是电商竞品分析、用户痛点挖掘、口碑监测、选品调研的核心接口,用于合规获取商品评价、评分、晒图、追评等全维度评论数据。本文整理
    的头像 发表于 03-27 16:40 307次阅读

    思必驰参与国家重大项目顺利通过中期验收

    近日,由上海交通大学牵头,联合中国科学院微电子研究所、华为技术有限公司、中国信通院、北京理工大学及思必驰共同承担的国家科技创新2030“脑科学
    的头像 发表于 02-24 10:03 947次阅读

    时识科技与江西农科院成立智慧畜牧计算联合实验室

    继与宁夏农垦集团成功验证技术在畜牧场景的落地能力后,时识科技(SynSense)与江西省农业科学院农业经济与信息研究所(简称“江西农科院”)成立“智慧畜牧
    的头像 发表于 02-04 09:42 802次阅读

    什么是大模型智能体...?大模型100问,快速全面了解!

    一、概念篇1.什么是大模型?大模型是指参数规模巨大(通常达到数十亿甚至万亿级别)、使用海量数据训练而成的人工智能模型。2.什么是大语言
    的头像 发表于 02-02 16:36 1208次阅读
    什么是大<b class='flag-5'>模型</b>,<b class='flag-5'>智能</b>体...?大<b class='flag-5'>模型</b>100问,快速全面了解!

    灵汐杭州电信智算集群正式发布

    2025年12月11日,灵汐杭州电信智算集群在杭州正式发布。该集群由杭州灵汐科技有限公司牵头,杭州电信、中国电子科技南湖研究院以及
    的头像 发表于 12-23 16:19 850次阅读

    启社区第二届智能创新大赛华南赛区线下路演圆满落幕

    11月14日,启社区第二届智能创新大赛(华南赛区)线下路演在广州数字科技集团有限公司圆满落幕。本次路演作为大赛南方赛区核心赛事环节,汇聚了来自南方各高校、科研机构及企业的十余支精
    的头像 发表于 11-20 15:24 1099次阅读

    时识科技亮相长三角智能专题论坛

    10月31日,由上海时识科技有限公司/智工场(上海)智能科技有限公司联合承办的长三角智能专题论坛在上海杨浦区长阳创谷成功举行。论坛在上
    的头像 发表于 11-05 16:33 843次阅读

    国际计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 1053次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、芯片

    。是实现芯片的基本模型。SNN中的神经元通过短的电脉冲相互沟通,脉冲之间的时间间隔起着重要作用。 最有利于硬件实现的脉冲神经元模型是“漏电整合-激发”
    发表于 09-17 16:43

    启社区第二届智能创新大赛正式启动

    近日,启社区第二届智能创新大赛启动仪式在广州举办。本次大赛整体由中国神经科学学会
    的头像 发表于 08-18 16:11 1589次阅读

    杭州灵汐智算集群实现大模型快速推理

    据悉,“杭州灵汐智算集群”已于7月底实现了大模型快速推理API的企业服务试运行。该集群由杭州灵汐科技有限公司牵头搭建运营,中国电信、
    的头像 发表于 08-18 16:06 1234次阅读

    合肥综合性国家科学中心能源研究院与宏微科技达成合作

    为深化产学研协同创新,推动科技创新和产业升级,近日,合肥综合性国家科学中心能源研究院与江苏宏微科技股份有限公司在智慧电力中心隆重举行“功率器件可靠性评测方法和寿命预测联合实验室”签约揭牌仪式。江苏宏
    的头像 发表于 06-14 14:22 1171次阅读