0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于神经科学的Numenta介绍

Astroys 来源:Astroys 2023-09-21 09:10 次阅读

人脑以高效著称,它以稀疏的表征方式存储和处理信息。在任何时刻,只有一小部分神经元处于活跃状态。神经科学家相信,他们可以将大脑启发的逻辑映射到运行AI模型的算法、数据结构和架构中,从而提供一个让AI降低功耗的配方。数据科学家是否愿意改变他们基于蛮力计算的AI实践,这一点尚未确定,因为这种方法似乎越来越难以为继。

正自筹资金起家的初创公司并不多见,更不用说这家公司在神经科学研究领域玩了18年的长线游戏之后,突然推出了一款商业软件产品

更重要的是,这家初创公司的新产品直接向炙手可热的大语言模型(LLM)AI市场发出了挑战。

这家公司就是Numenta,它承诺其受神经科学启发的软件可以大幅降低在CPU上运行LLM的功耗。

持怀疑态度的人可能会认为这种策略是投机取巧。Numenta的CEO Subutai Ahmad认为,这种说法并不用准确。

Numenta将数十年的神经科学研究应用于商业产品的手段、动机和机遇都出现在AI领域。Numenta的研究人员特别注意到了AI科学家依靠蛮力计算来实现transformer的方式。

当然,神经科学和AI并非完全形同陌路。这两个学科在二十世纪五六十年代相互影响,后来逐渐分道扬镳。不过,Ahmad表示,神经科学和AI一直孤立地存在着,这点令人惊讶。

以ChatGPT为例。

尽管ChatGPT已是当红炸子鸡,但Ahmad认为,ChatGPT消耗的能源太多,最终将难以为继。他认为,只有应用神经科学的基本原理,开发者才能改变AI迈向死胡同轨迹。

了解Numenta

Numenta与其它大多数初创公司的区别在于,其联合创始人Jeff Hawkins、Donna Dubinsky和Dileep George的履历、经验和专业知识。

Hawkins在90年代是著名的Palm Pilot PDA的设计师。之后,他又在Handspring开创了名为Treo的智能手机

Dubinsky曾在1980年代负责管理Apple的部分分销网络,又曾任Palm的CEO,后来与Hawkins共同创办了Handspring。

2005年,AI和神经科学研究员Dileep George与Hawkins和Dubinsky合作。

每位联合创始人都为Numenta带来了技术、创业和激情方面的独特面向,而Hawkins则因痴迷脑科学而闻名,他是Numenta的公众导师。他撰写了两本书,“On Intelligence”(2004年与Sandra Blakeslee合著)和“A Thousand Brains: A new theory of intelligence”(2021 年)。他在科学杂志上发表的许多论文经常被大量引用。

但具有讽刺意味的是,神经科学的进步主要局限于研究机构,对商业市场影响甚微。据Numenta的CEO Ahmad称,只有极少数实验室积极将神经科学应用于AI。“我们可能是唯一一家尝试这样做的公司。”

他说,Numenta很幸运能走到今天,但他认为ChatGPT是一个“巨大的功耗”。Ahmad坚信,Numenta基于神经科学的数据结构和算法能为LLM带来更高的效率。

Numenta的商业产品

Numenta上周推出的第一款产品是AI软件“NuPIC(Numenta Platform for Intelligent Computing)”。

NuPIC是为现有transformer设计的即插即用软件,可以在CPU上以“极高的吞吐量和低延迟”运行LLM,该公司称,“速度明显快于Nvidia A100 GPU”。

Ahmad解释说,NuPIC将作为“企业软件”授权给“希望将LLM纳入工作流程的企业”。他强调说,Numenta不提供云服务,因此这不是SaaS。NuPIC授权用户将在自己的基础设施中安装该软件,因此“数据和模型对他们来说是完全私有的”。

Numenta产品的关键之一是它可以“直接插入”现有的transformer。Ahmad说:“在外界看来,它并没有什么不同。因此,下图中的中间部分和界面看起来与AI世界已经知道的完全相同。你甚至可以把传统的transformer换成我们的transformer,整个东西仍然可以工作。”

wKgaomULmKmAbG2MAADcM3d2HX0684.jpg

Numenta声称,其基于神经科学的AI解决方案“能让客户实现10到100倍以上的性能提升”。这些数字似乎好得不像真的,但该公司并非凭空捏造。Numenta有与Intel合作完成的案例研究为证。

与Intel和Xilinx的合作

Intel今年在其Xeon Max系列和第四代Intel Xeon可扩展处理器上发布了x86指令集架构的新扩展,称为AMX(Advanced Matrix Extensions)。AMX设计用于矩阵,以加速AI工作负载的矩阵乘法。

Numenta的团队从去年开始与Intel合作,当时Intel正在开发AMX。Ahmad解释说,Intel正在“利用CPU并添加类似于GPU的指令来进行矩阵乘法运算。但它仍然是CPU,而这些CPU非常灵活”。

Ahmad说,这种灵活性使Numenta“可以将我们的算法移植到这些芯片上”。Intel的一份文件指出:“Numenta展示了他们定制训练的LLM在Intel Xeon CPU Max系列处理器上运行时,与当前一代AMD Milan CPU的实现相比,在处理器上配备高带宽内存的LLM在大型文档(长序列长度)上的运行速度要快20倍。”

Intel总结说,Numenta已经证明“有能力大幅降低在Intel上运行语言模型的总体成本,为客户释放全新的自然语言处理能力”。

wKgaomULmKmAZF0VAAKMQBF81X4252.jpg

Numenta的Ahmad则更进一步说:“我们可以让transformer运行得比Nvidia GPU更快。”

现在判断Numenta的软件是否真的是Nvidia GPU Killer还为时尚早。但在Ahmad看来,Numenta从神经科学中学到的基本原理让公司处于优势地位。“这并不是说我们有什么魔法能让速度提高100倍。我们所做的是减少计算量。这就是大脑的工作。这就是我们提高效率的方法。”

Numenta技术的应用范围包括计算机视觉语音识别机器人技术。

在语音识别领域,Numenta已经与Xilinx(已被AMD收购)开展了合作。Numenta演示了其大脑启发的稀疏算法如何辅助机器学习,该算法在Xilinx现成的FPGA和GSC(Google Speech Commands)数据集上运行。根据Numenta提交的案例研究,该公司展示了“利用稀疏性扩展深度学习模型的巨大优势”。

神经科学与AI

那么,究竟什么是神经科学,它与AI有何不同?

神经科学侧重于了解神经系统(大脑、脊髓和外周神经)的基本特性以及它们如何发挥作用。相比之下,AI的兴趣在于开发机器来完成通常与人类智能相关的任务。

正如Ahmad所解释的,在人工神经网络的早期,AI在很大程度上受到了神经科学的启发。Ahmad说:“20世纪40年代,Donald Hebb提出了神经元可以学习的最初想法,而且神经元可以学习模式。这启发了最早的人工神经元,当时被称为感知器(perceptron)。”

他补充说,神经科学还启发了“反向传播(backpropagation)”,这是深度学习的核心学习算法,一直沿用至今。

David Hunter Hubel和Torsten Wiesel共同获得了1981年诺贝尔奖,他们研究了视觉皮层的结构和功能。Ahmad解释说,他们极大地增强了人类对视觉系统如何按层次学习物体特征的理解,首先从边缘到角落,然后到形状,最后到物体。

Ahmad强调说:“这种对层次结构和特征检测的理解直接启发了卷积网络,这种核心架构甚至被用于当今的计算机视觉领域。”

直到Ahmad感兴趣的90年代初,神经科学家和深度学习研究人员之间的互动还很普遍。

不知从何时起,AI开始专注于GPU和计算。随着GPU速度越来越快,网络也越来越大。随着计算机越来越强大,数据科学家依赖的数据也越来越多。AI成了更强大和更多闪存的代名词。

Ahmad援引这一背景,认为当今的AI存在两个基本问题。其弱点在于“无法持续学习”,以及对“过多数据”的贪得无厌。

根据他的定义,真正的智能系统是“不断学习”的。他说,AI系统首先在实验室中接受训练,然后部署到现实世界中。但它们不会不断学习。

与人类不断渐进地学习不同,代码还不能真正地“学习”。Ahmad在最近的一篇文章中写道:“如果一个AI模型今天犯了一个错误,那么它将继续重复这个错误,直到使用新的数据对它进行重新训练。”

他说:“作为人类,我们通过四处走动来学习,我们了解世界的结构,甚至做出预测。”

想想AI模型是如何学会识别一种新车型的。

Ahmad说,人类只需要看到“一个例子。我会从另一个角度、一天中的不同时间或在下雨天都可以认出那辆车”。Ahmad说,深度学习系统没有真实的世界模型,“你必须向它们展示数以千计的各种图像”。“它必须记住这辆车的每一个可能的角度”。

神经形态(neuromorphic)计算与神经科学有何不同?Ahmad解释说,神经形态计算是“神经科学和AI这一更广泛领域的一个子集”。虽然神经形态工程的重点通常是构建新的、能效极高的硬件系统,但Ahmad说:“我们正在开发更多的软件和算法。我们将能够利用芯片行业正在进行的所有创新,包括CPU、GPU以及所有SIMD指令和架构。”

融资情况

Ahmad说,Numenta的资金主要来自董事会内部,其中包括Hawkins和Dubinsky,但也有一些外部投资者。

目前,Numenta规模仍然很小,只有20名员工。Ahmad补充说:“现在,Numenta正在走向商业化,我们将在明年的某个时候,很可能是今年晚些时候,进行一轮大规模融资。”

过去二十年来,神经科学家和数据科学家之间的分化很有启发性。硅谷通过一个非常男性化的方式实现了惊人的发展,更大更快的CPU和GPU永远是赢家。但如今,他们需要想办法从拼肌肉的死胡同过渡到基于效率的模式。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18293

    浏览量

    222196
  • GPU芯片
    +关注

    关注

    1

    文章

    291

    浏览量

    5691
  • 自然语言处理

    关注

    1

    文章

    509

    浏览量

    13103
  • ChatGPT
    +关注

    关注

    27

    文章

    1410

    浏览量

    4769
  • LLM
    LLM
    +关注

    关注

    0

    文章

    202

    浏览量

    233

原文标题:基于神经科学的Numenta能否挑战强大的Nvidia?

文章出处:【微信号:Astroys,微信公众号:Astroys】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    用于先进电生理记录的有源微纳协同生物电子器件研究进展综述

    开发精确灵敏的电生理记录平台对心脏病学和神经科学领域的研究至关重要。近年来,有源微纳生物电子器件取得了重大进展,从而促进了电生理学的研究。
    的头像 发表于 04-16 10:55 169次阅读
    用于先进电生理记录的有源微纳协同生物电子器件研究进展综述

    神经刺激器有望改善克罗恩病患者生活质量

    据澳大利弗洛里神经科学与心理健康研究所(The Florey)报道,澳州奥斯汀卫生中心的临床医师们率先使用神经电刺激器成功防治克罗恩病术后炎症复发现象。
    的头像 发表于 04-02 14:15 98次阅读

    世界最小超紧凑荧光显微镜TINIscope助全脑区动物协同

    这项突破性的科研成果为神经科学家提供了一种前沿的研究方法,有助于深入理解动物感知、认知和行为过程中的神经元级跨脑区协同作用。研究结果已发至《国家科学评论》期刊。
    的头像 发表于 02-29 10:24 270次阅读

    基于可拉伸、自卷曲微流控电子器件的高适形性神经接口开发

    开发植入式神经电子接口在长期脑机接口和神经科学治疗中具有重要意义。
    的头像 发表于 01-08 16:19 303次阅读
    基于可拉伸、自卷曲微流控电子器件的高适形性<b class='flag-5'>神经</b>接口开发

    一种具有高度柔性与可塑性的超香肠覆盖式神经元模型

    神经科学的研究表明,神经元的学习能力是生物神经系统完成学习和记忆任务的重要基础,这些机理可促使我们在神经元设计和优化方面进一步提高DNN的性能。
    的头像 发表于 12-04 11:12 214次阅读
    一种具有高度柔性与可塑性的超香肠覆盖式<b class='flag-5'>神经</b>元模型

    一文解析Numenta加速AI推理的的秘密

    Numenta成立于2005年,由Jeff Hawkins和Donna Dubinsky创立,公司的目标是将更多的大脑工作方式应用于人工智能问题。提出的方法受到了神经科学的启发,尤其是大脑中稀疏计算的特性。
    发表于 11-06 17:14 145次阅读
    一文解析<b class='flag-5'>Numenta</b>加速AI推理的的秘密

    什么是脑机接口技术?脑机接口的原理和分类

    根据神经科学研究,在大脑产生神经冲动时,大脑神经系统的电磁活动会发生相应变化,并会体现出某种节律和空间分布的特征。因此,脑机接口的基本原理包括三个步骤,即记录、翻译和传达。
    的头像 发表于 11-03 15:28 4521次阅读
    什么是脑机接口技术?脑机接口的原理和分类

    我国科学家取得类脑芯片量子成像重要进展

    10月17日,记者从中国科学技术大学获悉,该校郭光灿院士团队孙方稳课题组和国家同步辐射实验室/核科学技术学院邹崇文课题组合作,制备出类脑神经元器件,并展示出类脑神经系统中多通道信号传递
    的头像 发表于 10-19 08:40 192次阅读
    我国<b class='flag-5'>科学</b>家取得类脑芯片量子成像重要进展

    不可错过!人工神经网络算法、PID算法、Python人工智能学习等资料包分享(附源代码)

    3.Python人工智能学习工具包+入门与实践资料集锦 本资料的主要内容详细介绍的是Python工具包合集包括了:网页爬虫工具集,文本处理工具集,Python科学计算工具包,Python机器学习和数
    发表于 09-13 16:41

    构建神经网络模型的常用方法 神经网络模型的常用算法介绍

    神经网络模型是一种通过模拟生物神经元间相互作用的方式实现信息处理和学习的计算机模型。它能够对输入数据进行分类、回归、预测和聚类等任务,已经广泛应用于计算机视觉、自然语言处理、语音处理等领域。下面将就神经网络模型的概念和工作原理,
    发表于 08-28 18:25 627次阅读

    面部表情识别技术的神经科学基础

    面部表情识别技术是建立在神经科学的基础之上。人类的大脑具有专门的神经系统来处理面部表情和情感信息。本文将探讨面部表情识别技术的神经科学基础,包括大脑的面部识别区域、情感网络和认知过程等方面。 首先
    的头像 发表于 08-24 18:09 357次阅读

    卷积神经网络的介绍 什么是卷积神经网络算法

    卷积神经网络的介绍 什么是卷积神经网络算法 卷积神经网络涉及的关键技术 卷积神经网络(Convolutional Neural Networ
    的头像 发表于 08-21 16:49 1431次阅读

    人工智能诞生于什么地方

    人工智能作为一门跨学科的综合技术,涉及到计算机科学、数学、哲学、认知科学、心理学、神经科学、语言学、逻辑学、信息科学等多个领域。它的发展历程可以追溯到20世纪40年代,至今已经经历了多
    的头像 发表于 08-14 15:38 3509次阅读

    深度学习解读神经信号,医学成像指导多动症诊断

    他带着他的模型找到了 Fernando Maestú,这是马德里康普顿斯大学的一位认知神经科学教授,也是认知和计算神经科学中心主任。Maestú 致力于研究大脑的电生理活动,以寻找神经和精神障碍的生物标志物。
    的头像 发表于 05-24 09:51 413次阅读
    深度学习解读<b class='flag-5'>神经</b>信号,医学成像指导多动症诊断

    神经科学的深度学习框架

    系统神经科学寻求解释大脑如何执行各种感知、认知和运动任务。相反,人工智能试图根据它们必须解决的任务来设计计算系统。
    的头像 发表于 05-18 17:53 310次阅读
    <b class='flag-5'>神经科学</b>的深度学习框架