0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔和IBM积极探索神经模态计算到底是什么?

汽车玩家 来源:与非网 作者:与非网 2020-03-08 09:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目前英特尔和IBM在内的企业正积极探索超低功耗神经模态芯片在不同领域的应用,在未来几年内随着 AI+IoT 的发展,神经模态计算将会迎来一波新的热潮。

人工神经网络的概念以及基本神经元模型于 1943 年就已提出,这正是试图模拟脑皮层以神经元网络形式进行信息处理的体现。

卷积神经网络的局部感受野是受到大脑视觉系统的启发。深度神经网络的层级构建是源于脑皮层的分层通路。

只不过在深度学习的后续发展中,研究者更加偏重把神经网络视为一个黑匣,用于拟合从输入到输出的复杂映射关系:

只需要给网络的输出定义一个收敛目标(目标函数,比如每张图像的输出对应到正确的类别)并描述为一个优化问题,然后用梯度下降的方式去更新系统参数主要是突触权重,使得输出逐渐逼近想要的结果。

原则上网络越大,特征提取的能力就会越强,也就需要越多的数据来训练网络更新参数使网络收敛,因此计算量也大幅增加。

故而,深度学习也被称为数据和算力驱动的智能。虽然深度学习以解决实际应用为目标而与神经科学渐行渐远,但近两年也有科学家试图在大脑中找到梯度下降的证据和吸收新的脑科学成果。

机器学习是目前人工智能模型中最卓有成效的一个分支,而深度学习又是当今机器学习的宠儿,其以人工神经网络为主要模型。

人工神经网络由大量神经元通过突触连接而成,从输入到输出呈现层级结构,当层数较多时则被称为深度神经网络。

相比于全连接神经网络,卷积神经网络通过引入二维特征图与突触核的卷积操作获得了强大的局部特征提取能力,被广泛用于图像处理领域。

而反馈神经网络通过引入反馈连接,建立时序动力学模型,被广泛用于处理语音文本等时序数据。

神经模态计算的重要意义

①目前的深度学习仅能实现人类大脑极小一部分的功能,距离人类的智能还有非常远的距离,而使用神经模态计算直接模仿神经元系统在人工神经元数量足够多时,或将有希望能实现比起深度学习更好的效果,更接近人类大脑。

②目前深度学习计算在部署上遇到的困难是能效比和延迟问题,在对于功耗要求非常低的物联网领域,以及对于延迟要求非常高的领域无人驾驶领域,部署深度学习会遇到很大的挑战。

恰好神经模态计算则可以解决这两大问题。

①神经模态计算的一大优势就是其计算功耗与输入有关,在输入不会激活大量神经元的情况下,其功耗可以做到非常低。

②对于物联网应用来说,神经模态计算可以利用这样的规律,仅仅在需要的时候激活神经元消费能量来完成事件识别,而在其他没有事件的时候由于神经元未被激活因此功耗很低,从而实现远低于深度学习芯片的平均功耗。

③神经模态计算并非常规的冯诺伊曼架构,神经模态计算芯片一般也不会搭配 DRAM 使用,而是直接将信息储存在了神经元里。这样就避免了内存墙带来的功耗和延迟问题,因此神经模态计算芯片的延迟和能效比都会好于传统的深度学习。

国外技术寡头优势明显

近日,英特尔发布了基于其神经模态计算芯片 Loihi 的加速卡 Pohoiki Beach,该加速卡包含了 64 块 Loihi 芯片,共含有八百多万个神经元。

继 IBM 发布 TrueNorth、英特尔发布 Loihi 之后,PohoikiBeach 又一次让神经模态计算走进了聚光灯下。

深度神经网络压缩技术,当前,深度学习领域目前面临的一大挑战是,主流 DNNs 都是计算和存储密集型的,这导致在边缘和嵌入式设备的部署面临巨大的挑战。

为此,英特尔研究院提出了从动态网络手术 DNS、渐进网络量化 INQ 到 MLQ 多尺度编码量化的低精度深度压缩解决方案。

通过这些布局可获得百倍 DNN 模型无损压缩性能。根据 AlexNet 测试结果,该项简洁的解决方案能够超越主流深度压缩方案至少一倍,在 2/4-bit 精度下达到超过 100 倍的网络压缩。

IBM 研究人员在活动上详细介绍了数字和模拟 AI 芯片的 AI 新方法,它的数字 AI 芯片首次采用 8 位浮点数成功训练了深度神经网络,同时在一系列深度学习模型和数据集上完全保持了准确性。

这些更广泛的问题需要更大规模的神经网络、更大的数据集和多模态数据集,为此 IBM 需要改变架构和硬件来实现这一切。

IBM 大胆预测,GPU 在 AI 中的主导地位正在结束。GPU 能够为图形处理进行大量的并行矩阵乘法运算,这种矩阵乘法碰巧与神经网络所需的完全相同,这非常重要。

因为没有那些 GPU,我们永远无法达到我们今天在 AI 性能方面已经达到的性能水平。随着 IBM 掌握的更关于如何实现人工智能的知识,也在寻找设计出更高效硬件的方法和途径。

对于 32 位计算来说,必须在 32 位上进行计算。如果可以在 16 位上计算,那基本上是计算能力的一半,或者可能是芯片面积的一半甚至更少。

如果可以降到 8 位或 4 位,那就更好了。所以,这是在面积、功率、性能和吞吐量方面的巨大胜利——关乎我们能够以多快的速度完成这一切。

IBM 还在 IEDM 大会上展示了所谓的 8 位精度内存乘法与设计中的相变内存。IBM 发表了一项关于新型内存计算设备的研究,与当今的商业技术相比,该设备的计算能耗水平要低 100-1000 倍,非常适合于边缘 AI 应用,例如自动驾驶、医疗监控和安全性。

IBM 的不同之处是相信完整的 AI 解决方案需要加速推理和训练,其正在开发和逐渐发展成熟可用于推理和训练的非易失性内存元件。

结尾

随着英特尔和 IBM 在内的企业正积极探索超低功耗神经模态芯片在不同领域的应用,在未来几年内伴随 AI+IoT 的发展,神经模态计算将会迎来一波新的热潮。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179274
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1853

    浏览量

    76778
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106785
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    美国商务部推进收购英特尔10%股份 估值约达105亿美元

    据外媒报道;美国商务部正在积极推进收购英特尔10%股份。特朗普政府此前已经明确表示政府考虑将英特尔获批的联邦补贴转换为英特尔股权;联邦补贴就是此前的《芯片法案》拨款;估计为
    的头像 发表于 08-20 12:25 607次阅读

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算
    的头像 发表于 06-20 17:32 694次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘AI的“智能引擎”

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日,在
    发表于 05-20 11:03 1665次阅读

    英特尔宣布裁员20% 或2万人失业

    据外媒彭博社的报道,在当地时间4月24日,英特尔宣布裁员计划,比例超20%。按照截至2024年底英特尔在全球拥有108900名员工来计算的话,预计此次裁员将波及大约2.2万名员工。旨在精简管理,并重
    的头像 发表于 04-25 17:34 483次阅读

    2025英特尔人工智能创新应用大赛正式启动

    近日,2025英特尔人工智能创新应用大赛(以下简称“大赛”)正式启动。本届大赛以“‘码’上出发,‘芯’创未来”为主题,在赛制、规模、奖项和赛事支持上实现多重升级,为开发者和企业提供展示创意和成果的广阔平台,鼓励他们充分利用英特尔及合作伙伴丰富的软硬件资源,
    的头像 发表于 04-02 15:24 875次阅读

    为什么无法检测到OpenVINO™工具套件中的英特尔®集成图形处理单元?

    在 Ubuntu* Desktop 22.04 上安装了 英特尔® Graphics Driver 版本并OpenVINO™ 2023.1。 运行 python 代码: python -c
    发表于 03-05 08:36

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英特尔®NCS2运行演示时“无法在启动后找到启动设备”怎么解决?

    使用 英特尔® NCS2 运行 推断管道演示脚本 。 在首次尝试中成功运行演示应用程序。 从第二次尝试开始遇到错误:E: [ncAPI] [ 150951] [security_barrie
    发表于 03-05 06:48

    英特尔任命王稚聪担任中国区副董事长

    英特尔公司宣布,任命王稚聪先生担任新设立的英特尔中国区副董事长一职。王稚聪将全面负责管理英特尔中国的业务运营,直接向英特尔公司高级副总裁、英特尔
    的头像 发表于 03-03 10:54 878次阅读

    英特尔OpenVINO 2025.0正式发布

    生成式AI(GenAI)在模型质量与应用范围上持续爆发式增长,DeepSeek 等顶尖模型已引发行业热议,这种势头预计将在 2025年延续。本次更新聚焦性能提升、更多生成式AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化。让我们来一探究竟吧!
    的头像 发表于 02-21 10:20 1668次阅读
    <b class='flag-5'>英特尔</b>OpenVINO 2025.0正式发布

    探索座舱“未至之境”:英特尔支持DeepSeek车内本地运行

    超火的DeepSeek进入驾舱是什么样子?英特尔告诉你答案。在英特尔的软件定义汽车车载平台上跑DeepSeek-R1,从1.5B直到14B,能明显提升GPU内存的利用率,而第二代英特尔锐炫™B系列
    的头像 发表于 02-14 16:19 607次阅读
    <b class='flag-5'>探索</b>座舱“未至之境”:<b class='flag-5'>英特尔</b>支持DeepSeek车内本地运行

    英特尔获欧盟5.1555亿欧元利息赔付

    欧元反垄断罚款。当时,欧盟委员会认定英特尔在2002年至2007年间存在反竞争行为,指控其通过提供回扣等手段,阻止计算机制造商购买竞争对手AMD的芯片。 然而,经过长时间的法律较量,2022年欧盟普通法院发现欧盟委员会在经济分析方面存在重大缺陷,因此推翻
    的头像 发表于 02-06 11:30 728次阅读

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,英特尔也携手扣子共同推出Coze-AIPC端云协同智能体开发
    的头像 发表于 12-23 14:05 1233次阅读

    英特尔推出全新英特尔锐炫B系列显卡

    备受玩家青睐的价格提供卓越的性能与价值1,很好地满足现代游戏需求,并为AI工作负载提供加速。其配备的英特尔Xe矩阵计算引擎(XMX),为新推出的XeSS 2提供强大支持。XeSS 2的三项核心技术协同工作,共同提高性能表现、增强视觉流畅性并加快响应速度。 “   全新
    的头像 发表于 12-07 10:16 1920次阅读
    <b class='flag-5'>英特尔</b>推出全新<b class='flag-5'>英特尔</b>锐炫B系列显卡