0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI需要对硬件重新审视

姚小熊27 来源:读芯术 作者:读芯术 2020-11-09 09:41 次阅读

如今的人工智能存在一个很重要问题:太贵了。训练现代计算机视觉模型Resnet-152的成本大约为100亿浮点运算,这比起现代语言模型相形见绌。

训练OpenAI最新自然语言模型GPT-3预计耗费3000万亿浮点运算,其中在商用GPU上的成本至少为500万美元。与其相比,人类大脑可以识别面部、回答问题,且只需一杯咖啡就能驾驶汽车。

我们如何做到?

我们已经取得了很大的进展。

第一批电脑的产生有着特殊的目的。1822年,英国数学家查尔斯·巴贝奇(Charles Babbage)为了计算多项式函数创造了“差分机”。1958年,康奈尔大学教授弗兰克·罗森布拉特(Frank Rosenblatt)创造了“Mark I”,这是单层感知器的物理形式,用于机器视觉任务。硬件算法在早期是同一种东西。

硬件和算法的统一随着冯诺依曼体系架构的出现发生了变化,该架构具备由计算处理单元组成的芯片设计以及储存数据和程序指令的内存单元。这种模式上的转变使得建造可以针对任何任务进行编程的通用机器成为可能。冯诺依曼体系架构已经成为现代数字计算机的蓝图。

但是这里存在矛盾。数据密集型程序需要进行大量内存单元和计算单元间的通信,这会减缓计算速度。这个“冯诺依曼瓶颈”是人工智能早期尝试失败的原因。标准的CPU在深度神经网络的核心计算操作——大型矩阵乘法中效率不高。由于现有硬件的瓶颈,早期的神经网络存在技术搁浅并且表现不佳。

有趣的是,问题的解决办法不是来自学术界,而是来自游戏行业。在1970年代,为加速视频游戏发展而开发的GPU使得数据密集型操作与数千的计算内核并行化。这种并行化是解决冯诺依曼瓶颈的有效办法。GPU使得训练更深层次的神经网络成为可能,并且成为现代人工智能技术现行使用的硬件。

硬件彩票

人工智能领域研究的成功有很大的运气成分。谷歌研究员萨拉·胡克(Sara Hooker)称之为“硬件彩票”:早期的AI研究人员非常不幸,因为他们被速度缓慢的CPU困住了腿脚。在GPU出现时碰巧从事AI领域的研究人员“赢得了”硬件彩票。他们可以通过利用GPU的高效加速功能来训练神经网络,从而取得飞速的进展。

硬件彩票所体现的问题在于,一旦这整个领域中的人都成为了赢家,就很难探索出新事物。硬件的发展速度缓慢,需要芯片制造商进行大量回报不确定的前期投资。一个保险的做法就是对矩阵乘法进行优化,这已成为现状。然而长期来说,这种关注于硬件和算法一个特定组合的做法会限制我们的选择。

让我们回到最开始的问题。为什么当今的人工智能如此昂贵?答案可能是我们还不具备合适的硬件。硬件彩票的存在加以商业激励的机制,使得我们在经济上难以摆脱目前的现状。

一个很好的例子是Geoffrey Hinton的胶囊神经网络——一种新颖的计算机视觉方法。谷歌研究人员Paul Barham和Michael Isard发现这种方法在CPU上很有成效,但是在GPU和TPU上效果不佳。

这背后的原因是什么呢?加速器的优化都针对例如标准矩阵乘法等最频繁的操作,但缺少对胶囊卷积的优化。他们得出的结论(同时也是论文的标题)是:机器学习系统陷入困境。

AI研究人员可能会“过度适应”现有的硬件,从长远来看,这将抑制该领域的创新。

前进的道路

“取得下一步的突破可能需要采用一种本质与以往不同的角度:将硬件、软件与算法结合起来对世界进行建模。”

在人脑中,记忆和计算不是两个独立的部分,相反它们发生在同一个地点:神经元中。记忆来源于神经元通过突触连接在一起的方式,而计算来源于神经元触发并传播感官输入的信息的方式。就像早期的计算机一样,硬件和算法是同一个东西。这与我们当今构建人工智能的方法不同。

由GPU和TPU驱动的深度神经网络虽然在当今的许多任务中表现出色,但不是长远办法。也许它们只是硬件与算法的组合体系结构在广阔前景之下的局部最优解。

意识到仅有算法还远远不够是前进道路的开端。下一代的人工智能需要在硬件和算法方面都进行创新。在GPU出现之前,AI研究止步不前。如果没有硬件上的突破,我们可能会再次陷入发展停滞的困境。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 硬件
    +关注

    关注

    11

    文章

    2922

    浏览量

    64764
  • AI
    AI
    +关注

    关注

    87

    文章

    26430

    浏览量

    264036
  • 人工智能
    +关注

    关注

    1776

    文章

    43839

    浏览量

    230589
收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    。 NNRt host 实现了NNRt HDI接口功能,通过对接底层AI芯片接口为上层应用提供NPU硬件推理的能力。 功能实现 JS从相机数据流获取一张图片,调用Native的接口进行目标识别的处理
    发表于 04-11 16:14

    CES AI硬件层出不穷:你愿为AI的溢价买单吗?

    硬件AI
    电子发烧友网官方
    发布于 :2024年01月30日 16:36:00

    站在AGI拐点,重新想象老年生活

    此时此刻,或许是时候重新审视AI养老,审视科技适老化
    的头像 发表于 01-17 09:52 1686次阅读
    站在AGI拐点,<b class='flag-5'>重新</b>想象老年生活

    新火种AI|“赌城”上演“科技春晚”,AI硬件将在2024年大爆发

    如果说2023年是生成式AI元年,那么2024年将会是AI硬件的元年。
    的头像 发表于 01-12 18:26 621次阅读
    新火种<b class='flag-5'>AI</b>|“赌城”上演“科技春晚”,<b class='flag-5'>AI</b><b class='flag-5'>硬件</b>将在2024年大爆发

    墨芯人工智能CEO王维:需要重新定义和设计AI计算机

    AI时代,我们需要重新定义和设计AI计算机。仅依靠硅基的摩尔定律,2年翻一倍的线性增长的算力供给远不能满足指数级增长的需求问题。
    的头像 发表于 01-12 11:12 645次阅读

    当今的射频功率应用需要对等效串联电阻(ESR)和品质因子(Q)有充分了解

    当今的射频功率应用需要对等效串联电阻(ESR)和品质因子(Q)有充分了解
    的头像 发表于 12-04 15:08 345次阅读
    当今的射频功率应用<b class='flag-5'>需要对</b>等效串联电阻(ESR)和品质因子(Q)有充分了解

    为何我们需要对交换机进行VLAN的划分呢?

    为何我们需要对交换机进行VLAN的划分呢? 在网络通信中,VLAN(虚拟局域网)是一种将一个物理网络划分成多个逻辑上的局域网的技术。通过将不同的设备划分至不同的VLAN中,可以实现不同VLAN之间
    的头像 发表于 11-28 15:10 867次阅读

    使用AD2428不需要对总线供电,剩下的VSSN和SWP和sense引脚如何处理?

    你好, 我现在使用AD2428,不需要对总线供电,剩下的VSSN和 SWP和sense引脚如何处理? 下面示意图中的采用了本地供电后,master应该就应该没有总线电源过来了,红色框中直流通路代表的是什么?
    发表于 11-28 08:01

    开发单片机下位机需要对编译器很了解吗?

    如题所说,单片机下位机程序编写,需要对编译器很了解吗。 对单片机这种程序来说,都有哪些编译器编译代码。
    发表于 10-23 06:22

    Banana Pi BPI-M6开源硬件开发板AI目标检测算法测试 #AI #人工智能 #开发板 #开源硬件

    AI人工智能开源硬件
    Banana Pi开源硬件
    发布于 :2023年10月08日 15:04:23

    【KV260视觉入门套件试用体验】Vitis-AI加速的YOLOX视频目标检测示例体验和原理解析

    本文将介绍如何使用Vitis-AI加速YOLOX模型实现视频中的目标检测,并对相关源码进行解读。由于演示的示例程序源码是Vitis-AI开源项目提供的,本文演示之前会介绍所需要的准备工作。演示之后
    发表于 10-06 23:32

    从市场角度重新审视酒店用机器人

    从市场角度重新审视酒店用机器人偶然机会在深圳福田喜来登酒店参加一次外地政府合作交流会正好看到在一楼大厅办理退房手续区域放置一台XX机器人(基于多种原因考虑,具体厂家的名称不便在此如实告知)。随后
    的头像 发表于 09-07 08:16 498次阅读
    从市场角度<b class='flag-5'>重新</b><b class='flag-5'>审视</b>酒店用机器人

    国巨AI驱动硬件设备满足电力需求

    。这一类的需求是因为“大量的计算能力”转化为需要提供给计算引擎和支援系统的大量电力。因此国巨积极参与AI革命,以因应AI驱动的硬件设备(例如广泛使用的GPU)所产生的电力需求。 迎合
    的头像 发表于 09-04 09:26 529次阅读

    【KV260视觉入门套件试用体验】部署vitis-ai环境以及测试demo

    首先需要对新的petalinux进行烧录。 下载地址 https://docs.xilinx.com/r/3.0-%E7%AE%80%E4%BD%93%E4%B8%AD%E6%96%87
    发表于 08-27 23:35

    边缘AI开发,需要什么样的硬件平台及开发环境?

    ☞ 活动预告 物联网和人工智能(AI)的发展,让边缘AI的应用开发驶入了快车道。对于嵌入式开发者来讲,如何整合硬件平台和软件开发工具资源,构建一个边缘AI的开发平台,是关键的第一步,也
    的头像 发表于 07-07 08:15 412次阅读