0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习的发展会带给硬件架构怎样的影响?

张康康 2019-07-29 18:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


2019 ISSCC 大会于2月17—21日在美国旧金山开幕,Facebook 首席 AI 科学家 Yann LeCun 在会上发表了主题演讲「深度学习硬件:过去、现在和未来」,详细介绍了深度学习研究的发展将如何影响未来硬件架构。

如今,只要在网络上搜索“深度学习”算法,都会显示很多相关的信息,在过去的数十年里,人工智能已经越来越成功地应用于生物识别、语音识别、视频识别、翻译等。国内更是诞生了诸如旷视科技、商汤科技、极链科技Video++、依图科技等优秀人工智能初创企业。设计人员将大量高度并行的计算加载到硬件上,尤其是最初为快速图像渲染而开发的图形处理单元(GPU)。这些芯片特别适合于计算密集型“训练”阶段,该阶段使用许多经过验证的例子来调整系统参数。在“推理”阶段,其中部署深度学习处理的输入,需要更大的存储器访问和快速响应,目前已经可以使用GPU实现。

深度学习与GPU

为了快速应对增长的需求,许多公司都正在开发能够直接赋予深度学习能力的硬件,迫切的需要进行推理以及培训。近年来随着深度学习的迅速发展,卷积神经网络(Convolutional Neural Network)被广泛使用,特别是在图像识别场景中的应用。为了满足更多场景应用,需要有一种能够根据实际场景需求替换不同CNN网络模型的系统框架。在过去的20年里,视频、游戏等产业推动了GPU的进步,其绘制图形所需的矩阵正是深度学习所需的计算类型。

GPU技术的进步则是推动了神经网络的发展,因为在没有GPU的情况下训练深度学习模型在大多数情况下会非常缓慢。许多人把生产中深度学习的想法想的过于复杂,我们可以在生产中使用CPU和选择的网络服务器进行深入学习。生产中进行训练是非常罕见的。即使你想每天更新你的模型权重,也不需要在生产中进行训练。这意味着你只是在生产过程中进行“推理”,比“培训”更快更容易。你可以使用任何你喜欢的Web服务器,并将其设置为简单的API调用。如果能够有效地批量处理数据,GPU只会提供更快的速度。

GPU在处理图形的时候,从最初的设计就能够执行并行指令,从一个GPU核心收到一组多边形数据,到完成所有处理并输出图像可以做到完全独立。由于最初GPU就采用了大量的执行单元,这些执行单元可以轻松的加载并行处理,而不像CPU那样的单线程处理。另外,现代的GPU也可以在每个指令周期执行更多的单一指令。所以GPU比CPU更适合深度学习的大量矩阵、卷积运算的需求。深度学习的应用与其原先的应用需求颇为类似。GPU厂家顺理成章的在深度学习,找到了新增长点。

深度学习发展是否出现“瓶颈”

我们之所以使用GPU加速深度学习,是因为深度学习所要计算的数据量异常庞大,用传统的计算方式需要漫长的时间。但如果未来深度学习的数据量有所下降,或者说我们不能提供给深度学习所需要的足够数据量,是否就意味着深度学习也要进入“瓶颈”了呢?

做深度神经网络训练需要大量模型,然后才能实现数学上的收敛。深度学习要真正接近成人的智力,它所需要的神经网络规模非常庞大,它所需要的数据量,会比我们做语言识别、图像处理要多得多。假设说,我们发现我们没有办法提供这样的数据,则很有可能出现瓶颈。

目前,深度学习还在蓬勃发展往上的阶段。比如我们现阶段主要做得比较成熟的语音、图像、视频方面,整个的数据量还是在不断的增多的,网络规模也在不断的变复杂。可以说深度学习是GPU计算发展的关键,谁能找到最适合深度学习的模式,谁就是胜利者。

结语:

深度学习经过这么长时间的发展,在网络的种类、复杂程度和处理的信息量上都发生了天翻地覆的变化。当前,网络种类上,从早期的 AlexNet 和 GoogleNet 到现在各企业推出的 GAN以及各种深度强化学习的网络,它们各自网络结构都有不同,开发者在适应最新的网络上常常会遇到一些麻烦。处理的信息量也在成倍地增长,算力需求越来越高的情况下,也将对搭载处理单元的硬件有着更高的要求。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124634
  • 深度学习技术

    关注

    0

    文章

    11

    浏览量

    6955
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能与机器学习在这些行业的深度应用

    自人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器学习(ML)的深度应用,彻底重塑了整个行业的
    的头像 发表于 02-04 14:44 684次阅读

    机器学习深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注数据、模型
    的头像 发表于 01-07 15:37 350次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    的亮点及优势? 一、课程亮点 工业级案例:包含双CCD光学分选转盘、机械手手眼协调等12个完整项目 源码交付:所有案例提供LabVIEW源代码,包含深度学习模型DLL 硬件联动:支持工业相机硬触发
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    的亮点及优势? 一、课程亮点 工业级案例:包含双CCD光学分选转盘、机械手手眼协调等12个完整项目 源码交付:所有案例提供LabVIEW源代码,包含深度学习模型DLL 硬件联动:支持工业相机硬触发
    发表于 12-03 13:50

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 330次阅读

    请问UART硬件FIFO深度是多少?如何避免数据溢出?

    UART 硬件 FIFO 深度是多少?如何避免数据溢出?
    发表于 11-21 06:59

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    、Transformer 模型的后继者 二、用创新方法实现深度学习AI芯片 1、基于开源RISC-V的AI加速器 RISC-V是一种开源、模块化的指令集架构(ISA)。优势如下: ①模块化特性②标准接口③开源
    发表于 09-12 17:30

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概
    的头像 发表于 09-10 17:38 1049次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 4367次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    AI芯片:加速人工智能计算的专用硬件引擎

    人工智能(AI)的快速发展离不开高性能计算硬件的支持,而传统CPU由于架构限制,难以高效处理AI任务中的大规模并行计算需求。因此,专为AI优化的芯片应运而生,成为推动深度
    的头像 发表于 07-09 15:59 1961次阅读

    Transformer架构概述

    由于Transformer模型的出现和快速发展深度学习领域正在经历一场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多
    的头像 发表于 06-10 14:24 1446次阅读
    Transformer<b class='flag-5'>架构</b>概述

    上能电气即将亮相上海SNEC展会

    随着上海SNEC展会临近,行业再次聚焦“技术创新”与“系统价值”的深度融合。“430政策”与“531政策”的相继实施,标志着行业加速迈向高质量发展新阶段。
    的头像 发表于 05-30 16:10 914次阅读

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2025次阅读
    GPU<b class='flag-5'>架构</b><b class='flag-5'>深度</b>解析

    解锁未来汽车电子技术:软件定义车辆与区域架构深度解析

    解锁未来汽车电子技术:软件定义车辆与区域架构深度解析 ——立即下载白皮书,抢占智能汽车发展先机 *附件:解锁未来汽车电子技术:软件定义车辆与区域架构
    的头像 发表于 04-27 11:58 1614次阅读