0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于智能边缘计算的嵌入式深度学习推理解决方案

我快闭嘴 来源:千家网 作者:蒙光伟 2020-09-04 12:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在过去的几年中,人工智能领域已进入高速增长阶段,这在很大程度上受诸如深度学习(DL)和强化学习(RL)之类的机器学习方法的推动。这些技术的组合展示了在解决各种问题方面的空前性能,这些问题从以超人的角度玩Go到像专家一样诊断癌症。

在我们以前的博客中,智能物联网和雾计算趋势以及物联网中无处不在的计算机视觉的兴起,我们谈到了物联网中DL的一些有趣用例。应用将是广泛而深入的。它们将在未来几十年内刺激对新型处理器的需求。

深度学习工作流程概述

DL / RL创新正以惊人的速度发生(每年在众多与AI相关的会议上发表数千篇有关新算法的论文)。尽管预测最终的解决方案为时尚早,但硬件公司正在争相构建处理器、工具和框架。他们试图利用多年研究人员的经验来确定DL工作流程中的痛点和瓶颈。

训练DL模型的平台

让我们从培训平台开始。基于图形处理单元(GPU)的系统通常是训练高级DL模型的选择。Nvidia早已意识到将GPU用于通用高性能计算的优势。

GPU有数百个计算核心,它们支持大量的硬件线程和高吞吐量的浮点计算。 Nvidia开发了Compute Unified Device Architecture(CUDA)编程框架,使GPU友好地供科学家和机器学习专家使用。

CUDA工具链改善了耗时问题,为研究人员提供了一种灵活而友好的方式来实现高度复杂的算法。几年前,Nvidia恰当地发现了DL的机会,并为大多数DL运营不断开发CUDA支持。 Caffe、Torch和Tensorflow等标准框架均支持CUDA。

在AWS之类的云服务中,开发人员可以选择使用CPU还是GPU(更具体地说是Nvidia GPU)。平台的选择取决于神经网络的复杂性、预算和时间。基于GPU的系统通常可以比CPU减少训练时间几倍,但价格更高。

GPU / CPU的替代品

替代品来了。 Khronos在2009年提出了OpenCL,这是一种用于在各种硬件(例如CPU、GPU、DSPFPGA)上进行并行计算的开放标准。它将使其他处理器(如AMD GPU)进入DL培训市场,为开发人员提供更多选择。

但是,它在DL库支持方面仍落后于CUDA。希望这种情况在未来几年内会有所改善。英特尔还通过收购Nervana开发了针对DL培训定制的处理器。

DL推理的竞争格局

DL推理是一个竞争激烈的市场。通常可以根据用例的要求在多个级别上部署应用:

云/企业:图像分类、网络安全、文本分析、NLP等。

智能网关:生物识别、语音识别、智能代理等。

边缘端点:移动设备、智能相机等。

云推理

在Google、Facebook、百度或阿里巴巴等互联网巨头的大力推动下,云推理市场将实现巨大的增长。例如,Google Cloud和Microsoft Azure提供了非常强大的图像分类、自然语言处理和面部识别API,开发人员可以轻松地将其集成到他们的云应用中。

云推理平台将需要可靠地支持数百万并发用户。扩展吞吐量的能力至关重要。此外,降低能耗是控制服务运营成本的另一个重中之重。

在云推理空间上,除GPU外,数据中心还使用FPGA或定制处理器来使云推理应用更具成本效益和功效。例如,Microsoft Project Brainwave使用英特尔FPGA来证明在运行诸如CNN、LSTM等的DL算法时的强大性能和灵活性。

FPGA具有优势。硬件逻辑、计算内核和内存配置可针对特定类型的神经网络进行定制,从而使其更有效地处理预训练模型。但是,一个缺点是与CPU或CUDA相比编程困难。如上一节所述,OpenCL将有助于使FPGA对软件开发人员更加友好。

除了FPGA之外,Google还制造了定制的处理器,称为TPU。它是一种专注于高效矩阵计算的ASIC。但是,仅Google自己的服务支持该功能。

用于智能边缘计算的嵌入式DL推理

在边缘,DL推理解决方案需要解决针对不同用例和市场的多种需求。

自动驾驶平台

自动驾驶平台目前是最热门的市场,最新的DL和RL方法正在应用中,以实现最高水平的自动驾驶。 Nvidia一直领导着从Tegra到Xavier的几类DL SoC市场。 例如,Xavier SoC内置于Nvidia的Drive PX平台中,该平台可实现多达320个TFLOP。 它的目标是5级自动驾驶。

移动处理器

另一个快速增长的领域是移动应用处理器。 DL启用了智能手机上以前无法实现的新功能。 一个例子是苹果将神经引擎集成到A11 Bionic芯片中,从而使其能够在iPhone X上添加高精度面部锁定。

中国芯片制造海思半导体还发布了麒麟970处理器,该处理器具有神经处理单元(NPU)。 华为的一些最新智能手机(图4)已经使用新的DL处理器进行了设计。 例如,使用NPU,智能手机相机会“知道”正在查看的内容,并会根据场景的主体(例如人、植物、风景等)自动调整相机设置。

新架构

值得一提的是,有一类新的处理器,称为神经形态处理器,它紧密模仿人类大脑神经元和突触的机制。他们可以实现一种称为“脉冲神经网络(SNN)”的神经网络,它可以在空间和时间域中学习。

原则上,与现有的DL架构相比,它们具有更高的能源效率,并且在解决在线机器学习问题方面具有优势。

IBM的TrueNorth和英特尔的Loihi基于神经形态架构。研究人员正在探索这些芯片的功能,显示出一些潜力。目前尚不清楚何时将新型处理器准备用于广泛的商业用途。诸如Applied Brain Research和Brainchip之类的许多初创公司也专注于这一领域,开发工具和IP。

这是一个有趣的时代

在短短的几年内,AI / DL / RL / ML已成为许多行业的重要工具。从IP、处理器、系统设计到工具链和软件方法论的底层生态系统已经进入了快速的创新周期。新的处理器将支持许多以前无法实现的新物联网应用。

但是,物联网和机器学习应用仍在不断发展。芯片设计人员和开发人员将需要几代处理器才能提出正确的架构组合,从而满足各种市场的需求。在以后的文章中,我们将更深入地研究各种垂直领域的计算平台。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20332

    浏览量

    254917
  • 物联网
    +关注

    关注

    2950

    文章

    48126

    浏览量

    418368
  • 机器学习
    +关注

    关注

    67

    文章

    8564

    浏览量

    137217
  • 深度学习
    +关注

    关注

    73

    文章

    5607

    浏览量

    124625
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    紫光闪芯重磅发布EC100系列嵌入式eMMC产品

    2026年3月,紫光闪芯重磅发布专为AI推理边缘存储场景打造的嵌入式eMMC EC100系列产品,凭借核心团队深耕存储领域的技术积淀与国内完备的产业链协同优势,定位于中高端嵌入式存储
    的头像 发表于 04-07 11:49 1269次阅读

    虹科 owa5X 无线嵌入式计算机 工业级边缘计算终端与车载网关优选

    从工业级边缘计算终端到车载高性能边缘计算网关,从工业级嵌入式计算机到边缘
    的头像 发表于 02-10 17:08 240次阅读
    虹科 owa5X 无线<b class='flag-5'>嵌入式计算</b>机 工业级<b class='flag-5'>边缘</b><b class='flag-5'>计算</b>终端与车载网关优选

    嵌入式单片机开发学习路径

    嵌入式系统是现代科技的重要组成部分,广泛应用于智能家居、汽车电子、工业控制、医疗设备等领域。学习嵌入式单片机开发不仅能提升个人技能,还能开拓
    发表于 02-09 15:42

    从小白到大牛:Linux嵌入式系统开发的完整指南

    技术融合:嵌入式开发常需结合其他技术领域,如物联网(MQTT 协议、LwIP 协议栈)、人工智能边缘计算、TensorFlow Lite 部署)、实时系统(RT-Linux、Free
    发表于 12-16 10:42

    系统嵌入式学习路线

    嵌入式技术是各种电子产品的核心技术,也是工业4.0、远程医疗、3D打印等新兴产业的核心技术,具有广阔的发展前景。很多计算机、电子信息类专业的学生都想把嵌入式开发作为自己的职业目标,但是因为嵌入
    发表于 12-16 07:49

    分享一个嵌入式开发学习路线

    如果你想要学习嵌入式开发,我建议按照这个学习路线准备: 1. 基础铺垫期(1-2个月) 理解嵌入式系统的“硬件基础”和“编程入门”,能看懂
    发表于 12-04 11:01

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通过学习嵌入式技术提升就业竞争力,需重点掌握C语言、嵌入式硬件架构、RTOS/Linux开发、通信协议四大核心技能,并结合行业需求积累项目经验。
    发表于 10-21 16:25

    飞凌嵌入式FCU3501嵌入式控制单元:工业级边缘AI计算的“硬核担当”

    边缘计算设备的性能与稳定提出了更加严苛的要求。飞凌嵌入式推出的FCU3501嵌入式控制单元,正是为这类场景量身打造的“工业级AI计算引擎”。
    的头像 发表于 09-19 08:03 7530次阅读
    飞凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制单元:工业级<b class='flag-5'>边缘</b>AI<b class='flag-5'>计算</b>的“硬核担当”

    边缘计算嵌入式系统:物联网发展的新动力

    引言 随着物联网设备数量的持续增长,数据处理需求呈现指数级上升。传统的云计算模式在面对实时性、带宽与安全性要求时逐渐显得不足。在这种背景下, 边缘计算嵌入式系统的结合 ,正在为物联网
    的头像 发表于 09-05 16:32 1174次阅读

    Axelera AI:边缘计算加速智能创新解决方案

    。AxeleraAI凭借其卓越的AI加速解决方案,致力于协助企业快速部署高性能、低功耗的边缘计算平台,广泛应用于智慧城市、智慧交通及工业检测等领域。接下来说明AxeleraAI产品特色
    的头像 发表于 07-17 11:00 1094次阅读
    Axelera AI:<b class='flag-5'>边缘</b><b class='flag-5'>计算</b>加速<b class='flag-5'>智能</b>创新<b class='flag-5'>解决方案</b>

    大模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。
    发表于 07-03 19:43

    聚徽智控——从嵌入式边缘计算:平板工控电脑的技术进化论

    在工业数字化转型的浪潮中,平板工控电脑作为核心终端设备,正经历从嵌入式系统到边缘计算架构的范式革命。这一进化不仅重塑了设备的技术形态,更推动了工业互联从“数据采集”向“智能决策”的跨越
    的头像 发表于 06-13 13:48 1010次阅读

    嵌入式开发入门指南:从零开始学习嵌入式

    特定功能的计算机系统,广泛应用于智能家居、工业控制、医疗设备、车载系统等领域。 2. 学习嵌入式开发的前置知识熟悉C语言编程掌握基本的数据结
    发表于 05-15 09:29

    飞凌嵌入式2025嵌入式边缘AI技术论坛圆满结束

    飞凌嵌入式「2025嵌入式边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和工程师用户,共享
    的头像 发表于 04-28 13:57 4344次阅读
    飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>边缘</b>AI技术论坛圆满结束