0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何设计更智能的Edge AI

星星科技指导员 来源:嵌入式计算设计 作者:Tony King-Smith 2022-07-10 11:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一名拥有 40 多年半导体业务研发总监和 CMO 经验的工程师,我认为我自己和我的同行是合乎逻辑的。然而,我们当中有多少人可以诚实地说我们没有被诸如“我的小部件比你的快?”这样的说法所诱惑。恐怕这只是人性,尤其是当我们对你的专业知识没有信心来调查这些说法时。

问题始终是一个定义:我如何定义“更快”或“更低功率”或“更便宜”?这是基准试图解决的问题——它是关于具有一致的上下文和外部标准,以确保您将同类与同类进行比较。任何使用基准测试的人都非常清楚这一点(aiMotive 诞生于一家领先的 GPU 基准测试公司)。

在尝试比较汽车 AI 应用的硬件平台时,解决这种轰炸式索赔的需求从未像现在这样紧迫。

10 TOPS 什么时候不是 10 TOPS?

无论是否有专用的 NPU,大多数 SoC 都将其执行 NN 工作负载的能力称为 TOPS:每秒 Tera 操作。这只是 NPU(或整个 SoC)原则上每秒可以执行的算术运算总数,无论全部集中在专用 NPU 中还是分布在多个计算引擎中,例如 GPU、CPU 矢量协处理器、或其他加速器。

但是,没有任何硬件执行引擎能以 100% 的效率执行任何工作负载的各个方面。对于神经网络推理,某些层(例如池化或激活)在数学上与卷积非常不同。在卷积本身(或其他层,如池化)可以开始之前,数据必须重新排列或从一个地方移动到另一个地方。其他时候,NPU 可能需要等待来自控制它的主机 CPU 的新指令或数据,每个层甚至每个数据块。这些都导致完成的计算更少,从而限制了理论上的最大容量。

硬件利用率——不是它看起来的样子

许多 NPU 供应商会引用硬件利用率来表明他们的 NPU 执行给定 NN 工作负载的情况。这基本上是说,“这就是我的 NPU 的理论容量有多少被用于执行 NN 工作负载。” 当然,这告诉我我需要知道什么。

不幸的是没有。硬件利用率的问题是定义之一:数量完全取决于 NPU 供应商选择如何定义它。事实上,硬件利用率和 TOPS 的问题在于它们只告诉你硬件引擎理论上能够实现什么,而不是它实现的程度。

这可能会导致一些误导性信息。下面的图 1 显示了我们在额定 4 TOPS 的 aiWare3P NPU 与另一个额定为 8 TOPS 的知名 NPU 之间进行的比较。

poYBAGLKR_eAck4HAACgiX1heSI601.png

图 1:两个汽车推理 NPU 的利用率与效率比较

对于两个不同的知名基准,竞争对手 X NPU 声称 8 TOPS 容量,而 aiWare3P 的 4 TOPS。这应该意味着它将提供大约 2 倍于 aiWare3P 的 fps 性能。然而,实际上,情况正好相反:aiWare3P 的性能提高了 2 到 5 倍,尽管它只是声称的 TOPS 的一半!

结论:TOPS 是衡量 AI 硬件能力的一种非常糟糕的方法;硬件利用率几乎与 TOPS 一样具有误导性。

NPU 效率和自主性:优化 PPA 的关键

这就是为什么我认为您必须根据执行一组代表性工作负载时的效率而不是原始理论硬件容量来评估 NPU 能力。效率定义为为一帧执行特定 CNN 需要多少操作,占声称的 TOPS 总数的百分比。该数字仅基于定义任何 CNN 的基础数学算法计算得出,无论 NPU 实际如何评估它。它比较了实际与声称的性能,这才是真正重要的。

展示出高效率的 NPU 意味着它将充分利用用于实现它的每平方毫米硅片,这意味着更低的芯片成本和更低的功耗。效率可为汽车 SoC 或 ASIC 提供最佳 PPA(性能、功率和面积)。

NPU 的自治性是另一个重要因素。NPU 在主机 CPU 上放置多少 CPU 负载才能达到最高性能?这与内存子系统有什么关系?NPU 必须被视为任何 SoC 或 ASIC 中的大块——它对芯片和子系统其余部分的影响不容忽视。

结论

在设计任何 SoC 或 ASIC 汽车时,AI 工程师必须专注于构建能够可靠执行其算法的生产平台,同时实现卓越的 PPA:最低功耗、最低成本、更高性能。他们还必须在设计周期的早期就选择硬件平台,通常是在开发最终算法之前。

效率是实现这一目标的最佳方式;TOPS 和硬件利用率都不是好的衡量标准。如果要满足苛刻的生产目标,评估 NPU 的自主性也至关重要。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11327

    浏览量

    225878
  • soc
    soc
    +关注

    关注

    40

    文章

    4624

    浏览量

    230170
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302579
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MathWorks携手EDGE AI Foundation:重塑嵌入式AI工程化落地新范式

    近日,全球工程计算软件领导者MathWorks宣布正式加入EDGE AI Foundation(边缘人工智能基金会),这一战略举措标志着嵌入式AI领域迎来关键转折点。作为MATLAB
    的头像 发表于 04-23 10:38 423次阅读

    MathWorks 加入 EDGE AI FOUNDATION,推进面向工程化系统的嵌入式 AI 发展

    全新合作将支持工程师在 MATLAB 和 PyTorch 中构建 AI 模型,将其集成到系统仿真中,并部署到嵌入式设备 MathWorks 近期宣布加入 EDGE AI FOUNDATION。该组织
    的头像 发表于 04-17 15:46 106次阅读

    使用NORDIC AI的好处

    × 在 CPU 上运行时可快 10×、省电,平均模型体积 <5 KB。[Edge AI 软件页] Axon NPU 对同一 TensorFlow Lite 模型:* 推理速度最高可比
    发表于 01-31 23:16

    IBM Rhapsody AI 助手:让系统工程智能

    IBM Rhapsody AI 能力的加入,标志着系统工程正逐步迈入智能化新阶段。它让模型不再只是“被动表达设计意图”的工具,而成为能理解、能推理、能生成的智能伙伴。在 AI 时代,系
    的头像 发表于 01-06 11:34 434次阅读
    IBM Rhapsody <b class='flag-5'>AI</b> 助手:让系统工程<b class='flag-5'>更</b><b class='flag-5'>智能</b>

    联想集团想帮帮服务智能体荣膺2025 EDGE AWARDS最佳AI创新应用

    2025年12月21日,钛媒体2025 EDGE AWARDS全球创新评选正式收官,想帮帮服务智能体凭借其卓越的创新技术和应用实力,成功入选年度创新AI榜,并荣膺「最佳AI创新应用奖项
    的头像 发表于 12-30 11:26 762次阅读

    探索PSOC Edge E84 AI Kit:开启下一代机器学习边缘设备设计之旅

    Edge E84 AI Kit概述 PSOC Edge E84 AI Kit旨在助力机器学习(ML)和人工智能
    的头像 发表于 12-18 14:45 894次阅读

    天数智算AI+HOME解决方案:重构家庭智能生态,让家懂你​

    当你下班回家,家门自动解锁,客厅灯光渐次亮起,电视同步播放你追的剧集,厨房飘出预约烹饪的饭菜香 —— 这样的智能生活场景,不再是科幻电影的想象。天数智算全新推出AI+HOME解决方案,以AI
    的头像 发表于 12-12 09:18 783次阅读
    天数智算<b class='flag-5'>AI</b>+HOME解决方案:重构家庭<b class='flag-5'>智能</b>生态,让家<b class='flag-5'>更</b>懂你​

    英飞凌推出专为PSOC Edge微控制器优化的DEEPCRAFT AI套件

    【2025年10月16日, 德国慕尼黑讯】在这个万物互联的世界中,边缘人工智能Edge AI)正在重新定义人们的生活、工作与互动方式。为推动这一变革,全球功率系统和物联网领域的半导体领导者英飞凌
    的头像 发表于 10-28 09:08 565次阅读

    AI赋能6G与卫星通信:开启智能天网新时代

    连接到6G网络,AI确保了即使在信号较弱的情况下,也能提供高质量的通信服务。 AI让\"天网\"智能 随着技术的不断进步,AI在6G和卫星
    发表于 10-11 16:01

    【今晚7点半】正点原子 x STM32:智能加速边缘AI应用开发!今晚正点原子B站直播间等你

    【联合直播】正点原子 x STM32:智能加速边缘AI应用开发! 一、直播介绍 随着人工智能技术在边缘计算领域的快速发展,STM32系列芯片凭借其卓越的性能与丰富的生态,成为众多智能
    发表于 09-25 14:14

    AI如何让家电懂你

    自生成式 AI 爆发以来,多模态 AI智能终端尤其是「具身智能」等领域迅速发展。在智能家电等设备中集成
    的头像 发表于 08-21 16:52 1257次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK
    发表于 07-04 11:14

    2.0.0版本的ST Edge AI Core在linux平台上可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件,为什么?

    2.0.0版本的ST Edge AI Core工具在linux平台上应该是可以把量化后的onnx模型转换为.nb,但是运行报错,缺少文件。
    发表于 06-17 06:29

    AMD第二代Versal AI Edge和Versal Prime系列加速量产 为嵌入式系统实现单芯片智能

    我们推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,这两款产品是对 Versal 产品组合的扩展,可为嵌入式系统实现单芯片智能
    的头像 发表于 06-11 09:59 2073次阅读

    2025研华嵌入式设计论坛上海站:聚焦Edge Computing &amp;amp; Edge AI,共探技术创新与生态融合

    Computing与Edge AI领域的最新技术进展、创新应用及生态构建。   一、引领前沿技术,洞见未来趋势 论坛在研华科技嵌入式物联网事业群(中国)总经理许杰弘先生的致辞中拉开序幕。他以“边缘智能聚势未来,生态链接驱动创新
    发表于 05-30 11:56 1284次阅读
    2025研华嵌入式设计论坛上海站:聚焦<b class='flag-5'>Edge</b> Computing &amp;amp; <b class='flag-5'>Edge</b> <b class='flag-5'>AI</b>,共探技术创新与生态融合