0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

能效比达2TOPS/W!解密边缘AI芯片低功耗设计之法

Carol Li 来源:电子发烧友 作者:李弯弯 2025-05-17 00:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)边缘AI芯片低功耗设计是其在移动设备、物联网终端等资源受限场景中落地的关键。在物联网、可穿戴设备、智能家居等对功耗敏感的应用场景中,低功耗设计直接决定了设备的续航能力、部署成本及用户体验。

为什么边缘AI芯片需要低功耗设计?

从应用场景层面来看,首先是设备供电受限,如智能手表、无线传感器、可穿戴设备等依赖电池供电,低功耗设计直接决定续航时间。在太阳能、射频能量收集等自供电系统中,芯片功耗需低于能量收集速率,否则设备无法持续运行。

其二是部署环境苛刻,在工业监测、农业物联网等场景中,设备可能部署在难以更换电池或无法接线的区域。例如,桥梁结构监测传感器需连续工作数年,功耗需低于1mW。功耗过高会导致芯片发热,影响稳定性与寿命。例如,在汽车电子中,芯片需满足AEC-Q100标准,低功耗设计可减少热应力导致的失效风险。

从技术发展层面来看,首先,能效比(TOPS/W)是核心指标,边缘AI芯片需在有限功耗下提供高算力。例如,特斯拉FSD芯片以72W功耗实现144TOPS算力,能效比达2TOPS/W,满足自动驾驶实时性需求。低功耗设计可突破“功耗墙”限制。例如,传统GPU在移动端因功耗过高(>20W)难以应用,而专用边缘AI芯片可将功耗压缩至数百mW级。

其次,散热与封装成本约束,高功耗芯片需配备散热片或风扇,增加体积与成本。例如,桌面GPU功耗可达300W,需主动散热;而边缘设备芯片功耗需控制在5W以内,可采用被动散热。低功耗设计可简化封装要求。例如,采用Chiplet技术的边缘AI芯片通过2.5D封装降低互连功耗,同时减少对散热材料的需求。

边缘AI芯片低功耗设计方法

从硬件架构优化角度来看,如专用加速器NPU、DPU等,设计针对AI运算(如矩阵乘加)的专用电路,提升能效比。例如,Google TPU通过脉动阵列减少通用计算单元的冗余操作。如异构计算架构,结合CPU(控制)、GPU(并行计算)、NPU(AI推理)等模块,按任务类型动态分配计算负载。轻量级任务由CPU处理,复杂模型交由NPU,避免资源浪费。

还有一些创新架构设计方向,如存算一体化,减少数据搬运,在存储单元附近直接完成计算,降低I/O功耗。技术路径实现方面有存内计算、近内存计算。再如事件驱动架构,采用脉冲神经网络(SNN)或事件相机传感器,仅在数据变化时触发计算,减少静态功耗。

算法与模型优化角度来看,如模型压缩技术,剪枝,移除冗余神经元或权重(稀疏化),降低计算量;量化,将32位浮点模型转为8位整数,减少乘法器和内存访问能耗;知识蒸馏,用大模型训练轻量级学生模型,保持精度同时降低计算需求。
​​
如轻量级网络设计,使用MobileNet(深度可分离卷积)、EfficientNet(复合缩放)等结构,平衡精度与计算量。再如动态推理,在推理过程中设置检查点,若低层已足够准确,则提前终止计算。近似计算,允许非关键计算结果存在误差,简化运算(如低精度浮点、舍入策略)。

从动态电源管理角度,DVFS(动态电压频率调节),根据负载实时调整电压和频率,例如在空闲时进入低功耗模式(如C6睡眠状态)。多电源域划分,将芯片划分为多个电源域,按需开启或关闭(如摄像头模块仅在检测到运动时供电)。自适应功耗策略,结合负载预测(如LSTM预测任务周期),动态调整电源状态。

还有软件与系统协同方面,编译器优化,通过指令级并行(ILP)优化、内存访问合并,减少计算周期和能耗。操作系统调度,任务级功耗管理,优先调度低功耗核心处理简单任务,高负载时唤醒高性能核心。应用层策略,唤醒词检测(如Alexa的Always-On模式),仅运行轻量级模型,待检测到关键词后唤醒主模型。

小结:边缘AI芯片低功耗设计是其在真实场景中落地的必要条件,直接决定了设备的可用性、经济性和可持续性。通过硬件架构、算法优化、制程工艺等多维度协同,边缘AI芯片得以在毫瓦级甚至微瓦级功耗下运行,满足电池供电、实时响应、低成本部署等核心需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 边缘AI
    +关注

    关注

    0

    文章

    201

    浏览量

    5844
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业视觉网关:RK3576赋多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 一、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 路并发,且画面时序一致性要求高
    发表于 10-16 17:56

    酷芯ARS45:12nm制程+10TOPS/w解锁AI眼镜新可能

    数据实时传输带来的延迟、带宽压力以及隐私风险等问题日益凸显,同时终端设备智能化升级的刚性需求愈发迫切。   在此背景下,“云-边-端”协同计算架构应运而生,而边缘/终端AI芯片作为“端侧智能”的核心载体,其重要性不言而喻。它既
    的头像 发表于 07-21 09:10 7754次阅读

    Nordic收购 Neuton.AI 关于产品技术的分析

    与 Nordic 的 nRF54 系列超低功耗无线 SoC 结合,使得即使是资源极为有限的设备也高效运行边缘 AI。Nordic 目前正在将 Neuton 深度集成到自身开发生态中,
    发表于 06-28 14:18

    RK3576 vs RK3588:为何越来越多的开发者转向RK3576?

    电子RK3576低功耗、低成本、墨水平板优化 IoT/嵌入式设备RK3576比高,长期运行稳定 高端工控/边缘计算RK3588四通道内存,高带宽需求 RK3576 的核心优势:✅
    发表于 05-30 08:46

    轻松上手边缘AI:MemryX MX3+结合Orange Pi 5 Plus的C/C++实战指南

    AI边缘计算快速发展的时代,MemryX MX3+ 加速卡凭借其 20 TOPS 的强大性能和低功耗(5 TFLOPS/W),成为
    的头像 发表于 05-28 08:01 1014次阅读
    轻松上手<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>:MemryX MX3+结合Orange Pi 5 Plus的C/C++实战指南

    和算力提升的衡量方法

    一、的衡量方法 定义与计算公式‌ (EER)定义为制冷量与输入功率的比值,计算公式为
    的头像 发表于 04-28 07:47 2791次阅读
    <b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>比</b>和算力提升的衡量方法

    芯片为什么要做低功耗设计?

    和时钟频率提升导致静态功耗激增,漏电流问题加剧,传统设计模式难以满足需求‌。 高功耗引发芯片温度升高,需采用成本更高的封装和散热方案,同
    的头像 发表于 04-22 15:36 1039次阅读

    6TOPS算力NPU加持!RK3588如何重塑8K显示的边缘计算新边界

    框架,如TensorFlow、PyTorch等。这种架构设计使得芯片在处理AI任务时能够实现高效的并行计算,极大地提升了运算效率。在边缘计算场景中,无论是智慧城市的交通大屏,还是工业产线的实时监控
    发表于 04-18 15:32

    157 TOPS 算力!AIO-OrinNX 主板助力边缘 AI 应用

    Firefly最新推出NVIDlAJetsonOrin主板,搭载JetsonOrin系列核心模组,算力最高可达157TOPS,支持大模型私有化部署,为边缘AI应用的开发与部署提供强劲的算力支持
    的头像 发表于 04-02 16:33 2721次阅读
    157 <b class='flag-5'>TOPS</b> 算力!AIO-OrinNX 主板助力<b class='flag-5'>边缘</b> <b class='flag-5'>AI</b> 应用

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    低功耗特性。搭载 Renesas 独有的 DRP-AI 加速器,支持 15 Sparse TOPSAI 计算能力,使其在计算机视觉、边缘
    发表于 03-19 17:54

    炬芯科技再发端侧 AI音频芯片 ATS362X 低功耗大算力引爆音频新浪潮

    的ATS362X端侧AI芯片现正式发布。该芯片凭借三核异构架构、24bit无损音质和6.4 TOPS/W的超高能
    的头像 发表于 03-12 11:05 797次阅读

    炬芯科技ATS362X 低功耗大算力AI音频芯片

    的 ATS362X端侧AI芯片 现正式发布。该芯片凭借 三核异构架构、24bit无损音质和6.4 TOPS/W的超高能
    的头像 发表于 03-10 15:05 1603次阅读
    炬芯科技ATS362X <b class='flag-5'>低功耗</b>大算力<b class='flag-5'>AI</b>音频<b class='flag-5'>芯片</b>

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的国产化。 5.未来发展趋势• 高性能与低功耗并重:未来,FPGA将朝着更高性能、更低功耗的方向发展,以满足AI应用对算力和的双重需求。
    发表于 03-03 11:21

    AI边缘网关:开启智能时代的新蓝海

    ,可完成电力负荷精准预测、故障快速定位。据市场研究机构预测,到2025年,AI边缘网关市场规模将突破千亿美元,年复合增长率超过60%。 产业新机遇已经显现。对于硬件制造商,需要开发更高性能、更低功耗
    发表于 02-15 11:41

    进迭时空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介绍

    在不同 AI 平台上应用。(四)领先的算力能架构设计 :RISC - V 架构的精简和卓越的微架构设计。同负载场景功耗只有 ARM 芯片的 80%。
    发表于 01-06 17:37