0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超越CPU/GPU:NPU如何让AI“轻装上阵”?

Carol Li 来源:电子发烧友 作者:李弯弯 2025-04-18 00:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)NPU是一种专门为人工智能AI)计算设计的处理器,主要用于高效执行神经网络相关的运算(如矩阵乘法、卷积、激活函数等)。相较于传统CPU/GPU,NPU在能效比和计算速度上更具优势,尤其适合移动设备、边缘计算和嵌入式AI场景。

NPU有几大核心特点:其一是专用架构,针对神经网络计算优化,支持并行处理大量矩阵运算(如INT8/FP16低精度计算),典型操作包括卷积、池化、注意力机制(Transformer)等;其二是高能效比,相比GPU,NPU的功耗更低,适合手机IoT设备等对续航要求高的场景;其三是低延迟,专为AI推理(Inference)和训练(Training)优化,减少数据搬运开销;其四是异构计算,常与CPU、GPU、DSP等协同工作(如手机SoC中的“AI引擎”)。

NPU广泛应用于各类AI驱动的设备与系统,典型场景包括:智能手机,实现实时图像增强(如华为麒麟芯片的AI拍照)、语音助手、AR/VR交互等;可穿戴设备,支持低功耗的本地化AI计算(如智能手表的健康监测)。

自动驾驶,处理传感器数据,实现实时物体检测、路径规划和决策(如特斯拉FSD芯片)。典算力需求方面,L4级自动驾驶车辆NPU算力超1000 TOPS。

边缘计算,如智能摄像头,人脸识别、异常行为检测。物联网设备,本地化语音助手(如智能音箱的唤醒词识别)。

数据中心,加速AI模型训练和推理,典型应用如谷歌TPU(张量处理单元)。工业质检,推理时延压缩至20ms内,部署量年增120%。

典型NPU芯片有,如在移动端有华为麒麟芯片(达芬奇NPU),用于手机AI拍照、语音识别等;高通Hexagon DSP+NPU(骁龙平台),支持AI降噪、影像增强;苹果神经网络引擎(A/M系列芯片),Face ID、Siri等功能的底层支持。

在边缘计算和自动驾驶侧有特斯拉FSD芯片,内置NPU处理自动驾驶视觉模型;地平线征程芯片(BPU架构),用于智能驾驶感知计算。

在云端,有寒武纪MLU系列,云端AI训练/推理加速;英伟达Grace Hopper(集成NPU模块),大模型推理。

NPU的关键技术包括量化压缩,支持INT4/INT8低精度计算,提升能效;稀疏计算,跳过零值计算,加速稀疏模型(如Pruning后的网络);编译器优化,专用工具链(如华为Ascend CANN、高通AI Engine)将框架(TensorFlow/PyTorch)模型转换为NPU指令。

从趋势上来看,NPU有几个明显的发展方向:光电融合计算,结合光子学技术,进一步提升算力和能效;神经形态芯片,模仿生物神经元结构,实现更低功耗的AI计算;Chiplet技术,通过多NPU互联提升算力(如Cerebras的Wafer级芯片)。

总的来看,NPU作为AI计算的核心硬件,正深刻改变着人工智能技术的落地方式。其高并行性、低功耗和硬件加速能力,使其成为移动设备、自动驾驶、边缘计算等领域的首选解决方案。随着技术演进和市场需求的爆发,NPU将在未来AI生态中扮演更加重要的角色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134464
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296664
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20840
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中小企业别慌:轻量化设备系统成新宠,低成本落地

    它不用企业迁就技术,而是技术服务企业;不用投巨资,却能减停机损失、降维护成本、提效率。当设备故障不再半夜惊魂,当维修不靠 “老师傅经验”,中小企业才能轻装上阵,专注核心业务。
    的头像 发表于 10-23 14:04 639次阅读
    中小企业别慌:轻量化设备系统成新宠,低成本落地

    简化定位,从exgnss扩展库开始:GNSS开发从此“轻装上阵

    面对GNSS定位开发的重重挑战,exgnss扩展库为你减负!它整合了核心算法与硬件适配,开发者无需重复造轮子,即可快速构建稳定、低功耗的定位应用。
    的头像 发表于 09-16 17:43 662次阅读
    简化定位,从exgnss扩展库开始:GNSS开发从此“<b class='flag-5'>轻装上阵</b>”

    小微企业怕 “智能难用”?这套系统自动适配需求,上手不用懂技术

    当设备管理系统像智能手机般易用,每台设备都有 “健康管家”,小微企业才能真正享智能化红利,在竞争中轻装上阵
    的头像 发表于 09-12 10:47 278次阅读
    小微企业怕 “智能难用”?这套系统自动适配需求,上手不用懂技术

    JBD蜂鸟Ⅱ:轻装上阵、全彩出击,轻量化AR解锁全彩视觉体验

    显示体验,更深度释放了AI+AR视觉交互的潜力。 JBD“蜂鸟Ⅱ”彩色光引擎 极致小巧,释放产品设计自由度 随着AI大模型和智能体的快速迭代,AR智能眼镜正逐步发展为全天候AI助理,它不仅需要轻便舒适,还要在多模态交互中提供高质
    的头像 发表于 09-10 14:17 1.1w次阅读
    JBD蜂鸟Ⅱ:<b class='flag-5'>轻装上阵</b>、全彩出击,轻量化AR解锁全彩视觉体验

    轻装上阵,效率不减,职场打工人首选#戴睿 #戴睿笔记本

    笔记本
    jf_69630214
    发布于 :2025年08月21日 15:51:11

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    低功耗+高集成:红外热成像机芯如何助力消防设备轻装上阵

    在消防安全领域,快速、精准的温度监测是预防火灾、减少损失的关键。KC-2R02U-15工业测温机芯凭借其小型化设计、低功耗特性与高精度测温能力,成为消防集成设备的理想核心组件,助力构建智能化、高效化的安全防护体系。 体积小巧,灵活适配消防场景 消防设备需适应复杂环境,如狭窄空间、高空吊舱或移动机器人等。KC-2R02U-15机芯尺寸仅32.09mm×20mm×20mm,重量不超过22克,可轻松嵌入消防巡检机器人、无人机吊舱或固定式监控设备中,无需额外占用
    的头像 发表于 06-18 15:38 383次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB内存,32GBEMMC。 四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NPU,支持INT4/INT8/INT1
    发表于 05-15 10:36

    迅为iTOP-RK3588S开发板/核心板瑞芯微RK3588S处理器6TOPS算力内置NPU

    ,8GB内存,32GBEMMC。 四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NPU,支持INT4/INT8/INT1
    发表于 04-10 11:13

    iTOP-3588开发板采用瑞芯微RK3588处理器四核心架构GPU内置独立NPU强大的视频编解码

    硬件引擎将最大 限度地提高显示性能,并提供非常平稳的操作。 内置独立NPU RK3588集成了瑞芯微第四代具有完全自主知识产权的人工智能 运算引擎,6TOPs的NPU算力,赋能各类AI场景。 强大
    发表于 04-09 16:09

    RK3588性能设置 CPU GPU DDR NPU 频率设置

    RK3588 CPU GPU DDR定频策略
    的头像 发表于 02-15 16:09 2738次阅读

    【新品发布】国产实力破局!算力 “卷王” HZHY-AI210G,体积小巧,智能无人设备轻装上阵

    ★在AI大模型重塑生活的当下,科技浪潮正以破竹之势席卷而来。其中,无人机与机器人技术作为耀眼的“弄潮儿”,已然从科幻作品的想象走进现实生活,广泛应用于安防、农业、环境监测、物流配送等领域。然而,传统
    的头像 发表于 02-14 18:29 1020次阅读
    【新品发布】国产实力破局!算力 “卷王” HZHY-<b class='flag-5'>AI</b>210G,体积小巧,<b class='flag-5'>让</b>智能无人设备<b class='flag-5'>轻装上阵</b>

    NPU是如何发展起来的?性能受哪些因素影响?

    (电子发烧友网综合报道) NPU是一种专门用于加速神经网络计算的硬件处理器。随着人工智能和深度学习技术的快速发展,传统的CPUGPU在处理复杂的神经网络计算时显得力不从心,NPU正是
    的头像 发表于 02-05 07:50 3490次阅读

    2024年GPU出货量增长显著,超越CPU

    6%的同比增长,总量超过2.51亿颗,这一数据不仅彰显了GPU市场的繁荣,也反映了当前市场对于图形处理能力的巨大需求。 尤为值得一提的是,与同样作为计算机核心部件的CPU相比,GPU在2024年的出货量上占据了明显优势。据JPR
    的头像 发表于 01-17 14:12 825次阅读

    闻泰科技新战略、新发展:轻装上阵,聚焦半导体赛道

    2024年12月30日晚间,电子科技领域一则消息引发市场广泛关注:闻泰科技拟将公司及控股子公司拥有的部分与产品集成业务相关的标的公司股权和标的经营资产转让给立讯有限或其指定方。 闻泰科技在半导体与产品集成两大业务板块深耕,凭借为全球客户提供半导体功率器件、模拟芯片的全流程产品与服务,以及手机、平板等多品类终端产品研发制造,成为行业内不可忽视的力量,尤其在半导体领域,更是声名远扬。而立讯,以“果链一哥”闻名遐迩,
    发表于 01-03 11:38 824次阅读