0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

以NPU为首的AI芯片们,还有很长的路要走

ss 来源:镁客maker网 作者:家衡 2020-11-06 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为AI芯片的典型,目前华为、苹果等厂商都开始在NPU上发力。除此以外,开发者也在努力推进着手机端AI应用的发展。

NPU(Neural Processing Unit,神经网络处理器),一直都是华为发布会上的热门词汇,这次的麒麟9000同样将NPU标记在芯片结构图的C位。而库克在介绍最先进的A14处理器时,也着重提到了NPU。

早在2013年,高通公司就提出了“Zeroth”处理器的概念,这款处理器可以模仿类似人脑的认知能力,并实现自我学习的功能。

在高通的设想中,Zeroth的终极目标就是形成标准化的新型处理架构,并且第一次提出了NPU的概念,这种芯片已经具备了AI芯片的雏形。

2017年,华为海思推出了麒麟970,这款芯片首次内置了独立NPU。

在此之后,几乎所有的手机厂商都将AI作为新的亮点,一颗SoC芯片如果没有足够的AI算力,似乎都不能被拿到台面上介绍。

如今距离提出NPU的概念已经过去了七年,AI芯片在手机端的发展似乎并不如人意。

如何理解NPU

传统CPU进行累加计算时,效率非常低,但当GPU做类似的计算,效率就会高很多。同样的道理,GPU主要被用来进行图像处理,并没有针对神经网络计算进行特殊优化,这时候使用专业针对神经网络计算的NPU,就可以大大提高计算效率并减少功耗。

假设我们面前有一条没有桥的河,我们应当如何过河?这时候大脑就会涌出各种想法并且比较各种方法的优劣。

NPU的工作就类比大脑,在手机中模拟所有可行的方案,并从中挑选一个最优解。有了NPU之后,手机的AI性能就能得到大幅的提升。

从麒麟970的单核NPU、到最新的麒麟9000的2+1三核NPU,NPU的升级也伴着华为的AI技术的发展,最能直观体会到的就摄像功能带来的进步。

比如取景时的智能场景识别功能,可以让系统快速识别拍摄的物体和场景,并自动做出优化调教。再比如被广大消费者惊叹的“月亮模式”,以及强大的智能防抖功能,再包括最新的物体识别。

这些功能都是通过NPU来弥补华为手机在CMOS尺寸以及ISP(图像信号处理)上与其他厂商的差距。

在麒麟970推出之后,AI功能逐渐拓展,从手持超级夜景到语音助手、节能优化、智慧识别、识图翻译......越来越多的应用场景都开始运用AI加速运算,这些都得益于NPU的支持。

硬件层面,NPU可以代替CPU进行处理,让SoC具备了更强的本地AI运算能力(类似于“硬解”)。相比较CPU的“软解”,“硬解”效率更高、速度更快、功耗也更低。

但即便NPU功能十分强大,如今NPU在手机日常的应用领域还处于初级阶段,它的重要性还远不如CPU、GPU和ISP,属于锦上添花的存在。

例如高通骁龙AI Engine引擎之中就没有独立的NPU单元,而联发科在Helio P60/P90引入的NeuroPilot AI技术最早也是通过多个单元协同计算(APU+CPU+GPU)。

AI芯片只是第一步

有了AI芯片的支持,或许能增强手机AI能力,但目前的AI芯片却不能很好地适配所有的软件。

比如,很多直播APP都有实时美颜功能,可以利用降噪、颜色空间转换实现磨皮、滤镜等基础功能,但使用不同的软件可能会造成耗电量过高的异常,这就是软件层面的不适配。

从整个市场上来看,目前AI芯片还处于算法主导到产品主导的过渡期,由于各家AI芯片的设计不同,AI方案架构方面都有不小区别,像寒武纪的“DIANNAO”、谷歌的TPU,再到华为的达芬奇架构,目前AI芯片的设计可谓百花齐放。除此以外,还有单一针对卷积神经网络的ASIC加速器,以及支持简单编程的通用型AI芯片。

这些种类繁多的AI芯片,推动了AI技术在手机端的普及,但不可避免会带来一些问题。

AI应用需要开发者的努力

虽然各家的AI芯片都开始集成独立的神经网络处理单元,但是在设计上有很大不同,这意味着在运行机器学习应用方面,几家AI芯片在性能和能耗上有很大差别。因此,第三方开发者是否针对几家的芯片设计进行优化,或只支持某一种设计,会对系统性能产生重大影响。

目前,大多数移动AI芯片在机器学习方面做了较为普适性的优化,而对一些特定的计算方式则没有进行太多优化。

就算开发者开发出同一款AI应用,其兼容性可能会存在很多问题。当AI应用的开发进入到实际的应用和业务层面,开发者面临着标准不同、API配适、软件优化等很多的难题。也就导致开发者必须针对不同厂商的设备进行逐个优化。加之安卓生态比较混乱,移动AI开发者很可能受到更多阻碍。

就拿之前提到获得AI技术加持的照相功能来讲,除了在画面上的提升,还是有很多人都会吐槽华为手机存在过分美颜、过度锐化、颜色失真等问题,但这些问题在iPhone上就很少被提及。

一直以来,苹果在照片成像上的AI技术都调教的恰到好处,不论是自带相机还是第三方相机,“拍照真实”也成为iPhone的卖点之一,很多专业摄影师已经选择将iPhone作为便携街拍设备。相比而言,“傻瓜式”的安卓手机更偏向摄影小白。

不过随着安卓手机厂商和应用开发者不断对系统以及APP进行优化,现在的安卓手机拍照也变得更加智能。

所以,AI芯片只是提供了手机AI应用的基石,真正要挖掘出移动端AI的魅力,还需要开发者针对AI芯片的能力开发出合适的应用。

结语

目前,以AI芯片为基础打造一个AI应用生态圈的愿望真的十分美好,但这个过程还有很长的路要走。硬件走在了前面,软件也要跟得上。

在未来,NPU或许也会像当年FPU之于CPU一样,成为移动Soc芯片的标准。或许在未来我们能在智能手机上体会到更棒的AI应用。

至少在现在,以NPU为首的AI芯片们,还有很长的路要走。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260709
  • 苹果
    +关注

    关注

    61

    文章

    24585

    浏览量

    207427
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296578
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20834
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【RK3568 NPU实战】别再闲置你的NPU!手把手带你用迅为资料跑通Android AI检测Demo,附完整流程与效果

    【RK3568 NPU实战】别再闲置你的NPU!手把手带你用迅为资料跑通Android AI检测Demo,附完整流程与效果
    的头像 发表于 11-10 15:58 864次阅读
    【RK3568 <b class='flag-5'>NPU</b>实战】别再闲置你的<b class='flag-5'>NPU</b>!手把手带你用迅为资料跑通Android <b class='flag-5'>AI</b>检测Demo,附完整流程与效果

    如何利用NPU与模型压缩技术优化边缘AI

    随着人工智能模型从设计阶段走向实际部署,工程师面临着双重挑战:在计算能力和内存受限的嵌入式设备上实现实时性能。神经处理单元(NPU)作为强大的硬件解决方案,擅长处理 AI 模型密集的计算需求。然而
    的头像 发表于 11-07 15:26 1035次阅读
    如何利用<b class='flag-5'>NPU</b>与模型压缩技术优化边缘<b class='flag-5'>AI</b>

    国科微精彩亮相CPSE安博会2025,视觉AI洞见未来

    通过此次CPSE安博会,国科微不仅系统展示了从视觉AI到端侧计算的完整产品布局,更凸显了“圆鸮”AI ISP与自研NPU为核心的底层技术体系。面向未来,国科微将持续深耕端侧
    的头像 发表于 10-30 15:09 457次阅读
    国科微精彩亮相CPSE安博会2025,<b class='flag-5'>以</b>视觉<b class='flag-5'>AI</b>洞见未来

    巡检机器人落地攻略:RK3576驱动12低延迟视觉

    稳定在120~150ms。周五,联调 AI:靠 6TOPS NPU 做行人/闯入/火花异亮检测,异常帧打标签并切片保存;远端中控屏秒开回看。121080P@30fps H.264/H.265 硬编硬
    发表于 10-24 16:53

    工业视觉网关:RK3576赋能多路检测与边缘AI

    ~150ms6TOPS NPU 边缘AI推理易对接 MES / 追溯系统 一、产线痛点:从“人看”到“机判”的转变· 多工位/多角度同步:单机位覆盖不足,典型项目需 8~12 并发,且画面时序一致性要求高
    发表于 10-16 17:56

    AI体验跃迁,天玑9500用双NPU开创端侧AI新时代

    架构,从底层解决性能与功耗的矛盾:超性能 NPU 990 性能大幅提升,生成式 AI 引擎 2.0 深度加速 Transformer 与大模型;行业首个超能效 NPU存算一体实现
    的头像 发表于 09-24 14:47 514次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创端侧<b class='flag-5'>AI</b>新时代

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、分布式群体智能 1)物联网AGI系统 优势: 组成部分: 2)分布式AI训练 7、发展重点:基于强化学习的后训练与推理 8、超越大模型:神经符号计算 三、AGI芯片的实现 1、技术需求 AI取得成功
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱
    发表于 09-17 11:45

    AI芯片:科技探索与AGI愿景》—— 深入硬件核心的AGI指南

    存内计算、异构集成、光计算等前沿技术的突破性价值。书中配大量精心绘制的芯片架构图(如图1),将TPU、NPU等不同计算核心的设计哲学与优劣对比直观呈现,使复杂深奥的微架构知识变得易于理解
    发表于 09-17 09:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    的工作吗? 从书中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的还是知道的,FPGA属于AI
    发表于 09-12 16:07

    RK3576助力智慧安防:8高清采集与AI识别

    全屏/分屏切换,4G、Wi-Fi、双千兆以太网实现实时推流。3. 米尔RK3576核心板平台优势强大的算力:6TOPS NPU高性能:8视频+AI识别同时运行,CPU占用率仅34%低功耗:无风
    发表于 08-22 17:41

    搭载ARM,NPU,FPGA三种核心的开发板—米尔安DR1M90飞龙派

    最近我发现一个有趣的开发板。 这个开发板集合了ARM核心,NPU核心甚至还有FPGA核心。 它就是米尔新出的YM90X开发板。 它基于安科技所打造的芯片 上海安
    发表于 06-13 17:02

    有ARM,NPU,FPGA三种核心的开发板 — 米尔安路飞龙派开发板

    最近我发现一个有趣的开发板。这个开发板集合了ARM核心,NPU核心甚至还有FPGA核心。它就是米尔新出的YM90X开发板。它基于安科技所打造的芯片上海安
    的头像 发表于 06-13 08:03 1357次阅读
    有ARM,<b class='flag-5'>NPU</b>,FPGA三种核心的开发板 — 米尔安路飞龙派开发板

    超越CPU/GPU:NPU如何让AI“轻装上阵”?

    电子发烧友网报道(文/李弯弯)NPU是一种专门为人工智能(AI)计算设计的处理器,主要用于高效执行神经网络相关的运算(如矩阵乘法、卷积、激活函数等)。相较于传统CPU/GPU,NPU在能效比
    的头像 发表于 04-18 00:05 3281次阅读

    NPU性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562

    随着AI技术不断发展,越来越多的嵌入式设备开始集成NPU(神经网络处理单元),实现更高效的AI推理。作为国产芯片厂商的佼佼者,瑞芯微推出的
    的头像 发表于 04-03 11:17 6187次阅读
    <b class='flag-5'>NPU</b>性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562