0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NPU是什么?为何它是开启终端侧生成式AI的关键?

高通中国 来源:高通 2024-03-07 11:25 次阅读

生成式AI变革已经到来。随着生成式AI用例需求在有着多样化要求和计算需求的垂直领域不断增加,我们显然需要专为AI定制设计的全新计算架构。这首先需要一个面向生成式AI全新设计的神经网络处理器(NPU),同时要利用异构处理器组合,比如中央处理器(CPU)和图形处理器(GPU)。通过结合NPU使用合适的处理器,异构计算能够实现最佳应用性能、能效和电池续航,赋能全新增强的生成式AI体验。

正如在工具箱中选择合适的工具一样,选择合适的处理器取决于诸多因素,将增强生成式AI体验。

异构计算的重要性

生成式AI的多样化要求和计算需求需要不同的处理器来满足。支持处理多样性的异构计算架构能够发挥每个处理器的优势,例如以AI为中心定制设计的NPU,以及CPU和GPU。每个处理器擅长不同的任务:CPU擅长顺序控制和即时性,GPU适合并行数据流处理,NPU擅长标量、向量和张量数学运算,可用于核心AI工作负载。

异构计算能够实现最佳应用性能、能效和电池续航,以最大化发挥生成式AI终端用户体验。

NPU随着不断变化的AI用例和模型持续演进,实现高性能低功耗。

什么是神经网络处理器NPU(Neural Processing Unit)?

NPU专为实现以低功耗加速AI推理而全新打造,其架构随着新AI算法、模型和用例的发展不断演进。Al工作负载主要包括由标量、向量和张量数学组成的神经网络层计算以及非线性激活函数。优秀的NPU设计能够为处理这些AI工作负载做出正确的设计选择,与AI行业方向保持高度一致。

3d7919a2-db5d-11ee-a297-92fbcf53809c.png

高通AI引擎包括高通Hexagon NPU、高通Adreno GPU、高通Kryo或高通Oryon CPU、高通传感器中枢和内存子系统。

高通领先的NPU和异构计算解决方案

高通正在助力让智能计算无处不在。业界领先的高通Hexagon NPU面向以低功耗实现持续稳定的高性能AI推理而设计。高通NPU的差异化优势在于系统级解决方案、定制设计和快速创新。通过定制设计NPU并控制指令集架构(ISA),高通能够快速进行设计演进和扩展,以解决瓶颈问题并优化性能。

Hexagon NPU是高通业界领先的异构计算架构——高通AI引擎中的关键处理器,高通AI引擎还包括高通Adreno GPU、高通Kryo或高通Oryon CPU、高通传感器中枢和内存子系统。这些处理器为实现协同工作而设计,能够在终端侧快速且高效地运行AI应用。

我们在AI基准测试和实际生成式AI应用方面的行业领先性能表现就是例证。深入了解高通NPU、我们的其他异构处理器,以及在第三代骁龙8和骁龙X Elite上业界领先的Al性能。 可以登录高通网站。

3d904e7e-db5d-11ee-a297-92fbcf53809c.png

高通AI软件栈旨在帮助开发者一次编写,即可实现随时随地运行和规模化扩展。

赋能开发者加速生成式Al应用

我们专注于在全球搭载高通和骁龙平台的数十亿终端设备上实现便捷开发和部署,赋能开发者。利用高通AI软件栈(Qualcomm AI Stack),开发者可在高通硬件上创建、优化和部署AI应用,一次编写即可实现在不同产品和细分领域采用高通芯片组解决方案进行部署。

通过将技术领导力、定制芯片设计、全栈AI优化和生态系统赋能充分结合,高通技术公司在推动终端侧生成式AI开发和应用方面独树一帜。高通技术公司正在赋能终端侧生成式AI的规模化扩展。

本文内容来自高通技术公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉、高通技术公司技术市场总监Pat Lawlor的署名博客。

*骁龙和高通品牌产品是高通技术公司和/或其子公司的产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    76

    文章

    7163

    浏览量

    187881
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264044
  • 骁龙
    +关注

    关注

    2

    文章

    910

    浏览量

    36390
  • NPU
    NPU
    +关注

    关注

    2

    文章

    210

    浏览量

    18083
  • 生成式AI
    +关注

    关注

    0

    文章

    349

    浏览量

    212

原文标题:NPU是什么?为何它是开启终端侧生成式AI的关键?

文章出处:【微信号:Qualcomm_China,微信公众号:高通中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI加速向终端侧演进,NPU、异构计算提供强大算力支持

    年的400亿美元,增长至2032年的1.3万亿美元,年复合增速达到42%。   生成AI终端快速演进   当前大部分生成AI的开发工
    的头像 发表于 03-16 00:16 2392次阅读

    国产生成AI,不能仅仅看向前方#生成AI #信息无障碍

    AI
    脑极体
    发布于 :2023年06月15日 19:06:36

    请问NPU到底是什么?

    目前手机市场中,AI已成为标配,但手机里的AI够不够聪明,还得看手机芯片里的NPU是否够强大。那么,NPU到底是什么呢?
    发表于 12-08 07:00

    基于RKNN程序开发和模型转换的NPU简要说明

    使用 “PCIE连接的NPU” 会比使用 “USB3.0方连接的NPU” 在实际推理速度上慢很多。为了解决这个问题,我们制作了相关PCIE-NPU加速补丁,最终结果是推理速度追平“U
    发表于 05-31 11:10

    AIO-3399ProC NPU开发相关资料推荐

    传输。所以导致使用 “PCIE连接的NPU” 会比使用 “USB3.0方连接的NPU” 在实际推理速度上慢很多。为了解决这个问题,我们制作了相关 PCIE-NPU加速补丁 ,最终结果
    发表于 07-01 17:38

    国产AI芯崛起!RK3568让人脸识别终端更强大

    RK3568集成Rockchip自研NPU,1TOPS算力,满足轻量级端AI计算。并提供简单易用的模型转换工具RKNN-Toolkit,支持Caffe / TensorFlow / TF-Lite
    发表于 09-13 14:00

    用嵌入AI技术提升智能硬件应用能力

    设备、汽车电子、机器人等行业,嵌入AI一定会频繁出现。 嵌入AI,即将嵌入AI结合起来,
    发表于 10-09 14:33

    华为麒麟980双核NPU谜底揭开:还是来自寒武纪科技

    关键词:寒武纪 , 人工智能 , 麒麟980 , NPU 来源:快科技 华为麒麟970通过集成NPU神经网络单元,开启了手机AI时代,不过这
    发表于 11-14 12:47 269次阅读

    华为麒麟980的双核NPU是自研的吗

    华为麒麟970通过集成NPU神经网络单元,开启了手机AI时代,不过这个NPU并非华为自研,而是来自AI独角兽寒武纪科技的A1处理器IP。
    的头像 发表于 11-14 16:50 4500次阅读

    关于生成AI关键技术

    生成AI关键技术是生成式对抗网络(GANs, Generative Adversarial Networks ),其本质是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方
    的头像 发表于 10-17 09:27 1867次阅读

    高通WAIC展示两大终端生成AI技术 AI引擎获奖

    赋能等多个角度,描绘了混合AI赋能的智能未来。同期,第二代骁龙8的高通AI引擎获得大会最高奖项——SAIL奖(卓越人工智能引领者奖);高通还在现场带来了其强大终端AI赋能的
    的头像 发表于 07-07 19:58 572次阅读
    高通WAIC展示两大<b class='flag-5'>终端</b>侧<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>技术 <b class='flag-5'>AI</b>引擎获奖

    npu是什么意思?npu芯片是什么意思?npu到底有什么用?

    。正如CPU和GPU一样,NPU也是一种专门的处理器芯片,但不同于前二者,NPU被用于深度学习领域。NPU在深度学习领域的应用可以提高运算速度,降低功耗,加速推理流程等。 NPU技术介
    的头像 发表于 08-27 17:03 2.6w次阅读

    高通在2023骁龙峰会上推动突破性的生成AI落地多品类终端

    要点 — •  全新骁龙平台展现了面向众多生成AI终端和应用的绝佳终端AI性能,更加注重即时性、可靠性、个性化和隐私。 •  骁龙X E
    的头像 发表于 10-25 10:30 183次阅读
    高通在2023骁龙峰会上推动突破性的<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>落地多品类<b class='flag-5'>终端</b>

    高通在2023骁龙峰会上推动突破性的生成AI落地多品类终端

    要点 • 全新骁龙平台展现了面向众多生成AI终端和应用的绝佳终端AI性能,更加注重即时性、可靠性、个性化和隐私。 • 骁龙X Elite
    发表于 10-25 11:46 97次阅读
    高通在2023骁龙峰会上推动突破性的<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>落地多品类<b class='flag-5'>终端</b>

    高通NPU和异构计算提升生成AI性能 

    异构计算的重要性不可忽视。根据生成AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 221次阅读