0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高通NPU和异构计算提升生成式AI性能 

微云疏影 来源:综合整理 作者:综合整理 2024-03-06 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成式AI的变革已悄然降临。面对生成式AI的多元化用例需求和复杂的计算需求,我们亟待拥有专为AI打造的新型计算架构。为此,需要具备新型神经网络处理器(NPU)和中央处理器 (CPU)/图形处理器(GPU)等多核处理器的整合能力。通过配备专用的NPU并合理运用各类处理器资源,异构计算可以带来更出色的性能、更高的能效及持续耐久的电池寿命。

处理器的选择就像工具箱里寻找恰当工具,它会极大程度地提升生成式AI体验。

异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。每种处理器都有其独特的优点:CPU擅长有序操作和实时响应;GPU擅长并行数据流处理;NPU则专长于标量、向量和张量数学运算,成为核心AI工作负载的首选。这种异构计算策略有助于实现最佳的应用性能、能效和电池寿命,从而缔造出精美的生成式AI用户体验。

截至目前,专为NPU精心研制的NPU技术正随着AI应用场景和模型的演变而不断升级。

到底什么才是神经网络处理器NPU呢?NPU的使命便是以低功耗的方式加速AI推论,因此其架构亦需随着新的AI算法、模型和应用选择而有所升级调整。其主要任务是处理包含了标量、向量和张量数学在内的神经网络层计算以及非线性激活函数。一款优质的NPU需能精确处理相关AI工作负载,以便在目前的AI产业趋势下保持竞争力。

高通公司的第三代人工智能引擎(AI Engine)包含了先进的麻省理工学院授权的Kumu深度学习软件、Hexagon NPU,以及Vulcan向量处理引擎。

在AI行业,高通对异构计算的研究与投入堪称翘楚。其领先的骁龙850移动计算平台采用了全新的高通Hexagon 690 NPU,汇聚 AI Engine和Adreno 640/630 GPU的强大处理能力,实现了AI性能的大幅跃升。此外,这套AI Engine还囊括了先进的Vulkan向量处理引擎以及更为全面的高通传感器中枢和内存子系统等芯端部件。这些部件在终端侧共同协作,为用户提供极速有效的AI应用执行环境。

实践证明,采用骁龙850移动计算平台的设备在AI基准测评和实际生成式AI应用方面均表现出色,硕果累累。

为了更好地赋能开发者,高通推出了自家的AI软件栈( Qualcomm AI Stack)。利用这个工具包,开发者只需要编写一次代码,就能任意地点进行应用开发和适应性扩容。

通过将技术领导力、定制芯片设计、全栈AI优化和生态系统赋能充分结合,高通技术公司在推动终端侧生成式AI开发和应用方面独树一帜。高通技术公司正在赋能终端侧生成式AI的规模化扩展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247206
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11218

    浏览量

    222959
  • 生成式AI
    +关注

    关注

    0

    文章

    537

    浏览量

    1021
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文了解Mojo编程语言

    编程能力 允许直接进行系统调用和文件操作,提供类似 Rust 的内存安全机制(所有权和借用检查),避免运行时错误。 支持零成本抽象,开发者无需牺牲性能即可编写高层代码。 并行与异构计算 内置对多核
    发表于 11-07 05:59

    AI体验跃迁,天玑9500用双NPU开创端侧AI新时代

    架构,从底层解决性能与功耗的矛盾:超性能 NPU 990 性能大幅提升生成
    的头像 发表于 09-24 14:47 517次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创端侧<b class='flag-5'>AI</b>新时代

    PCIe协议分析仪能测试哪些设备?

    提升数据中心的整体效率,降低CPU负载。 四、异构计算与扩展设备 多GPU系统 测试场景:利用PCIe协议分析仪模拟负载的GPU间通信,测试PCIe交换机的性能和稳定性。 应用价
    发表于 07-25 14:09

    异构计算解决方案(兼容不同硬件架构)

    异构计算解决方案通过整合不同类型处理器(如CPU、GPU、NPU、FPGA等),实现硬件资源的高效协同与兼容,满足多样化计算需求。其核心技术与实践方案如下: 一、硬件架构设计 异构处理
    的头像 发表于 06-23 07:40 641次阅读

    如何释放异构计算的潜能?Imagination与Baya Systems的系统架构实践启示

    报告作者:PallaviSharma,Imaginaiton产品管理总监Dr.EricNorige,BayaSystems首席软件架构师关注Imagination公众号,消息框发送【异构计算】,即可
    的头像 发表于 06-13 08:33 835次阅读
    如何释放<b class='flag-5'>异构计算</b>的潜能?Imagination与Baya Systems的系统架构实践启示

    能效提升3倍!异构计算架构让AI跑得更快更省电

    电子发烧友网报道(文/李弯弯)异构计算架构通过集成多种不同类型的处理单元(如CPU、GPU、NPU、FPGA、DSP等),针对不同计算任务的特点进行分工协作,从而在性能、能效和灵活性之
    的头像 发表于 05-25 01:55 3458次阅读

    【米尔MYC-YM90X安路飞龙DR1开发板】安路科技 SALDRAGON开发板介绍

    )与FPGA可编程逻辑资源(如95K逻辑单元),支持异构计算。这种架构可同时满足复杂控制逻辑(由FPGA实现)与通用计算任务(由CPU处理)的需求,适用于工业自动化、机器人控制等场景。 集成度与低功耗
    发表于 04-28 17:57

    RAKsmart智能算力架构:异构计算+低时延网络驱动企业AI训练范式升级

    AI大模型参数量突破万亿、多模态应用爆发的今天,企业AI训练正面临算力效率与成本的双重挑战。RAKsmart推出的智能算力架构,以异构计算资源池化与超低时延网络为核心,重构AI训练基
    的头像 发表于 04-17 09:29 598次阅读

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    框架部署需大量手动优化,延误项目交付。 明远智睿RK3588核心板的核心优势 异构计算架构: 采用4×Cortex-A76(2.4GHz)+4×Cortex-A55(1.8GHz)设计,兼顾高性能
    发表于 04-15 10:48

    边缘AI协处理开发指南:USB+NPU混合计算与实时视频分析实战‌

    eFish-SBC-RK3576 ‌ 凭借 ‌ USB 3.0 + 内置NPU异构计算 ‌ 能力,为工业质检、安防监控等场景提供毫秒级响应的AI推理方案,成本仅为传统工控机的40%。 ‌1. 硬件
    的头像 发表于 03-27 10:42 680次阅读

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    制程、异构计算带宽内存和可重构架构展开,应用领域涵盖 AI、5G、数据中心、自动驾驶和工业物联网。通过优化生态系统、制定有效市场策略、应对挑战,FPGA 将在多个领域继续发挥关键作用。
    发表于 03-03 11:21

    聚云科技获亚马逊云科技生成AI能力认证

    的应用上展现出了卓越的能力。 聚云科技通过整合亚马逊云科技的先进技术,从应用范围确定、模型选择、数据处理、模型调优到应用集成与部署,为企业提供全方位的生成AI应用落地支持。这不仅加速了企业
    的头像 发表于 02-19 10:33 833次阅读

    RK3399处理器:高性能多核异构计算平台

    RK3399是一款高性能的多核异构计算平台,集成了强大的CPU、GPU以及丰富的多媒体和接口功能。其独特的双Cortex-A72+四Cortex-A53大小核CPU结构,使得RK3399在处理复杂
    的头像 发表于 02-08 18:04 2394次阅读

    异构计算的概念、核心、优势、挑战及考虑因素

    、DSP、FPGA、NPU 或专用 ASIC 等),针对各自擅长的任务进行协同处理,从而提升系统的整体性能、能效比或功能多样性。   可以将其比作一支由多种不同乐器组成的乐队:CPU 负责基础节奏和指挥,GPU 负责
    的头像 发表于 01-13 11:43 1665次阅读

    NVIDIA 推出高性价比的生成 AI 超级计算

    Jetson Orin Nano Super 可将生成 AI 性能提升至1.7 倍,支持科技爱好者、开发者和学生使用的主流模型。    
    发表于 12-18 17:01 949次阅读
    NVIDIA 推出高性价比的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算</b>机