0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI加速向终端侧演进,NPU、异构计算提供强大算力支持

Carol Li 来源:电子发烧友 作者:李弯弯 2024-03-16 00:16 次阅读

电子发烧友网报道(文/李弯弯)生成式AI是一种通过学习大规模数据集生成新的原创内容的新型AI。Bloomberg Intelligence最新报告预测,未来10年内,生成式AI市场规模将从2022年的400亿美元,增长至2032年的1.3万亿美元,年复合增速达到42%。

生成式AI向终端快速演进

当前大部分生成式AI的开发工作都集中在云端,然而生成式AI正朝着直接在终端上运行的方向快速演进。高通公司总裁兼CEO安蒙前不久谈到,生成式AI将变革终端侧的用户体验,具备生成式AI能力的PC能够更好地理解用户需求,生成式AI还将带来全新的人车交互方式,支持用户与汽车直接进行对话。他认为,生成式AI将为各行各业带来全新机遇。

近段时间,生成式AI在手机、PC等终端设备上已经有不少用例。最近推出的新手机,就有不少生成式AI的应用,比如,OPPO Find X7Ultra的AIGC消除功能,即可极大幅度的降低拍照废片率,一些路人突然出现的照片,就可以通过该功能成功拯救。三星Galaxy S24系列的通话实时语音翻译和同传功能,支持了13种语言之间的无缝翻译,出国旅行也可轻松交流。

在前不久的MWC展会期间,高通也在现场展示了大量生成式AI的应用案例。相比此前发布的一些手机的AI功能,高通在MWC现场所展示的AI功能更为神奇。如,在图像生成上,完全不需要一长串的文字标签,只要给出一个比较准确的描述,Stable Diffusion即可快速生成图片,与描述相差无几。比如输入“一只可爱的卷毛猫”,小龙手机仅耗时不到7秒,就生成了一张卷毛猫在室内的照片,效果十分真实。

另外,图片生成还能根据个人或艺术偏好,加入自定义元素来展现风格效果。比如在加入“水晶”关键词,并设定好风格权重后,模型就会添加水晶元素,最终生成的图片就很有赛博风格了。这种使用方式很具想象力,它可以用来制作表情包,甚至在创作平面、视频内容缺素材时,也能运用AI快速生成符合要求的素材。

异构计算对端侧生成式AI的重要性

而这些生成式AI功能在终端设备上的应用离不开芯片的支持。高通认为,对于端侧生成式AI来说,异构计算是必要条件。高通在此次MWC 展示的Stable Diffusion快速生成图片,完全依靠端侧算力,它需要NPU进行推理,需要GPU进行图像渲染,也正是在异构运算的帮助下,才能快速里完成图片生成,并且能够保持低功耗,保持手机终端的高电池续航。

近日,高通在其发布的《通过NPU和异构计算开启终端侧生成式AI》报告中,深入阐述了NPU与异构计算,对端侧生成式AI使用的重要性。

高通公司提出,随着生成式AI用例需求在有着多样化要求和计算需求的垂直领域不断增加,需要专为AI定制设计的全新计算架构。这首先需要一个面向生成式AI全新设计的神经网络处理器(NPU),同时要利用异构处理器组合,比如中央处理器(CPU)和图形处理器(GPU)。通过结合NPU使用合适的处理器,异构计算能够实现最佳应用性能、能效和电池续航,赋能全新增强的生成式AI体验。

NPU专为实现以低功耗加速AI推理而全新打造,其架构随着新AI算法、模型和用例的发展不断演进。AI运算上的主要负载是由标量、向量和张量的数学运算,虽说CPU也能对此进行处理,不过处理速度和功耗方面都不理想。NPU正是针对AI运算所打造的新处理单元,高通在2015年推出的第一代AI引擎,在Hexagon NPU集成了标量和向量运算核心,之后又加入了张量运算核心,从而极大加快了AI处理速度,并使AI运算处理的功耗大幅度降低。

写在最后

如今,生成式AI已经在终端侧展示出它的价值,随着生成式AI在终端侧运行的加速,这一趋势也将推动终端的进一步创新,有望为手机、PC等消费电子市场带来新一轮生机。同时,生成式AI在终端侧的运行需要极大的算力,这也是目前业界需要解决的重大问题。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26485

    浏览量

    264115
收藏 人收藏

    评论

    相关推荐

    NPU是什么?为何它是开启终端生成AI的关键?

    ),同时要利用异构处理器组合,比如中央处理器(CPU)和图形处理器(GPU)。通过结合NPU使用合适的处理器,异构计算能够实现最佳应用性能、能效和电池续航,赋能全新增强的生成
    的头像 发表于 03-07 11:25 1511次阅读
    <b class='flag-5'>NPU</b>是什么?为何它是开启<b class='flag-5'>终端</b>侧<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>的关键?

    高通NPU异构计算提升生成AI性能 

    异构计算的重要性不可忽视。根据生成AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的
    的头像 发表于 03-06 14:15 230次阅读

    Banana Pi为何选择rk3588开发与Jetson Nano引脚兼容的嵌入产品

    应用的需求。 AI加速: RK3588集成了NPU(神经处理单元),可加速深度学习推理,使其成为处理人工智能任务的理想选择。 低功耗: 与其性能相比,RK3588具有出色的功耗表现,这
    发表于 11-02 12:30

    高通在2023骁龙峰会上推动突破性的生成AI落地多品类终端

    要点 • 全新骁龙平台展现了面向众多生成AI终端和应用的绝佳终端AI性能,更加注重即时性、可靠性、个性化和隐私。 • 骁龙X Elite
    发表于 10-25 11:46 97次阅读
    高通在2023骁龙峰会上推动突破性的<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>落地多品类<b class='flag-5'>终端</b>

    高通在2023骁龙峰会上推动突破性的生成AI落地多品类终端

    ,在众多支持Windows 11的PC平台中拥有一流的CPU性能和能效。 •  第三代骁龙8拥有面向移动终端的性能强大NPU,并利用AI
    的头像 发表于 10-25 10:30 188次阅读
    高通在2023骁龙峰会上推动突破性的<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>落地多品类<b class='flag-5'>终端</b>

    标准系统:奥思维MILOS-DK-RB5

    。QRB5165拥有强大异构计算架构,以及第五代Qualcomm®人工智能引擎AI Engine,可实现每秒15万亿次运算(15 TOPS)的AI性能,能够运行复杂的人工智能和深度学
    发表于 10-19 10:52

    armsom:为何选择rk3588开发与Jetson Nano引脚兼容的嵌入产品

    : RK3588支持多种外围接口,包括多个USB 3.0端口、HDMI输出、DP输出、以太网、PCIe、mipi csi等,这意味着它可以轻松满足各种应用的需求。 AI加速: RK3588集成了
    发表于 10-18 17:35

    高通下一代智能PC计算平台名称确定:骁龙X系列

    骁龙X系列平台基于高通在CPU、GPU和NPU异构计算架构领域的多年经验打造。目前,采用下一代定制高通Oryon CPU的骁龙X系列将实现性能和能效的显著提升,此外其所搭载的NPU将面向生成
    的头像 发表于 10-11 11:31 425次阅读

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?
    发表于 09-14 08:13

    鸿创达基于瑞芯微RK3588的8K人工智能核心板

    ,可提供6Tops。拥有丰富的接口,支持多硬盘、千兆网、WiFi6、 5G/4G扩展和多种视频输入输出;支持多种操作系统;可适用于ARM
    发表于 09-11 20:25

    新一代计算架构超异构计算技术是什么 异构走向超异构案例分析

    异构计算架构是一种将不同类型和规模的硬件资源,包括CPU、GPU、FPGA等,进行异构集成的方法。它通过独特的软件和硬件协同设计,实现了计算资源的灵活调度和优化利用,从而大大提高了计算
    发表于 08-23 09:57 456次阅读
    新一代<b class='flag-5'>计算</b>架构超<b class='flag-5'>异构计算</b>技术是什么 <b class='flag-5'>异构</b>走向超<b class='flag-5'>异构</b>案例分析

    异构计算场景下构建可信执行环境

    令集、不同功能的单元,组合起来形成一个混合的计算系统,使其具有更强大、更高效的功能。如何在异构计算场景下构建可信执行环境呢?华为可信
    发表于 08-15 17:35

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    经验总结图解NPU算法、架构与实现,从零设计产品级加速器当前,ChatGPT和自动驾驶等技术正在为人类社会带来巨大的生产变革,其中基于深度学习和增强学习的AI
    发表于 07-28 10:50

    通过AI加速,智能终端应用得到创新提升

    京微齐力的新型加速芯片是将FPGA、CPU、AI等多种异构计算单元集成在同一个芯片上,采用了领域自适应与逻辑可重构的计算模式,具有“软件可编程、硬件可重构”的特性。这类新型架构的单芯片
    的头像 发表于 07-11 10:53 480次阅读

    PrimeSimSPICE:异构计算模型实现数量级性能突破

    随着对更高计算性能的需求不断增加,HPC 行业正朝着异构计算模型发展,其中 GPU 和 CPU 协同工作以执行通用计算任务。在这种异构计算模型中,GPU 充当 CPU 的
    的头像 发表于 05-24 16:53 592次阅读
    PrimeSimSPICE:<b class='flag-5'>异构计算</b>模型实现数量级性能突破