0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI加速向终端侧演进,NPU、异构计算提供强大算力支持

Carol Li 来源:电子发烧友 作者:李弯弯 2024-03-16 00:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)生成式AI是一种通过学习大规模数据集生成新的原创内容的新型AI。Bloomberg Intelligence最新报告预测,未来10年内,生成式AI市场规模将从2022年的400亿美元,增长至2032年的1.3万亿美元,年复合增速达到42%。

生成式AI向终端快速演进

当前大部分生成式AI的开发工作都集中在云端,然而生成式AI正朝着直接在终端上运行的方向快速演进。高通公司总裁兼CEO安蒙前不久谈到,生成式AI将变革终端侧的用户体验,具备生成式AI能力的PC能够更好地理解用户需求,生成式AI还将带来全新的人车交互方式,支持用户与汽车直接进行对话。他认为,生成式AI将为各行各业带来全新机遇。

近段时间,生成式AI在手机、PC等终端设备上已经有不少用例。最近推出的新手机,就有不少生成式AI的应用,比如,OPPO Find X7Ultra的AIGC消除功能,即可极大幅度的降低拍照废片率,一些路人突然出现的照片,就可以通过该功能成功拯救。三星Galaxy S24系列的通话实时语音翻译和同传功能,支持了13种语言之间的无缝翻译,出国旅行也可轻松交流。

在前不久的MWC展会期间,高通也在现场展示了大量生成式AI的应用案例。相比此前发布的一些手机的AI功能,高通在MWC现场所展示的AI功能更为神奇。如,在图像生成上,完全不需要一长串的文字标签,只要给出一个比较准确的描述,Stable Diffusion即可快速生成图片,与描述相差无几。比如输入“一只可爱的卷毛猫”,小龙手机仅耗时不到7秒,就生成了一张卷毛猫在室内的照片,效果十分真实。

另外,图片生成还能根据个人或艺术偏好,加入自定义元素来展现风格效果。比如在加入“水晶”关键词,并设定好风格权重后,模型就会添加水晶元素,最终生成的图片就很有赛博风格了。这种使用方式很具想象力,它可以用来制作表情包,甚至在创作平面、视频内容缺素材时,也能运用AI快速生成符合要求的素材。

异构计算对端侧生成式AI的重要性

而这些生成式AI功能在终端设备上的应用离不开芯片的支持。高通认为,对于端侧生成式AI来说,异构计算是必要条件。高通在此次MWC 展示的Stable Diffusion快速生成图片,完全依靠端侧算力,它需要NPU进行推理,需要GPU进行图像渲染,也正是在异构运算的帮助下,才能快速里完成图片生成,并且能够保持低功耗,保持手机终端的高电池续航。

近日,高通在其发布的《通过NPU和异构计算开启终端侧生成式AI》报告中,深入阐述了NPU与异构计算,对端侧生成式AI使用的重要性。

高通公司提出,随着生成式AI用例需求在有着多样化要求和计算需求的垂直领域不断增加,需要专为AI定制设计的全新计算架构。这首先需要一个面向生成式AI全新设计的神经网络处理器(NPU),同时要利用异构处理器组合,比如中央处理器(CPU)和图形处理器(GPU)。通过结合NPU使用合适的处理器,异构计算能够实现最佳应用性能、能效和电池续航,赋能全新增强的生成式AI体验。

NPU专为实现以低功耗加速AI推理而全新打造,其架构随着新AI算法、模型和用例的发展不断演进。AI运算上的主要负载是由标量、向量和张量的数学运算,虽说CPU也能对此进行处理,不过处理速度和功耗方面都不理想。NPU正是针对AI运算所打造的新处理单元,高通在2015年推出的第一代AI引擎,在Hexagon NPU集成了标量和向量运算核心,之后又加入了张量运算核心,从而极大加快了AI处理速度,并使AI运算处理的功耗大幅度降低。

写在最后

如今,生成式AI已经在终端侧展示出它的价值,随着生成式AI在终端侧运行的加速,这一趋势也将推动终端的进一步创新,有望为手机、PC等消费电子市场带来新一轮生机。同时,生成式AI在终端侧的运行需要极大的算力,这也是目前业界需要解决的重大问题。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302585
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面向边缘AI视觉的高性能模组解决方案 ——杰和科技LM2-100-V0深度解析

    的高性能边缘AI加速方案。1.卓越的表现该模组搭载了专为边缘计算场景优化的NPU(神经网络处
    的头像 发表于 04-21 13:37 467次阅读
    面向边缘<b class='flag-5'>AI</b>视觉的高性能<b class='flag-5'>算</b><b class='flag-5'>力</b>模组解决方案  ——杰和科技LM2-100-V0深度解析

    基于openEuler平台的CPU、GPU与FPGA异构加速实战

    随着 AI、视频处理、加密和高性能计算需求的增长,单一 CPU 已无法满足低延迟、高吞吐量的计算需求。openEuler 作为面向企业和云端的开源操作系统,在 多样
    的头像 发表于 04-08 11:02 669次阅读
    基于openEuler平台的CPU、GPU与FPGA<b class='flag-5'>异构</b><b class='flag-5'>加速</b>实战

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    了设备在产业分工中的身位。OrangePi AI Station采用的昇腾310****P 处理器 ,构建了一套完整的异构计算体系: 1、 16核CPU (ARM架构,主频1.9GHz):负责复杂逻辑
    发表于 03-10 14:19

    应对端AI、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    AI大模型正加速从云端边缘与端渗透,然而,、内存、功耗等却成了制约其规模化落地的“高墙”
    的头像 发表于 12-18 13:45 530次阅读
    应对端<b class='flag-5'>侧</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    安谋科技:端NPU技术创新,拉动AI落地引擎

    的DSP+DSA架构,协同AI软件平台,可应用于加速卡、智能座舱、具身智能、ADAS、AI PC等设备为其提供AI
    的头像 发表于 12-09 16:44 6111次阅读
    安谋科技:端<b class='flag-5'>侧</b><b class='flag-5'>NPU</b>技术创新,拉动<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>落地引擎

    从CPU、GPU到NPU,美格智能持续优化异构计算效能

    的科技企业也在近期表示,将通过软件层创新大幅提升资源利用率。作为高AI模组和端
    的头像 发表于 11-21 16:05 1309次阅读
    从CPU、GPU到<b class='flag-5'>NPU</b>,美格智能持续优化<b class='flag-5'>异构</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>计算</b>效能

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种
    发表于 10-27 13:12

    AI体验跃迁,天玑9500用双NPU开创端AI新时代

    架构,从底层解决性能与功耗的矛盾:超性能 NPU 990 性能大幅提升,生成 AI 引擎 2.0 深度加速 Transformer 与大
    的头像 发表于 09-24 14:47 895次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断
    的头像 发表于 09-19 15:26 2072次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断
    的头像 发表于 09-19 15:25 1030次阅读
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    MediaTek从芯片到应用全方位支持AI

    NPU 是专为神经网络设计的 AI 处理单元,可为各种 AI 任务提供强大
    的头像 发表于 08-16 10:01 2459次阅读

    芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS

    AI需求而设计,不仅能够为AI PC等终端设备提供强劲
    的头像 发表于 06-11 10:47 986次阅读

    能效提升3倍!异构计算架构让AI跑得更快更省电

    电子发烧友网报道(文/李弯弯)异构计算架构通过集成多种不同类型的处理单元(如CPU、GPU、NPU、FPGA、DSP等),针对不同计算任务的特点进行分工协作,从而在性能、能效和灵活性之间实现最优平衡
    的头像 发表于 05-25 01:55 4274次阅读

    苹芯科技 N300 存一体 NPU,开启端 AI 新征程

    随着端人工智能技术的爆发式增长,智能设备对本地与能效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约端A
    的头像 发表于 05-06 17:01 1325次阅读
    苹芯科技 N300 存<b class='flag-5'>算</b>一体 <b class='flag-5'>NPU</b>,开启端<b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程

    【米尔MYC-YM90X安路飞龙DR1开发板】安路科技 SALDRAGON开发板介绍

    提供模型转换工具链,支持将PyTorch/TensorFlow模型量化为INT8/FP16格,并部署至NPU进行端推理(典型
    发表于 04-28 17:57