0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从AI算力爆发到图形革命 ,Imagination重构嵌入式设备的性能平衡模式

颖脉Imgtec 2025-04-16 11:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月15日,慕尼黑上海电子展拉开帷幕。此次展览将持续三天,不仅吸引了半导体传感器、海内外展商参展;同期举办的“创新论坛”更是众多行业人士关注的重点。4月15日下午,Imagination中国高级业务经理黄音出席“2025AI技术创新论坛”,她结合公司产品情况,从AI算力、图形渲染,以及基于两者的嵌入式设备性能平衡等方面进行了主题分享。

ca16d8d8-1a75-11f0-9434-92fbcf53809c.jpg


AI模型持续优化驱动硬件构架的革新

首先,黄音回顾了自2012年以来AI模型的发展历程。她介绍说,2012年AlexNet开启了卷积神经网络时代;Perception AI开始进入语音识别计算机视觉;Generative AI实现了从文本生成图像、视频等内容生成;Agentic AI不仅能学习,还能使用工具,进行判断,并且采取行动;还有最近流行的Physical AI,能感知物理世界的人工智能,在真实环境中完成任务,如智能机器人等。

“我们现在常说‘大模型’,其实也有不少公司在做‘小模型’”。大模型(LLM)通常基于大规模数据进行训练,如谷歌的Transformer,也有可在端侧进行推理的大模型,例如Deepseek R1。小模型(SLM)通常参数量比LLM少,设计上更侧重于针对特定任务进行微调,如LLaMini。而AI推理的应用中,特别是在端侧设备上运行时,小模型与physical AI的结合,会给端侧应用带来爆发式增长。

与此同时,模型不断优化也带来了硬件设计的变革,从单一算力需求转变为对算力、存储、中间通讯三者的平衡,新的硬件架构是发展的必然趋势。根据不同的处理器架构,黄音分别介绍了不同之处。CPU更适合处理串行数据,NPU适合固定模型算法的并行加速,GPU适合通用的并行计算,随着基础模型的不断优化,边缘侧的AI应用会有更多架构组合的可能性。

ca425b5c-1a75-11f0-9434-92fbcf53809c.png

而对于人工智能的端侧应用,推理只是其中的一个核心模块,还有很多边缘需求,比如通用计算和调度,云边混合带来的加密和隐私需求,图形渲染图像画质增强需求,功能安全和信息安全需求,设备自学习需求等。我们除了要追求每瓦算力,峰值算力和带宽极致外,还应该看到端侧应用是一个融合能力的应用。真正的破局点,是构建一个可以持续适配算法演进的架构平台。


Imagination GPU擅长应对边缘和端侧AI带来的挑战

Imagination作为全球领先的GPU IP供应商,深耕图形和AI,特别是针对边缘和端侧AI,Imagination的GPU技术具有高能效、可编程性、可扩展性和灵活性等特点。现场,黄音重点介绍了ImaginationD系列DXTP GPU和DXS GPU两款产品及其在AI phone和AIPC上的应用前景。

ca51351e-1a75-11f0-9434-92fbcf53809c.png

DXTP GPU可保证在智能手机和其他功耗受限设备上加速图形和AI工作负载时,保证全天候的电池续航。通过微架构的优化,相比前一代产品DXT,DXTP提供了更高的持续性能、更快的计算调度,并在几何处理吞吐量方面提高了50%。目前,DXTP已经被全球知名科技公司使用,在AI多数据类型处理、计算任务加速,以及本地内存的支持上有突出表现。此外,它还支持LiteRT(前身是tensorflow Lite)主流AI框架,并在Imagination体系内做了优化,开发者可运用它在Android设备上实现高性能AI应用的部署。

ca617c62-1a75-11f0-9434-92fbcf53809c.png

DXS GPU则是专为处理驾驶舱、信息娱乐和高级驾驶辅助系统中的图形和计算工作负载而打造的一款产品。相比于上一代GPU,IMG DXS为车辆中越来越常见的计算工作负载(如驾驶员监控和防撞)提供了高达10倍的性能提升。与硬件配套的计算库(imgBLAS、imgNN、imgFFT)可帮助软件开发人员实现高达80%的GPU利用率。这也将加速常见计算工作负载的处理,如计算机视觉和ADAS系统感知数据的预处理和后处理。

在演讲最后,对于什么将是符合“Physical AI”的终极硬件?黄音指出了三点:一是效率,在图形与AI计算上实现更优的能效比与计算密度;二是深度嵌入式集成,最小化数据传输,匹配现代API扩展;三是开发者与系统灵活性,是一款高度多用途的边缘处理器,既可用于图形,也可用于AI。她也透露到,Imagination今年也将有重磅产品推出,值得期待。

此外,在圆桌讨论环节,黄音与产业链伙伴围绕AI对行业带来的影响、生态合作、RISC-V等话题进行了讨论。黄音认为AI快速发展驱动了新的算力需求、硬件架构的革新,而作为IP供应商更需要与产业上下游伙伴合作,例如Imagination与多家RISC-V公司合作,优化GPU适配主流AI框架和标准API接口等,希望帮助客户打造差异化产品,实现快速上市。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 慕尼黑
    +关注

    关注

    0

    文章

    152

    浏览量

    18648
  • 嵌入式设备
    +关注

    关注

    0

    文章

    118

    浏览量

    17648
  • imagination
    +关注

    关注

    1

    文章

    617

    浏览量

    63098
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式和FPGA的区别

    嵌入式系统与FPGA的核心差异:软件定义功能VS硬件可重构嵌入式适合通用计算,开发门槛低;FPGA凭借并行处理实现纳秒级响应,但成本高、开发难。二者融合的SoC器件正成为未来趋势,平衡性能
    发表于 11-19 06:55

    RK3576 核心板:以 “芯” 为核,重塑嵌入式设备性能新高度​ ​

    技术底层到实际应用,每一处细节都彰显着其卓越的性能优势。​ 澎湃 6T :解锁多场景性能天花板​
    的头像 发表于 10-30 17:45 573次阅读

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通过学习嵌入式技术提升就业竞争,需重点掌握C语言、嵌入式硬件架构、RTOS/Linux开发、通信协议四大核心技能,并结合行业需求积累项目经验。
    发表于 10-21 16:25

    龙芯2K3000 | 重塑工控嵌入式处理器性能边界

    与工业级可靠性,彻底颠覆高端嵌入式ARM方案的性能边界,为智能制造、工业控制等领域注入「中国芯」的硬核力量!【优势速览:四大维度重构工业
    的头像 发表于 06-19 08:32 1551次阅读
    龙芯2K3000 | 重塑工控<b class='flag-5'>嵌入式</b>处理器<b class='flag-5'>性能</b>边界

    聚徽智控——嵌入式到边缘计算:平板工控电脑的技术进化论

    在工业数字化转型的浪潮中,平板工控电脑作为核心终端设备,正经历嵌入式系统到边缘计算架构的范式革命。这一进化不仅重塑了设备的技术形态,更推动
    的头像 发表于 06-13 13:48 598次阅读

    网络的“神经突触”:AI互联技术如何重构分布训练范式

    过程中,由于单个AI芯片的提升速度无法跟上模型参数的增长速率,再加上庞大的模型参数和训练数据,已远远超出单个AI芯片甚至单台服务器的能力范围。因此,需要将数据样本和模型结构分散到多
    的头像 发表于 06-08 08:11 7078次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>网络的“神经突触”:<b class='flag-5'>AI</b>互联技术如何<b class='flag-5'>重构</b>分布<b class='flag-5'>式</b>训练范式

    新品 | 26+6TOPS强悍!飞凌嵌入式FCU3501嵌入式控制单元发布

    飞凌嵌入式FCU3501嵌入式控制单元基于瑞芯微RK3588处理器开发设计,4xCortex-A76+4xCortex-A55架构,A76主频高达2.4GHz,A55核主频高达1.8GHz,支持8K编解码,NPU
    的头像 发表于 05-15 11:57 2265次阅读
    新品 | 26+6TOPS强悍<b class='flag-5'>算</b><b class='flag-5'>力</b>!飞凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制单元发布

    Imagination 宣布推出 E-Series GPU:开启Edge AI 与图形处理新时代

    E-Series带来跨越性能提升,使GPU成为边缘设备图形AI的核心加速引擎2025年5月8日——ImaginationTechnolo
    的头像 发表于 05-08 08:02 825次阅读
    <b class='flag-5'>Imagination</b> 宣布推出 E-Series GPU:开启Edge <b class='flag-5'>AI</b> 与<b class='flag-5'>图形</b>处理新时代

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、自动驾驶等需要海量数据并行计算的场景。随着
    的头像 发表于 04-13 00:02 2611次阅读

    嵌入式主板开发详细指南

    与方案设计功能定义:明确主板的用途(如工业控制、边缘AI)、接口需求(CAN、GPIO、MIPI等)及性能指标(、实时性)。选型决策:根据需求选择处理器架构(AR
    的头像 发表于 04-02 11:35 938次阅读
    <b class='flag-5'>嵌入式</b>主板开发详细指南

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与推理任务对的需求持续攀升,直接推动了服务
    发表于 03-25 12:00

    图形处理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次发布,见证了生成AI云端到智能手机等消费设备中普及。在云端,由于GPU的可编程性、可扩展性
    的头像 发表于 02-27 08:33 827次阅读
    <b class='flag-5'>从</b><b class='flag-5'>图形</b>处理到<b class='flag-5'>AI</b>加速,一文看懂<b class='flag-5'>Imagination</b> D系列GPU

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破瓶颈,释放AI澎湃动力! 什么是智中心 智中心(AIDC,Artificial Int
    的头像 发表于 02-24 17:34 985次阅读
    信而泰CCL仿真:解锁<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心网络<b class='flag-5'>性能</b>跃升之道

    企业AI租赁模式的好处

    构建和维护一个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI
    的头像 发表于 12-24 10:49 1660次阅读