0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从AI算力爆发到图形革命 ,Imagination重构嵌入式设备的性能平衡模式

颖脉Imgtec 2025-04-16 11:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月15日,慕尼黑上海电子展拉开帷幕。此次展览将持续三天,不仅吸引了半导体传感器、海内外展商参展;同期举办的“创新论坛”更是众多行业人士关注的重点。4月15日下午,Imagination中国高级业务经理黄音出席“2025AI技术创新论坛”,她结合公司产品情况,从AI算力、图形渲染,以及基于两者的嵌入式设备性能平衡等方面进行了主题分享。

ca16d8d8-1a75-11f0-9434-92fbcf53809c.jpg


AI模型持续优化驱动硬件构架的革新

首先,黄音回顾了自2012年以来AI模型的发展历程。她介绍说,2012年AlexNet开启了卷积神经网络时代;Perception AI开始进入语音识别计算机视觉;Generative AI实现了从文本生成图像、视频等内容生成;Agentic AI不仅能学习,还能使用工具,进行判断,并且采取行动;还有最近流行的Physical AI,能感知物理世界的人工智能,在真实环境中完成任务,如智能机器人等。

“我们现在常说‘大模型’,其实也有不少公司在做‘小模型’”。大模型(LLM)通常基于大规模数据进行训练,如谷歌的Transformer,也有可在端侧进行推理的大模型,例如Deepseek R1。小模型(SLM)通常参数量比LLM少,设计上更侧重于针对特定任务进行微调,如LLaMini。而AI推理的应用中,特别是在端侧设备上运行时,小模型与physical AI的结合,会给端侧应用带来爆发式增长。

与此同时,模型不断优化也带来了硬件设计的变革,从单一算力需求转变为对算力、存储、中间通讯三者的平衡,新的硬件架构是发展的必然趋势。根据不同的处理器架构,黄音分别介绍了不同之处。CPU更适合处理串行数据,NPU适合固定模型算法的并行加速,GPU适合通用的并行计算,随着基础模型的不断优化,边缘侧的AI应用会有更多架构组合的可能性。

ca425b5c-1a75-11f0-9434-92fbcf53809c.png

而对于人工智能的端侧应用,推理只是其中的一个核心模块,还有很多边缘需求,比如通用计算和调度,云边混合带来的加密和隐私需求,图形渲染图像画质增强需求,功能安全和信息安全需求,设备自学习需求等。我们除了要追求每瓦算力,峰值算力和带宽极致外,还应该看到端侧应用是一个融合能力的应用。真正的破局点,是构建一个可以持续适配算法演进的架构平台。


Imagination GPU擅长应对边缘和端侧AI带来的挑战

Imagination作为全球领先的GPU IP供应商,深耕图形和AI,特别是针对边缘和端侧AI,Imagination的GPU技术具有高能效、可编程性、可扩展性和灵活性等特点。现场,黄音重点介绍了ImaginationD系列DXTP GPU和DXS GPU两款产品及其在AI phone和AIPC上的应用前景。

ca51351e-1a75-11f0-9434-92fbcf53809c.png

DXTP GPU可保证在智能手机和其他功耗受限设备上加速图形和AI工作负载时,保证全天候的电池续航。通过微架构的优化,相比前一代产品DXT,DXTP提供了更高的持续性能、更快的计算调度,并在几何处理吞吐量方面提高了50%。目前,DXTP已经被全球知名科技公司使用,在AI多数据类型处理、计算任务加速,以及本地内存的支持上有突出表现。此外,它还支持LiteRT(前身是tensorflow Lite)主流AI框架,并在Imagination体系内做了优化,开发者可运用它在Android设备上实现高性能AI应用的部署。

ca617c62-1a75-11f0-9434-92fbcf53809c.png

DXS GPU则是专为处理驾驶舱、信息娱乐和高级驾驶辅助系统中的图形和计算工作负载而打造的一款产品。相比于上一代GPU,IMG DXS为车辆中越来越常见的计算工作负载(如驾驶员监控和防撞)提供了高达10倍的性能提升。与硬件配套的计算库(imgBLAS、imgNN、imgFFT)可帮助软件开发人员实现高达80%的GPU利用率。这也将加速常见计算工作负载的处理,如计算机视觉和ADAS系统感知数据的预处理和后处理。

在演讲最后,对于什么将是符合“Physical AI”的终极硬件?黄音指出了三点:一是效率,在图形与AI计算上实现更优的能效比与计算密度;二是深度嵌入式集成,最小化数据传输,匹配现代API扩展;三是开发者与系统灵活性,是一款高度多用途的边缘处理器,既可用于图形,也可用于AI。她也透露到,Imagination今年也将有重磅产品推出,值得期待。

此外,在圆桌讨论环节,黄音与产业链伙伴围绕AI对行业带来的影响、生态合作、RISC-V等话题进行了讨论。黄音认为AI快速发展驱动了新的算力需求、硬件架构的革新,而作为IP供应商更需要与产业上下游伙伴合作,例如Imagination与多家RISC-V公司合作,优化GPU适配主流AI框架和标准API接口等,希望帮助客户打造差异化产品,实现快速上市。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 慕尼黑
    +关注

    关注

    0

    文章

    175

    浏览量

    18867
  • 嵌入式设备
    +关注

    关注

    0

    文章

    126

    浏览量

    17776
  • imagination
    +关注

    关注

    1

    文章

    627

    浏览量

    63593
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    换个芯片就要重写半套代码?PPEC Workbench嵌入式跨架构开发的标准答案

    嵌入式跨架构开发已成为行业常态,但重复开发、工具不兼容、AI赋能不足等痛点,严重制约行业高效发展。当前嵌入式架构呈现多元化趋势,传统开发模式与工具难以适配企业核心需求,行业亟需标准化
    发表于 05-26 13:40

    全球 AI 中心大爆发与新能源高压化重构电力电子功率器件选型白皮书

    全球 AI 中心大爆发与新能源高压化重构电力电子功率器件选型白皮书 一、 时代大背景:AI
    的头像 发表于 05-22 08:38 604次阅读
    全球 <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>中心大<b class='flag-5'>爆发</b>与新能源高压化<b class='flag-5'>重构</b>电力电子功率器件选型白皮书

    企业如何突破AI困局?2026 年异构管理平台推荐

    随着 AI 大模型爆发式增长,异构管理已成为企业 AI 基础设施建设的核心挑战。本文行业现
    的头像 发表于 05-20 12:53 238次阅读

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在
    发表于 04-16 18:47

    RZ/V2M:助力嵌入式设备的Vision AI性能芯片

    RZ/V2M:助力嵌入式设备的Vision AI性能芯片 在当今嵌入式设备飞速发展的时代,Vi
    的头像 发表于 04-01 13:50 295次阅读

    嵌入式AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    中难以被发现,一旦上线将直接导致设备停机、产线瘫痪,甚至引发安全事故。 ▌传统IDE校验能力缺失:当前主流嵌入式IDE缺乏针对工业场景的专业校验逻辑,无法验证AI代码在实时性、可靠性、硬件兼容性等方面
    发表于 03-18 13:49

    还在手动拼接 AI 代码?你的 IDE 早就该升级了

    的专用IDE——PPEC Workbench,让AI开发繁琐拼接回归高效便捷,为嵌入式开发开启全新效率革命。 一、传统IDE中AI应用的核
    发表于 03-11 10:25

    8-12核、80 TOPS系统级!AMD锐龙AI P100嵌入式处理器进阶!

    2026年初CES展上,AMD推出锐龙嵌入式P100系列处理器4-6核,针对下一代数字座舱和人机界面HMI 进行优化,实现车载信息娱乐显示屏的实时图形功能、AI 驱动的交互以及多域响应
    的头像 发表于 03-10 18:59 6661次阅读
    8-12核、80 TOPS系统级<b class='flag-5'>算</b><b class='flag-5'>力</b>!AMD锐龙<b class='flag-5'>AI</b> P100<b class='flag-5'>嵌入式</b>处理器进阶!

    边缘AI临界点:深度解析176TOPS香橙派AI Station的产业价值

    、内存革命:48GB/96GB LPDDR4X 背后的带宽博弈 很多开发者容易陷入唯论的误区,但在实际部署大模型时,内存容量和带宽往往是真正的性能瓶颈。OrangePi
    发表于 03-10 14:19

    AI爆发催生元器件短缺,智芯谷一站供应如何破局?

    “GPU紧缺”只是AI瓶颈的冰山一角——高端电容供货周期延长至40周、高速内存价格季度涨幅超30%、服务器散热方案重新设计周期压缩至2个月。AI
    的头像 发表于 01-27 11:23 980次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>爆发</b>催生元器件短缺,智芯谷一站<b class='flag-5'>式</b>供应如何破局?

    2026年,嵌入式行业如何抢占AI红利?

    2026年,智能化转型进入深水区,工业质检、智慧交通到消费电子、医疗设备,各类终端对AI、稳定性与场景适配性的要求持续升级,
    的头像 发表于 01-23 08:02 1365次阅读
    2026年,<b class='flag-5'>嵌入式</b>行业如何抢占<b class='flag-5'>AI</b>红利?

    【深圳】嵌入式AI实战:半天上手,人形检测模型部署+优化全流程

    你是否在项目中遇到这些痛点:AI模型太大,无法高效部署到资源受限的嵌入式设备?模型优化后,内存和平衡
    的头像 发表于 12-16 18:31 76次阅读
    【深圳】<b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b>实战:半天上手,人形检测模型部署+优化全流程

    RK3576 核心板:以 “芯” 为核,重塑嵌入式设备性能新高度​ ​

    技术底层到实际应用,每一处细节都彰显着其卓越的性能优势。​ 澎湃 6T :解锁多场景性能天花板​
    的头像 发表于 10-30 17:45 1036次阅读

    龙芯2K3000 | 重塑工控嵌入式处理器性能边界

    与工业级可靠性,彻底颠覆高端嵌入式ARM方案的性能边界,为智能制造、工业控制等领域注入「中国芯」的硬核力量!【优势速览:四大维度重构工业
    的头像 发表于 06-19 08:32 2475次阅读
    龙芯2K3000 | 重塑工控<b class='flag-5'>嵌入式</b>处理器<b class='flag-5'>性能</b>边界

    聚徽智控——嵌入式到边缘计算:平板工控电脑的技术进化论

    在工业数字化转型的浪潮中,平板工控电脑作为核心终端设备,正经历嵌入式系统到边缘计算架构的范式革命。这一进化不仅重塑了设备的技术形态,更推动
    的头像 发表于 06-13 13:48 1132次阅读