0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

功耗效率飞升 20%,这款 GPU IP 凭啥这么牛?

Felix分析 来源:电子发烧友 作者:吴子鹏 2025-02-26 00:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)当下,人工智能AI)的蓬勃发展,在智能手机和其他电力受限设备市场掀起了新一轮变革。以智能手机为例,个人助手、增强摄影等 AI 功能,有力地推动了全球智能手机市场的复苏。在这一关键进程中,用户对智能手机的期望愈发严苛,不仅要求界面流畅、设计精巧,更期望拥有全天候的持久续航。


在智能手机中,以往 GPU(图形处理器)主要负责图形渲染任务,将图像数据转化为屏幕显示的像素信息。例如,在视频播放、拍摄及编辑场景里,GPU 承担着解码、编码和实时渲染的工作。AI 时代来临后,现代 GPU 凭借并行计算能力,加速了 AI 模型的推理过程,像人脸识别、图像分割等应用得以实现。在边缘 AI 设备中,GPU 的应用不仅局限于视觉领域,还拓展到自然语言处理和语音识别等任务。尽管 GPU 功能日益强大,但上述提及的功耗问题也愈发突出。为助力智能手机和其他电力受限设备更好地实现显示和 AI 功能,Imagination 宣布推出其最新的 GPU IP——Imagination DXTP,该产品为这些设备上图形和计算工作负载的高效加速设定了新的标准。

AI 重塑边缘设备

AI 是一项具有变革性的技术,它不仅带来了丰富多样的功能,同时 AI 驱动的终端设备正通过边缘计算实现低延迟响应和隐私保护。以智能手机为例,AI 让语音助手如苹果 Siri、小米小爱同学等不断进化,能够理解更复杂的语音指令,完成查询信息、设置提醒、控制智能家居等操作,甚至还能进行情感交流和多轮对话;AI 将语音、图像、手势等多种交互方式融合,比如用户可以通过手势圈选特定图像或区域,借助 AI 搜索功能一键直达所需信息。

目前,AI 已成为智能手机市场发展的核心推动力之一。市场分析机构 IDC 认为,未来通过手机底层的系统级 AI,AI 智能体在人机交互和意图识别等方面的能力将显著提升,能够更好地理解用户的真实意图和需求,直接调用所需功能,主动协助用户完成相关任务。同时,该机构预测,随着手机厂商加快推出 AI 手机新品,AI 手机的市场渗透率将不断提高。IDC 称,预计 2025 年中国新一代 AI 手机市场出货量将达到 1.18 亿台,同比增长 59.8%,整体市场占比达到 40.7%。另外,如下图所示,根据 Counterpoint 的预测数据,预计在 AI 的推动下,全球智能手机将从 2024 年开始重回增长周期。

wKgZO2e9l5WAOu_HAAHFeTkGqx4275.png
全球智能手机市场规模预测


除了智能手机,其他边缘设备也广泛受益于 AI 技术的发展,如 AI 眼镜、智能手表和扫地机器人等。Imagination 认为,人工智能正飞速发展,DeepSeek 标志着人工智能发展的新一步,它为新一波高效的人工智能模型铺平了道路;未来几个月内,人工智能创新将迎来新一轮高潮。

与此同时,智能化也给终端设备带来了诸多严峻挑战。其一,数据泄露风险增大,智能化终端收集大量用户数据,包括位置、偏好、通话记录等。一旦安全防护存在漏洞,黑客攻击、恶意软件入侵等都可能导致数据泄露;其二,功耗控制困难,为满足算力需求,硬件高负荷运行会增加能耗,缩短电池续航时间,特别是智能手表、智能手机等移动终端,在有限电池容量下,平衡性能与功耗成为一大难题;此外,Imagination 指出,设备制造商和开发人员都希望硬件能够运行最新的应用,但芯片设计人员可能会感到困惑,不清楚他们的硬件进入市场后会被要求运行哪些人工智能工作负载。

DXTP 让终端设备更好地运转 AI

Imagination DXTP 是该公司最新发布的面向智能手机和其他电力受限设备的 GPU IP 系列。得益于一系列微架构改进,DXTP 在常见图形工作负载上,相较于其前代产品 DXT,功耗效率(FPS/W)最多提高了 20%。

Imagination 介绍称,Imagination DXTP 的基本布局与它在移动市场的前款 DXT 略有差异。通过将计算和纹理单元以不同方式组合,Imagination 得以增加每个 GPU 的几何计算处理量,并提升 GPU 的持续计算能力。DXTP 还拥有更大的缓存和更多的系统级带宽。同时,对 GPU 中的子单元进行了诸多细微改动,以降低功耗,累计提高能效达 20%。在计算方面,将本地计算内存增加到 32KB,并加快了工作组项目的设置速度,从而提升了人工智能应用的性能。

wKgZO2e9l62ACSibAALCYZKIAgE360.png
DXTP系列微架构改进

wKgZPGe9l7mAIwsYAAHX_9sWwPA222.png
DXTP系列的功效提升


因而,DXTP 系列不仅具备出色的能效水平,在计算性能和运行 AI 负载方面同样表现卓越。DXTP 提供高达 64 GPixel/s 的图形处理能力,2 TFLOPS 的 FP32 性能和 8 TOPS 的 INT8 AI 性能,采用超并行计算引擎,工作频率为 1GHz。

面向智能手机市场,Imagination 表示,虽然部分移动设备制造商自主设计 GPU,但仍有许多公司通过授权 GPU IP 来加快内部设计流程,确保最终产品质量更高,同时节省研发成本;还有更多公司从半导体公司购买现成的芯片,而半导体公司也出于与设备制造商内部设计团队相同的原因依赖外部 GPU IP。

DXTP 已成功在智能手机市场售出授权。它在性能、功耗和面积(PPA)之间实现了恰当的平衡,并拥有全面的功能集,使品牌设备制造商能够提供别具一格的体验。它的用途不仅限于移动市场,作为通用图形和人工智能加速器,它还助力 Imagination 在汽车等其他细分市场获取了市场份额。DXTP 提供两种现成的配置,且已获得在移动和汽车领域的授权使用。
针对近来大热的边缘 AI 设备市场,Imagination 指出,DXTP 等 Imagination GPU 的可编程性为硬件设计人员提供了适应模型变化的灵活性。由于支持流行的计算 API、与 oneAPI 等开放标准集成,以及提供可提高人工智能性能的优化软件库,DXTP 的大规模并行性可轻松用于快速高效地运行人工智能工作负载。它是一种灵活的人工智能加速器,可支持从大型语言模型、计算机视觉信号处理等多种不同类型的人工智能工作负载。此外,应用开发者还可以使用 PowerVR 开发者工具进行底层性能分析、调试、追踪捕获,并通过 Imagination 开发者论坛获得专家支持。

结语

AI 技术正在全方位、深层次地推动智能手机等终端设备行业的变革,从硬件性能的提升到软件功能的创新,再到用户体验的重塑,每一个环节都在发生着翻天覆地的变化。同时,AI 也带来了安全和功耗等方面的挑战。在这样的背景下,Imagination DXTP 成为开发者实现应用方案的优质之选,凭借出色的性能和能效表现,为整个科技产业的发展注入了强大动力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134485
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一个集线器,驱动 N 台变频泵,耐达讯自动化Profibus 这么

    在化工行业中,变频泵作为流体输送的核心设备,其稳定运行直接关系到生产连续性与能源效率。然而,面对高温高压、强腐蚀性气体、强电磁干扰等严苛工况,传统控制方式常因信号延迟、布线复杂、抗干扰能力不足等
    的头像 发表于 08-27 14:32 398次阅读

    基于 Modbus TCP 的飞升 FSH-CF计量泵多段速控制优化研究

    【摘要】 : 针对全氟己酮灌装过程中速度与精度矛盾问题,本文提出一种基于 Modbus TCP通讯的多段速控制方法。通过解析汇川 EASY320PLC 与飞升 FSH-CF 计量泵的协议交互机制
    的头像 发表于 08-08 11:31 641次阅读
    基于 Modbus TCP 的<b class='flag-5'>飞升</b> FSH-CF计量泵多段速控制优化研究

    【VisionFive 2单板计算机试用体验】1、开箱初体验(刷系统+静态IP设置+GPU跑分测评)

    文件:注意:balenaEtcher这个软件表面上可以选择bz2文件,但是在软件内解压的话会卡在73%的进度。所以,bz2文件要先解压,再用balenaEtcher烧录镜像到TF卡。 开机设置静态IP
    发表于 07-09 21:50

    芯原推出面向可穿戴设备的超低功耗OpenGL ES GPU,支持3D/2.5D混合渲染

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新超低功耗的图形处理器(GPUIP——GCNano3DVG。该IP具备3D与2.5D图形渲染功能,在视觉效果与
    的头像 发表于 04-17 10:15 573次阅读

    全新岚图梦想家又获两项权威认证

    平均每卖出3台高端MPV,就有1台岚图梦想家,?当然是凭借过硬的产品实力,不惧火灾!智驾安全!日前,这款旗舰MPV,又获两项权威认证。
    的头像 发表于 04-17 09:32 735次阅读

    探秘工业网关:那些超的物联网品牌大盘点

    在工业领域,工业网关堪称智能工厂的 “超级指挥官”,将各类设备紧密相连,保障工厂运作行云流水。今天,就带大家深入了解那些超的工业网关品牌,看看它们在市场上 “叱咤风云”! 是工
    的头像 发表于 04-10 10:10 534次阅读
    探秘工业网关:那些超<b class='flag-5'>牛</b>的物联网品牌大盘点

    ​为什么GPU性能效率比峰值性能更关键

    数据,结合面积数据、功耗估算和通用功能集,帮助SoC设计师比较不同系统配置的性能。然而,这些指标仅提供了理论性能,并不总是能够很好地反映实际性能。没有任何GPU能够
    的头像 发表于 03-13 08:34 730次阅读
    ​为什么<b class='flag-5'>GPU</b>性能<b class='flag-5'>效率</b>比峰值性能更关键

    晶振:DeepSeek背后的“隐形基石”

    崭露头角,仅仅一周用户数量就破亿。DeepSeek:AI界的“性价比之王”,这么?ENDLESSPOSSIBILITIES开源策略,免费开放DeepSeek选
    的头像 发表于 03-12 18:01 496次阅读
    晶振:DeepSeek背后的“隐形基石”

    智能座舱SoC,急需更强大的GPU IP

      电子发烧友网报道(文/梁浩斌)汽车智能化的浪潮势不可挡,传统ECU架构因硬件冗余、通信效率低等缺陷逐渐被淘汰,电子电气架构从分布式向集中式演进,取而代之的是高性能CPU、GPU所支持的中央计算
    的头像 发表于 03-09 08:36 2547次阅读
    智能座舱SoC,急需更强大的<b class='flag-5'>GPU</b> <b class='flag-5'>IP</b>

    Imagination DXTP GPU IP:加速游戏 AI应用,全天候畅玩无阻

    ,集成了自2022年发布以来引入的一系列功能,并实现了高达20%的功耗效率提升。自2022年IMGDXT发布以来,智能手机市场已经发生了显著变化。最新一代的基础AI模
    的头像 发表于 02-26 08:32 688次阅读
    Imagination DXTP <b class='flag-5'>GPU</b> <b class='flag-5'>IP</b>:加速游戏 AI应用,全天候畅玩无阻

    Imagination宣布推出其最新的GPU IP——Imagination DXTP

    DXTP在常见图形工作负载上,相比其前代产品DXT,功耗效率(FPS/W)提高了最多20%
    的头像 发表于 02-25 10:54 493次阅读

    解锁新应用:探索GPU扩展是如何提升渲染农场的工作效率

    联瑞GPU扩展方案在渲染农场的应用,是在原有计算机设备的基础上增加GPU的数量,不用额外购买GPU服务器,有效的帮助企业降本增效.
    的头像 发表于 01-09 17:13 630次阅读
    解锁新应用:探索<b class='flag-5'>GPU</b>扩展是如何提升渲染农场的工作<b class='flag-5'>效率</b>

    芯原发布新一代Vitality架构GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架构的图形处理器(GPU)IP系列。这一新一代GPU架构以其卓越的计算性能和广泛的应用领域,吸引了业界的广泛关注。 Vitality GPU
    的头像 发表于 12-24 10:55 1294次阅读

    芯原发布全新Vitality架构GPU IP系列

    芯原股份(芯原,股票代码:688521.SH)今日宣布推出全新Vitality架构的图形处理器(GPUIP系列,具备高性能计算能力,广泛适用于云游戏、AI PC、独立显卡和集成显卡等应用领域。
    的头像 发表于 12-19 15:26 1227次阅读

    如何使用 UCC28056x 优化离线应用中的效率和待机功耗

    介绍了如何使用 UCC28056x 优化离线应用中的效率和待机功耗,以满足现代产品法规对低待机功耗和高转换效率的要求。
    的头像 发表于 12-17 16:29 2184次阅读
    如何使用 UCC28056x 优化离线应用中的<b class='flag-5'>效率</b>和待机<b class='flag-5'>功耗</b>