0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

功耗效率飞升 20%,这款 GPU IP 凭啥这么牛?

Felix分析 来源:电子发烧友 作者:吴子鹏 2025-02-26 00:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)当下,人工智能AI)的蓬勃发展,在智能手机和其他电力受限设备市场掀起了新一轮变革。以智能手机为例,个人助手、增强摄影等 AI 功能,有力地推动了全球智能手机市场的复苏。在这一关键进程中,用户对智能手机的期望愈发严苛,不仅要求界面流畅、设计精巧,更期望拥有全天候的持久续航。


在智能手机中,以往 GPU(图形处理器)主要负责图形渲染任务,将图像数据转化为屏幕显示的像素信息。例如,在视频播放、拍摄及编辑场景里,GPU 承担着解码、编码和实时渲染的工作。AI 时代来临后,现代 GPU 凭借并行计算能力,加速了 AI 模型的推理过程,像人脸识别、图像分割等应用得以实现。在边缘 AI 设备中,GPU 的应用不仅局限于视觉领域,还拓展到自然语言处理和语音识别等任务。尽管 GPU 功能日益强大,但上述提及的功耗问题也愈发突出。为助力智能手机和其他电力受限设备更好地实现显示和 AI 功能,Imagination 宣布推出其最新的 GPU IP——Imagination DXTP,该产品为这些设备上图形和计算工作负载的高效加速设定了新的标准。

AI 重塑边缘设备

AI 是一项具有变革性的技术,它不仅带来了丰富多样的功能,同时 AI 驱动的终端设备正通过边缘计算实现低延迟响应和隐私保护。以智能手机为例,AI 让语音助手如苹果 Siri、小米小爱同学等不断进化,能够理解更复杂的语音指令,完成查询信息、设置提醒、控制智能家居等操作,甚至还能进行情感交流和多轮对话;AI 将语音、图像、手势等多种交互方式融合,比如用户可以通过手势圈选特定图像或区域,借助 AI 搜索功能一键直达所需信息。

目前,AI 已成为智能手机市场发展的核心推动力之一。市场分析机构 IDC 认为,未来通过手机底层的系统级 AI,AI 智能体在人机交互和意图识别等方面的能力将显著提升,能够更好地理解用户的真实意图和需求,直接调用所需功能,主动协助用户完成相关任务。同时,该机构预测,随着手机厂商加快推出 AI 手机新品,AI 手机的市场渗透率将不断提高。IDC 称,预计 2025 年中国新一代 AI 手机市场出货量将达到 1.18 亿台,同比增长 59.8%,整体市场占比达到 40.7%。另外,如下图所示,根据 Counterpoint 的预测数据,预计在 AI 的推动下,全球智能手机将从 2024 年开始重回增长周期。

wKgZO2e9l5WAOu_HAAHFeTkGqx4275.png
全球智能手机市场规模预测


除了智能手机,其他边缘设备也广泛受益于 AI 技术的发展,如 AI 眼镜、智能手表和扫地机器人等。Imagination 认为,人工智能正飞速发展,DeepSeek 标志着人工智能发展的新一步,它为新一波高效的人工智能模型铺平了道路;未来几个月内,人工智能创新将迎来新一轮高潮。

与此同时,智能化也给终端设备带来了诸多严峻挑战。其一,数据泄露风险增大,智能化终端收集大量用户数据,包括位置、偏好、通话记录等。一旦安全防护存在漏洞,黑客攻击、恶意软件入侵等都可能导致数据泄露;其二,功耗控制困难,为满足算力需求,硬件高负荷运行会增加能耗,缩短电池续航时间,特别是智能手表、智能手机等移动终端,在有限电池容量下,平衡性能与功耗成为一大难题;此外,Imagination 指出,设备制造商和开发人员都希望硬件能够运行最新的应用,但芯片设计人员可能会感到困惑,不清楚他们的硬件进入市场后会被要求运行哪些人工智能工作负载。

DXTP 让终端设备更好地运转 AI

Imagination DXTP 是该公司最新发布的面向智能手机和其他电力受限设备的 GPU IP 系列。得益于一系列微架构改进,DXTP 在常见图形工作负载上,相较于其前代产品 DXT,功耗效率(FPS/W)最多提高了 20%。

Imagination 介绍称,Imagination DXTP 的基本布局与它在移动市场的前款 DXT 略有差异。通过将计算和纹理单元以不同方式组合,Imagination 得以增加每个 GPU 的几何计算处理量,并提升 GPU 的持续计算能力。DXTP 还拥有更大的缓存和更多的系统级带宽。同时,对 GPU 中的子单元进行了诸多细微改动,以降低功耗,累计提高能效达 20%。在计算方面,将本地计算内存增加到 32KB,并加快了工作组项目的设置速度,从而提升了人工智能应用的性能。

wKgZO2e9l62ACSibAALCYZKIAgE360.png
DXTP系列微架构改进

wKgZPGe9l7mAIwsYAAHX_9sWwPA222.png
DXTP系列的功效提升


因而,DXTP 系列不仅具备出色的能效水平,在计算性能和运行 AI 负载方面同样表现卓越。DXTP 提供高达 64 GPixel/s 的图形处理能力,2 TFLOPS 的 FP32 性能和 8 TOPS 的 INT8 AI 性能,采用超并行计算引擎,工作频率为 1GHz。

面向智能手机市场,Imagination 表示,虽然部分移动设备制造商自主设计 GPU,但仍有许多公司通过授权 GPU IP 来加快内部设计流程,确保最终产品质量更高,同时节省研发成本;还有更多公司从半导体公司购买现成的芯片,而半导体公司也出于与设备制造商内部设计团队相同的原因依赖外部 GPU IP。

DXTP 已成功在智能手机市场售出授权。它在性能、功耗和面积(PPA)之间实现了恰当的平衡,并拥有全面的功能集,使品牌设备制造商能够提供别具一格的体验。它的用途不仅限于移动市场,作为通用图形和人工智能加速器,它还助力 Imagination 在汽车等其他细分市场获取了市场份额。DXTP 提供两种现成的配置,且已获得在移动和汽车领域的授权使用。
针对近来大热的边缘 AI 设备市场,Imagination 指出,DXTP 等 Imagination GPU 的可编程性为硬件设计人员提供了适应模型变化的灵活性。由于支持流行的计算 API、与 oneAPI 等开放标准集成,以及提供可提高人工智能性能的优化软件库,DXTP 的大规模并行性可轻松用于快速高效地运行人工智能工作负载。它是一种灵活的人工智能加速器,可支持从大型语言模型、计算机视觉信号处理等多种不同类型的人工智能工作负载。此外,应用开发者还可以使用 PowerVR 开发者工具进行底层性能分析、调试、追踪捕获,并通过 Imagination 开发者论坛获得专家支持。

结语

AI 技术正在全方位、深层次地推动智能手机等终端设备行业的变革,从硬件性能的提升到软件功能的创新,再到用户体验的重塑,每一个环节都在发生着翻天覆地的变化。同时,AI 也带来了安全和功耗等方面的挑战。在这样的背景下,Imagination DXTP 成为开发者实现应用方案的优质之选,凭借出色的性能和能效表现,为整个科技产业的发展注入了强大动力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5282

    浏览量

    136085
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    “社”网关:疆鸿智能ETHERNET IP转MODBUS TCP拿捏PLC通讯焦虑!

    “社”网关:疆鸿智能ETHERNET IP转MODBUS TCP拿捏PLC通讯焦虑! 一、案例背景与痛点 在近期某机床机械加工企业的产线升级项目中,我们遇到了典型的异构网络通讯故障。现场核心设备为
    的头像 发表于 03-20 14:49 138次阅读
    “社<b class='flag-5'>牛</b>”网关:疆鸿智能ETHERNET <b class='flag-5'>IP</b>转MODBUS TCP拿捏PLC通讯焦虑!

    RSoft GPU加速技术重塑光子元件设计效率革命

    设计效率。为了解决这个问题,RSoft 光子器件工具的 FullWAVE FDTD 模组中引入 GPU 加速,通过 NVIDIA GPU 的平行运算能力,使得模拟速度相比 CPU 计算大幅提升。
    的头像 发表于 01-12 14:09 431次阅读
    RSoft <b class='flag-5'>GPU</b>加速技术重塑光子元件设计<b class='flag-5'>效率</b>革命

    成熟稳定量大5V升12V0.5A风扇供电DC-DC恒压芯片H6432惠海 低功耗

    成熟稳定量大5V升12V0.5A风扇供电DC-DC恒压芯片H6432惠海 低功耗 升压电源“实力派”登场!惠海H6432成大厂优选? 在各类升压恒压电源应用场景里,选对一款靠谱的控制驱动芯片
    发表于 01-04 10:48

    电源的效率如何观察?

    从墙上的交流电转换为计算机或其他设备所需的直流电时有多有效。较高的效率标准通常表示电源能够更有效地将电能转化为设备所需的电力,从而减少能源浪费。 观察电源的功耗:您可以使用功率计来测量电源的实际
    发表于 12-30 08:19

    沐曦GPU与龙蜥操作系统完成适配

    及量产,包括 GPU 架构定义、GPU IP 设计、GPU SoC 设计及 GPU 系统解决方案的量产交付全流程。
    的头像 发表于 10-17 15:06 1396次阅读

    昂瑞微,

         近几年射频前端市场异常火爆,多家射频前端公司应运而生,其中不乏有卓胜微、唯捷创芯两家优秀的射频前端公司,并分别于2019年和2022年上市成功。昂瑞微也在今年申报IPO并获得受理,目前处于二反问询中。2025年开始,射频前端市场出现了一个比较反常的现象,领头羊卓胜微上市后出现首次亏损,唯捷创芯和慧智微扣非净利润也是负的,三家上市公司业绩变脸,客观上对于昂瑞微IPO冲关可能会造成一定的压力。借此机会,我们刚好可以分析一
    的头像 发表于 10-03 19:49 832次阅读

    功耗设计核心指标之时钟门控效率

    时钟门控效率是低功耗设计早期阶段极具价值的可量化指标,使用英诺达的EDA工具进行功耗优化并获取RTL修改建议,让功耗优化不再是“玄学”。
    的头像 发表于 09-19 10:51 1226次阅读
    低<b class='flag-5'>功耗</b>设计核心指标之时钟门控<b class='flag-5'>效率</b>

    一个集线器,驱动 N 台变频泵,耐达讯自动化Profibus 这么

    在化工行业中,变频泵作为流体输送的核心设备,其稳定运行直接关系到生产连续性与能源效率。然而,面对高温高压、强腐蚀性气体、强电磁干扰等严苛工况,传统控制方式常因信号延迟、布线复杂、抗干扰能力不足等
    的头像 发表于 08-27 14:32 657次阅读

    基于 Modbus TCP 的飞升 FSH-CF计量泵多段速控制优化研究

    【摘要】 : 针对全氟己酮灌装过程中速度与精度矛盾问题,本文提出一种基于 Modbus TCP通讯的多段速控制方法。通过解析汇川 EASY320PLC 与飞升 FSH-CF 计量泵的协议交互机制
    的头像 发表于 08-08 11:31 1062次阅读
    基于 Modbus TCP 的<b class='flag-5'>飞升</b> FSH-CF计量泵多段速控制优化研究

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    【VisionFive 2单板计算机试用体验】1、开箱初体验(刷系统+静态IP设置+GPU跑分测评)

    文件:注意:balenaEtcher这个软件表面上可以选择bz2文件,但是在软件内解压的话会卡在73%的进度。所以,bz2文件要先解压,再用balenaEtcher烧录镜像到TF卡。 开机设置静态IP
    发表于 07-09 21:50

    高性能低功耗双核Wi-Fi6+BLE5.3二合一

    处理器芯片nRF5340设计的紧凑型模块——PTR5302。这款模块具有高性能、低功耗、双内核的特点,将为物联网应用带来更加强大的无线连接能力和更高的性能表现。PTR5302采用了Nordic的超低功耗
    发表于 06-28 21:42

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPUIP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 4958次阅读

    IP6808无线充电电路图解析与应用指南

    本文介绍了IP6808无线充电芯片,具有高效率、低功耗、高兼容性等优点。其核心电路包括主控电路、功率传输部分和通信与保护机制,能够实现高效无线充电。
    的头像 发表于 05-05 09:03 1644次阅读
    <b class='flag-5'>IP</b>6808无线充电电路图解析与应用指南