0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为云游戏打造定制显卡

颖脉Imgtec 2025-12-04 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据Grandview Research的预测,到2030年全球云游戏市场将超过200亿美元,其中亚太地区将占据约45%的市场机会。然而,目前主流的GPU解决方案主要是为数据中心计算而设计的,并不适用于云游戏独特的经济模型。云游戏的盈利能力依赖于在保持高质量用户体验的前提下,每颗GPU能支持的高并发用户数量。

对于正在开发云游戏硬件的公司而言,选择合适的GPU IP将决定其产品能否快速成功进入市场,或因延迟而承担巨大成本。Imagination的E系列采用经过验证且可扩展的架构,帮助团队以更低风险、更佳投资回报率(ROI)打造差异化产品、加速上市。

任何新硬件若想在激烈竞争中站稳脚跟,必须在性能、特性与成本上找到正确平衡。关键要求包括:可扩展并持续稳定的性能、满足多用户服务场景的能力、对目标应用的全面支持,以及在小面积(降低晶体管成本)与低功耗(降低运维成本)下实现上述能力。

Imagination是著名的PowerVR GPU架构的研发公司。尽管Imagination的IP起源于移动、消费电子和汽车领域,但近年来越来越多的云计算与个人计算定制显卡厂商采用其GPU IP。例如,芯动科技的风华系列显卡便采用了Imagination的GPU技术。

今年早些时候,Imagination推出了全新的E 系列 GPU 内核:一款高能效的GPU IP,集成32 TOPS INT8的片上AI加速能力,并支持每核16个虚拟环境。本文将介绍云游戏显卡厂商如何基于E系列实现产品差异化。


云游戏的持续帧率表现

用于桌面市场的Imagination GPU每核可实现72 GPixel/s的性能,并可通过多核技术进一步扩展(稍后会详细介绍)。持续性能得益于一系列最大化GPU利用率并降低热降频的架构基础设计:

高效的SIMT执行模型:多线程执行相同指令提升吞吐量,降低控制开销;同时共享指令获取与解码阶段,提高资源利用率。Imagination最新GPU在每个着色集群中可支持128条并行线程。

先进的调度能力:细粒度调度机制确保着色器核心保持忙碌,避免停顿,即使在游戏负载变化时也能维持高利用率。

强调本地存储访问:将中间计算结果存储在快速本地存储中,可减少外部DRAM往返,从而在复杂视觉效果中提供更高性能。

基于Tile的延迟渲染(TBDR)技术:将画面分成更小的tile并在芯片内部处理,可最大程度降低外部内存带宽使用;减少overdraw可在高几何复杂度场景中提升效率。(欲了解TBDR在桌面与数据中心市场的适用性,请参考相关博客文章。)

先进压缩技术:减少系统中数据传输量可大幅降低功耗,并提升帧率持续性。

这些特性相互配合,为云游戏用户提供稳定、无抖动(jitter-free)的体验。它们还与全新的高能效E系列Burst Processor(爆发处理器)协同工作,大幅提升性能并降低功耗,使图形管线始终保持高效运行。

爆发处理器(Burst Processor)改变了计算逻辑单元处理任务的方式。它不再每个周期切换任务,而是将操作以不可分割的单元提交至计算逻辑单元,从而避免任务中断,并减少对寄存器存储器低效读写操作的次数。该方案还允许在ALU内部存储中间数据,进一步减少寄存器存储器的读写操作量。通过降低对寄存器存储器的整体需求,GPU能有效提升利用率并持续更长时间保持高性能——这正是云游戏需要持久性能表现的理想方案。


为计算密集型特效提供额外性能

无论是3A大作还是休闲游戏,如今都越来越多地包含计算密集型细节。诸如模糊和景深等流行特效需要GPU执行复杂的数据采样和数学运算。为高效处理此类特效,GPU最初演进出了通用计算着色器,而E系列在此基础上更进一步。

E系列的GPU内置AI加速功能,在执行低精度运算(如FP16或INT8)时,速度比D系列同类产品快4倍。在1GHz频率下,单颗E系列GPU可提供:

传统着色器工作负载:2 FP32 TFLOPS

AI加速渲染:16 FP16 TFLOPS

AI工作负载与渲染:32 TOPS INT8

7be8a3e6-d0c1-11f0-8ce9-92fbcf53809c.png

E系列GPU内置AI加速器集成于统一着色集群(USC)内部,以实现性能最大化并降低带宽消耗。

最核心的设计在于:E系列GPU将矩阵乘法加速功能集成于计算逻辑单元(ALU)内部。相较于在远离着色集群的位置增设独立加速单元,这种集成式设计显著减少数据移动,从而在降低带宽消耗和功耗的同时提升性能。开发者可通过主流GPU API和行业标准扩展轻松调用这些额外性能。

基于E系列GPU的显卡由此能高效运用AI技术加速渲染流程的关键环节。云游戏公司可借助超级分辨率等主流解决方案,更快更高效地生成高分辨率帧,从而实现单张GPU承载更多玩家的目标。


无缝扩展

我们的GPU可通过提升时钟频率实现更高性能;更重要的是——这对云游戏显卡设计师至关重要——它们能构建成多核解决方案。

Imagination创新的多核架构无需直接依赖中央处理单元连接,即可灵活实例化任意数量的GPU核心。这有别于传统GPU可扩展性方案——后者受限于所有着色器核心必须连接至单一集中化模块,该模块包含集中式内存数据路径、任务管理器及几何切片引擎。传统方案常遭遇拥塞与布局灵活性问题。

我们的多核扩展流程采用去中心化松耦合架构,既为芯片设计师提供布局与设计自由度,又实现带宽效率最大化。精心设计确保图形工作负载能在不同核心间无缝扩展,最大限度减少瓶颈。例如,不同核心上的E系列分块加速器可同时处理非依赖性几何工作负载,使GPU能快速渲染复杂的AAA级游戏。

欲了解Imagination GPU高效扩展的更多原理,请参阅此博客。

对于云游戏显卡而言,这首先意味着E系列GPU可扩展至服务商期望的性能水平。Imagination的多核解决方案还具备额外优势:每个核心作为独立GPU,可动态重配置为协同工作(实现单用户性能最大化)或独立运行(实现多租户灵活性最大化)。

7bf4016e-d0c1-11f0-8ce9-92fbcf53809c.png

采用主-从模式协同运作的多核网格,以实现单用户性能最大化。

7bff0bf4-d0c1-11f0-8ce9-92fbcf53809c.png

采用主-主模式运行的多核网格,以实现最大灵活性。


通过灵活的多用户能力,使收入最大化

云服务提供商通常会设置不同的价格等级,以最大化其收入来源。因此,不同的用户需要不同级别的图形性能,而云游戏GPU则必须具备高度灵活的工作负载分配能力来满足这些差异化需求。

为此,我们的GPU IP集成了一个智能固件处理器,能够直接处理GPU事件。它负责管理与其他GPU核心及第三方处理器之间的交互、对渲染任务进行优先级排序,以及处理错误与调试。这与许多依赖CPU和驱动栈进行调度的GPU IP供应商不同,后者无法提供同等水平的灵活性。

这个智能固件处理器使E系列GPU能够支持多种云游戏场景:从在单颗GPU核心上运行多个容器,到将多个核心组合并动态协调跨核心的工作负载,以提供最大化的单用户体验。

虚拟化是云环境中另一项关键的多任务技术。它可以用于保障高端用户的安全与隐私,或支持远程桌面等使用场景。对于服务提供商来说,在一颗GPU上承载多个虚拟机(VM)也有助于实现故障隔离,避免其中一个虚拟机的崩溃影响到其他玩家。

E系列GPU提供先进的基于硬件的虚拟化方案(HyperLane),每核可运行多达16个不同的操作系统,并实现完整的内存隔离、无干扰、服务质量(QoS)保障和任务优先级控制。由于HyperLane是硬件级方案,其性能更高、软件复杂度更低,相比其他软件虚拟化方式具有明显优势。

想了解更多关于Imagination独特虚拟化技术的信息,请参阅相关白皮书。


以ROI为导向的设计

Imagination的产品可以扩展至云级性能,但我们的GPU架构即便在高性能条件下也保持其著名的面积效率和功耗效率。我们坚持“以更少实现更多”的理念,这在云市场中尤为关键。对面积敏感的架构可以降低定制芯片的开发成本,提高新方案的竞争力;低功耗产品则有助于服务商控制能源成本。

E系列进一步提升了Imagination的效率水平:

  • 提供超过D系列3倍的计算性能密度

  • 在采用神经核(Neural Cores)和爆发处理器(Burst Processors)后功耗效率提升最高可达35%
  • 成熟的软件生态体系

云游戏平台可以放心依赖Imagination GPU提供强大的软件支持,以运行当今最具挑战性的游戏大作。随着云端Android休闲游戏在市场上占据主导,Imagination在Android生态中的深厚积累——基于多年来在移动领域的领先经验——使其成为值得信赖的选择。

我们的GPU完整支持Khronos Group的主流移动图形API:

Vulkan

OpenGL ES

确保从设备到云端顺畅、可扩展的游戏体验。

在PC游戏方面,我们最新一代GPU增加了对DirectX的硬件级支持,而E系列进一步扩展至支持DirectX 12,并提供高性能PC游戏的参考驱动。对于较老的游戏,E系列也通过ZINK框架支持OpenGL 4.6


结语

随着云游戏的快速增长,特别是在中国等关键市场,硬件设计者需要一种在性能、可扩展性与能效之间取得平衡、没有妥协的GPU IP。Imagination的E系列GPU架构提供了极具吸引力的解决方案——将强大的图形渲染、AI加速、多用户能力与功耗优化设计融为一体。

无论您面向的是大众休闲云游戏市场,还是高端AAA游戏体验,E系列都具备足够的灵活性和强大能力,帮助您的产品实现差异化,并加速上市进程。凭借在多个行业中的成熟部署与对主流API的广泛支持,E系列是下一代云游戏硬件的不二之选。

如需了解有关E系列的更多信息,请阅读预览白皮书,或联系Imagination团队安排评估。

英文链接:https://blog.imaginationtech.com/building-custom-graphics-cards-for-cloud-gaming

声明:本文为原创文章,转载需注明作者、出处及原文链接。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 显卡
    +关注

    关注

    17

    文章

    2525

    浏览量

    71797
  • 云游戏
    +关注

    关注

    0

    文章

    49

    浏览量

    3641
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    游戏挂机防息屏!DP公对HDMI母学习型4K60HZ显卡诱骗器方案

    显卡
    深圳市纳祥科技有限公司
    发布于 :2026年05月21日 10:18:49

    宏展科技非标定制复杂测试需求精准 “量体裁衣” 的环境试验箱解决方案

    宏展科技非标定制复杂测试需求精准 “量体裁衣” 的环境试验箱解决方案
    的头像 发表于 04-13 10:59 456次阅读
    宏展科技非标<b class='flag-5'>定制</b>:<b class='flag-5'>为</b>复杂测试需求精准 “量体裁衣” 的环境试验箱解决方案

    基于PixArt PMW3360传感器的游戏鼠标开源项目介绍

      商用旗舰游戏鼠标价格居高不下,性价比拉胯?自带外壳手感不合手,没法适配专属抓握习惯?游戏鼠标用久了按键双击、延迟卡顿,体验大打折扣?想定制专属游戏鼠标,却缺从机械设计到嵌入式固件的
    的头像 发表于 04-03 16:58 3518次阅读
    基于PixArt PMW3360传感器的<b class='flag-5'>游戏</b>鼠标开源项目介绍

    摩尔线程发布图形显卡驱动程序v330.140

    3月20日,摩尔线程正式发布版本号为v330.140的图形显卡驱动程序。本次更新重磅引入MTVSR实时视频超分技术,并针对多款热门游戏及专业软件进行了深度优化,进一步增强了摩尔线程图形显卡在视频播放、
    的头像 发表于 03-24 09:52 427次阅读

    支持OpenGL 4.6与Vulkan 1.3,摩尔线程发布图形显卡驱动v320.130

    S30 显卡用户构建了更坚实可靠的图形性能基石。 在游戏体验上,本次驱动对多款热门游戏进行了深度调优,不仅显著提升了 《DOTA 2》《
    的头像 发表于 12-24 09:42 6.1w次阅读
    支持OpenGL 4.6与Vulkan 1.3,摩尔线程发布图形<b class='flag-5'>显卡</b>驱动v320.130

    TDK推出新型TMR定制传感器解决方案

    TDK株式会社重磅推出新型TMR传感器作为TDK广泛一系列面向玩家及游戏设备厂商的定制传感解决方案,赋予游戏键盘、手柄、鼠标、摄像头、AR/VR设备、方向盘及踏板极致性能和非凡游戏体验
    的头像 发表于 11-14 11:04 1335次阅读

    游戏引擎到AI动力核心

    显卡技术演进:从游戏引擎到AI动力核心 曾经专为图形渲染而生的显卡,如今正成为推动人工智能、边缘计算和科学模拟的关键驱动力。 近年来,显卡技术已从单纯的图形处理单元演变为通用计算加速器
    的头像 发表于 10-30 11:08 482次阅读

    三星推出全新P9 Express固态存储卡,次世代游戏与专业创意工作而生

    2025年10月28日,三星电子正式发布全新microSDExpress存储卡——P9Express固态存储卡。该系列以次世代游戏体验目标打造,针对包括NintendoSwitch™¹等主流
    的头像 发表于 10-28 10:34 731次阅读
    三星推出全新P9 Express固态存储卡,<b class='flag-5'>为</b>次世代<b class='flag-5'>游戏</b>与专业创意工作而生

    termux如何搭建python游戏

    模拟器,支持通过APT包管理器安装软件。搭建Python游戏开发环境前需完成以下基础配置: 1. 更换国内源 提升下载速度,需替换Termux默认源清华源,执行以下命令: ```bash
    发表于 08-29 07:06

    【VisionFive 2单板计算机试用体验】2、打造复古游戏机(Batocera镜像+FBNeo虚拟机, 多款游戏ROM分享)

    衷心感谢电子发烧友论坛! 1、基本知识 制作一个游戏机系统,需要3个关键步骤: Linux游戏系统发行版 游戏模拟器 游戏ROM 下面分别介绍: 2、Linux
    发表于 07-17 21:58

    【VisionFive 2单板计算机试用体验】VisionFive 2一个霸气的游戏

    ,switch,PS2,PS3,PS4上面的游戏统统可以在VisionFive2上面玩,甚至有条件还可以接上英伟达的GXT4090显卡来玩大型显卡杀手单机游戏。完爆树莓派5。 下面就来
    发表于 07-13 20:41

    游戏玩家的听觉革命!这款虚拟 7.1 游戏声卡评估板让你 “声” 临其境!

    来袭,打造沉浸式游戏音频体验,让胜利触手可及!7.1模拟声道A316-V71-Game-V1基于A316-Mini-V1模组设计,是专为游戏市场
    的头像 发表于 07-05 15:35 1384次阅读
    <b class='flag-5'>游戏</b>玩家的听觉革命!这款虚拟 7.1 <b class='flag-5'>游戏</b>声卡评估板让你 “声” 临其境!

    超150款游戏现已支持NVIDIA Reflex

    NVIDIA Reflex 是一项颠覆性技术,可降低 GeForce 显卡、台式电脑和笔记本电脑的 PC 延迟,让玩家更迅速地作出反应,使其在多人游戏中更具竞争力,并且该技术能够让单人游戏拥有更快的响应速度、更加爽快的体验。
    的头像 发表于 06-26 09:29 1410次阅读

    摩尔线程发布图形显卡驱动程序v300.110.1

    近日,摩尔线程发布版本号为v300.110.1的图形显卡驱动程序。本次更新针对近期上市的高人气游戏《剑星》进行了专项优化,MTT S80在该游戏中的平均帧率提升近80%。
    的头像 发表于 06-24 18:01 1388次阅读

    Windows盯上游戏,要做第一平台

    涵盖多种设备的芯片组,包括次世代 Xbox 主机和掌机,还将打造新一代 Xbox 云游戏服务。   在全球游戏产业加速变革的关键节点,微软与 AMD 的合作被业界视为微软巩固 Windows
    的头像 发表于 06-23 02:54 3639次阅读