0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为云游戏打造定制显卡

颖脉Imgtec 2025-12-04 11:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据Grandview Research的预测,到2030年全球云游戏市场将超过200亿美元,其中亚太地区将占据约45%的市场机会。然而,目前主流的GPU解决方案主要是为数据中心计算而设计的,并不适用于云游戏独特的经济模型。云游戏的盈利能力依赖于在保持高质量用户体验的前提下,每颗GPU能支持的高并发用户数量。

对于正在开发云游戏硬件的公司而言,选择合适的GPU IP将决定其产品能否快速成功进入市场,或因延迟而承担巨大成本。Imagination的E系列采用经过验证且可扩展的架构,帮助团队以更低风险、更佳投资回报率(ROI)打造差异化产品、加速上市。

任何新硬件若想在激烈竞争中站稳脚跟,必须在性能、特性与成本上找到正确平衡。关键要求包括:可扩展并持续稳定的性能、满足多用户服务场景的能力、对目标应用的全面支持,以及在小面积(降低晶体管成本)与低功耗(降低运维成本)下实现上述能力。

Imagination是著名的PowerVR GPU架构的研发公司。尽管Imagination的IP起源于移动、消费电子和汽车领域,但近年来越来越多的云计算与个人计算定制显卡厂商采用其GPU IP。例如,芯动科技的风华系列显卡便采用了Imagination的GPU技术。

今年早些时候,Imagination推出了全新的E 系列 GPU 内核:一款高能效的GPU IP,集成32 TOPS INT8的片上AI加速能力,并支持每核16个虚拟环境。本文将介绍云游戏显卡厂商如何基于E系列实现产品差异化。


云游戏的持续帧率表现

用于桌面市场的Imagination GPU每核可实现72 GPixel/s的性能,并可通过多核技术进一步扩展(稍后会详细介绍)。持续性能得益于一系列最大化GPU利用率并降低热降频的架构基础设计:

高效的SIMT执行模型:多线程执行相同指令提升吞吐量,降低控制开销;同时共享指令获取与解码阶段,提高资源利用率。Imagination最新GPU在每个着色集群中可支持128条并行线程。

先进的调度能力:细粒度调度机制确保着色器核心保持忙碌,避免停顿,即使在游戏负载变化时也能维持高利用率。

强调本地存储访问:将中间计算结果存储在快速本地存储中,可减少外部DRAM往返,从而在复杂视觉效果中提供更高性能。

基于Tile的延迟渲染(TBDR)技术:将画面分成更小的tile并在芯片内部处理,可最大程度降低外部内存带宽使用;减少overdraw可在高几何复杂度场景中提升效率。(欲了解TBDR在桌面与数据中心市场的适用性,请参考相关博客文章。)

先进压缩技术:减少系统中数据传输量可大幅降低功耗,并提升帧率持续性。

这些特性相互配合,为云游戏用户提供稳定、无抖动(jitter-free)的体验。它们还与全新的高能效E系列Burst Processor(爆发处理器)协同工作,大幅提升性能并降低功耗,使图形管线始终保持高效运行。

爆发处理器(Burst Processor)改变了计算逻辑单元处理任务的方式。它不再每个周期切换任务,而是将操作以不可分割的单元提交至计算逻辑单元,从而避免任务中断,并减少对寄存器存储器低效读写操作的次数。该方案还允许在ALU内部存储中间数据,进一步减少寄存器存储器的读写操作量。通过降低对寄存器存储器的整体需求,GPU能有效提升利用率并持续更长时间保持高性能——这正是云游戏需要持久性能表现的理想方案。


为计算密集型特效提供额外性能

无论是3A大作还是休闲游戏,如今都越来越多地包含计算密集型细节。诸如模糊和景深等流行特效需要GPU执行复杂的数据采样和数学运算。为高效处理此类特效,GPU最初演进出了通用计算着色器,而E系列在此基础上更进一步。

E系列的GPU内置AI加速功能,在执行低精度运算(如FP16或INT8)时,速度比D系列同类产品快4倍。在1GHz频率下,单颗E系列GPU可提供:

传统着色器工作负载:2 FP32 TFLOPS

AI加速渲染:16 FP16 TFLOPS

AI工作负载与渲染:32 TOPS INT8

7be8a3e6-d0c1-11f0-8ce9-92fbcf53809c.png

E系列GPU内置AI加速器集成于统一着色集群(USC)内部,以实现性能最大化并降低带宽消耗。

最核心的设计在于:E系列GPU将矩阵乘法加速功能集成于计算逻辑单元(ALU)内部。相较于在远离着色集群的位置增设独立加速单元,这种集成式设计显著减少数据移动,从而在降低带宽消耗和功耗的同时提升性能。开发者可通过主流GPU API和行业标准扩展轻松调用这些额外性能。

基于E系列GPU的显卡由此能高效运用AI技术加速渲染流程的关键环节。云游戏公司可借助超级分辨率等主流解决方案,更快更高效地生成高分辨率帧,从而实现单张GPU承载更多玩家的目标。


无缝扩展

我们的GPU可通过提升时钟频率实现更高性能;更重要的是——这对云游戏显卡设计师至关重要——它们能构建成多核解决方案。

Imagination创新的多核架构无需直接依赖中央处理单元连接,即可灵活实例化任意数量的GPU核心。这有别于传统GPU可扩展性方案——后者受限于所有着色器核心必须连接至单一集中化模块,该模块包含集中式内存数据路径、任务管理器及几何切片引擎。传统方案常遭遇拥塞与布局灵活性问题。

我们的多核扩展流程采用去中心化松耦合架构,既为芯片设计师提供布局与设计自由度,又实现带宽效率最大化。精心设计确保图形工作负载能在不同核心间无缝扩展,最大限度减少瓶颈。例如,不同核心上的E系列分块加速器可同时处理非依赖性几何工作负载,使GPU能快速渲染复杂的AAA级游戏。

欲了解Imagination GPU高效扩展的更多原理,请参阅此博客。

对于云游戏显卡而言,这首先意味着E系列GPU可扩展至服务商期望的性能水平。Imagination的多核解决方案还具备额外优势:每个核心作为独立GPU,可动态重配置为协同工作(实现单用户性能最大化)或独立运行(实现多租户灵活性最大化)。

7bf4016e-d0c1-11f0-8ce9-92fbcf53809c.png

采用主-从模式协同运作的多核网格,以实现单用户性能最大化。

7bff0bf4-d0c1-11f0-8ce9-92fbcf53809c.png

采用主-主模式运行的多核网格,以实现最大灵活性。


通过灵活的多用户能力,使收入最大化

云服务提供商通常会设置不同的价格等级,以最大化其收入来源。因此,不同的用户需要不同级别的图形性能,而云游戏GPU则必须具备高度灵活的工作负载分配能力来满足这些差异化需求。

为此,我们的GPU IP集成了一个智能固件处理器,能够直接处理GPU事件。它负责管理与其他GPU核心及第三方处理器之间的交互、对渲染任务进行优先级排序,以及处理错误与调试。这与许多依赖CPU和驱动栈进行调度的GPU IP供应商不同,后者无法提供同等水平的灵活性。

这个智能固件处理器使E系列GPU能够支持多种云游戏场景:从在单颗GPU核心上运行多个容器,到将多个核心组合并动态协调跨核心的工作负载,以提供最大化的单用户体验。

虚拟化是云环境中另一项关键的多任务技术。它可以用于保障高端用户的安全与隐私,或支持远程桌面等使用场景。对于服务提供商来说,在一颗GPU上承载多个虚拟机(VM)也有助于实现故障隔离,避免其中一个虚拟机的崩溃影响到其他玩家。

E系列GPU提供先进的基于硬件的虚拟化方案(HyperLane),每核可运行多达16个不同的操作系统,并实现完整的内存隔离、无干扰、服务质量(QoS)保障和任务优先级控制。由于HyperLane是硬件级方案,其性能更高、软件复杂度更低,相比其他软件虚拟化方式具有明显优势。

想了解更多关于Imagination独特虚拟化技术的信息,请参阅相关白皮书。


以ROI为导向的设计

Imagination的产品可以扩展至云级性能,但我们的GPU架构即便在高性能条件下也保持其著名的面积效率和功耗效率。我们坚持“以更少实现更多”的理念,这在云市场中尤为关键。对面积敏感的架构可以降低定制芯片的开发成本,提高新方案的竞争力;低功耗产品则有助于服务商控制能源成本。

E系列进一步提升了Imagination的效率水平:

  • 提供超过D系列3倍的计算性能密度

  • 在采用神经核(Neural Cores)和爆发处理器(Burst Processors)后功耗效率提升最高可达35%
  • 成熟的软件生态体系

云游戏平台可以放心依赖Imagination GPU提供强大的软件支持,以运行当今最具挑战性的游戏大作。随着云端Android休闲游戏在市场上占据主导,Imagination在Android生态中的深厚积累——基于多年来在移动领域的领先经验——使其成为值得信赖的选择。

我们的GPU完整支持Khronos Group的主流移动图形API:

Vulkan

OpenGL ES

确保从设备到云端顺畅、可扩展的游戏体验。

在PC游戏方面,我们最新一代GPU增加了对DirectX的硬件级支持,而E系列进一步扩展至支持DirectX 12,并提供高性能PC游戏的参考驱动。对于较老的游戏,E系列也通过ZINK框架支持OpenGL 4.6


结语

随着云游戏的快速增长,特别是在中国等关键市场,硬件设计者需要一种在性能、可扩展性与能效之间取得平衡、没有妥协的GPU IP。Imagination的E系列GPU架构提供了极具吸引力的解决方案——将强大的图形渲染、AI加速、多用户能力与功耗优化设计融为一体。

无论您面向的是大众休闲云游戏市场,还是高端AAA游戏体验,E系列都具备足够的灵活性和强大能力,帮助您的产品实现差异化,并加速上市进程。凭借在多个行业中的成熟部署与对主流API的广泛支持,E系列是下一代云游戏硬件的不二之选。

如需了解有关E系列的更多信息,请阅读预览白皮书,或联系Imagination团队安排评估。

英文链接:https://blog.imaginationtech.com/building-custom-graphics-cards-for-cloud-gaming

声明:本文为原创文章,转载需注明作者、出处及原文链接。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 显卡
    +关注

    关注

    16

    文章

    2517

    浏览量

    71077
  • 云游戏
    +关注

    关注

    0

    文章

    49

    浏览量

    3554
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【VisionFive 2单板计算机试用体验】2、打造复古游戏机(Batocera镜像+FBNeo虚拟机, 多款游戏ROM分享)

    衷心感谢电子发烧友论坛! 1、基本知识 制作一个游戏机系统,需要3个关键步骤: Linux游戏系统发行版 游戏模拟器 游戏ROM 下面分别介绍: 2、Linux
    发表于 07-17 21:58

    Windows盯上游戏,要做第一平台

    涵盖多种设备的芯片组,包括次世代 Xbox 主机和掌机,还将打造新一代 Xbox 云游戏服务。   在全球游戏产业加速变革的关键节点,微软与 AMD 的合作被业界视为微软巩固 Windows
    的头像 发表于 06-23 02:54 2994次阅读

    技嘉正式推出 RTX™ 5060 Ti 和 5060 显卡,先进散热方案提升游戏与 AI 体验

    ™ 5060 系列显卡,并将于 4 月 16 日起陆续上市。此系列产品专为主流游戏玩家、创作者与 AI 入门使用者设计,通过升级版 WINDFORCE 散热系统,在性能与散热效率间达到绝衡,带来更流畅
    的头像 发表于 04-16 10:07 747次阅读

    电子芯片产品在游戏手柄中的应用方案

    随着游戏设备的升级,游戏手柄作为核心交互设备持续技术革新。在主机游戏中,高精度操作适配动作格斗、模拟驾驶等多种游戏类型,显著提升玩家沉浸感。在云游戏
    的头像 发表于 04-15 09:42 1366次阅读
    艾<b class='flag-5'>为</b>电子芯片产品在<b class='flag-5'>游戏</b>手柄中的应用方案

    云游戏的基础资源类型

    云游戏的基础资源类型 可根据功能与部署模式划分为以下类别,其核心构成及细分如下: 一、按功能划分的资源类型 计算与渲染资源‌ 硬件规格‌:云端服务器需配置高性能CPU、GPU集群,例如腾讯云定义
    的头像 发表于 04-09 10:18 519次阅读
    <b class='flag-5'>云游戏</b>的基础资源类型

    英特尔锐炫B系列显卡XeSS 2技术正式支持网易游戏

    当霹雳火划破纽约街道的瞬间,你是否沉浸在丝滑流畅的决胜时刻?在龙隐洞天刀光剑影的生死对决中,0.1秒的延迟也可能成为胜负关键。全新英特尔锐炫 B系列显卡(代号Battlemage)与多款火爆游戏
    的头像 发表于 03-08 09:19 1081次阅读

    尼赛拉霍尔元件NHE520F解决显卡过热问题

    对于游戏玩家和图形工作者来说,显卡性能至关重要。但在实际使用中,显卡过热降频是个令人头疼的问题。比如在玩大型 3A 游戏时,激烈的团战场景下,显卡
    的头像 发表于 02-27 16:40 780次阅读

    hyper v 显卡,Hyper-V 显卡:提升Hyper-V的显卡性能

    解决。今天就为大家介绍Hyper-V显卡:提升Hyper-V的显卡性能。    在虚拟化环境中,显卡性能对于需要高图形处理能力的应用场景(如游戏、图形设计和视频编辑)至关重要。Hype
    的头像 发表于 02-07 10:22 2714次阅读
    hyper v <b class='flag-5'>显卡</b>,Hyper-V <b class='flag-5'>显卡</b>:提升Hyper-V的<b class='flag-5'>显卡</b>性能

    ARM主板定制打造专属智能硬件

    在竞争激烈的市场环境中,标准化产品已无法满足企业日益增长的个性化需求。ARM主板定制服务应运而生,企业提供量身定制的硬件解决方案,助力企业打造差异化竞争优势,引领行业未来。为何选择A
    的头像 发表于 02-05 14:14 747次阅读
    ARM主板<b class='flag-5'>定制</b>:<b class='flag-5'>打造</b>专属智能硬件

    hyper v 显卡,hyper-v显卡如何挑选?

    hyper-v显卡如何挑选。    在挑选适合Hyper-V的显卡时,可以考虑以下几个方面:    1.明确需求:首先,明确你的使用场景。如果主要用于办公、上网和简单的图像处理,中低端显卡即可满足需求;如果需要运行大型软件、进行
    的头像 发表于 02-05 13:40 729次阅读
    hyper v <b class='flag-5'>显卡</b>,hyper-v<b class='flag-5'>显卡</b>如何挑选?

    技嘉科技发布GeForce RTX 5090 D 和RTX 5080系列显卡

    尺寸缩减最高达 10%,玩家带来更强大、更精巧的电竞体验。首发支持DLSS 4的游戏已经有75款游戏和应用,那么对于暂时不支持DLSS 4的游戏
    的头像 发表于 01-28 10:31 1986次阅读
    技嘉科技发布GeForce RTX 5090 D 和RTX 5080系列<b class='flag-5'>显卡</b>

    hyper v 显卡,hyper-v显卡:如何在虚拟机中配置和优化显卡性能

    在当今数字化时代,数据已成为企业的重要资产。然而,如何高效管理和利用这些数据,成为企业面临的重大挑战。批量管理工具以其强大的功能,企业提供了全新的解决方案。今天就为大家介绍hyper-v显卡
    的头像 发表于 01-24 14:19 1.1w次阅读
    hyper v <b class='flag-5'>显卡</b>,hyper-v<b class='flag-5'>显卡</b>:如何在虚拟机中配置和优化<b class='flag-5'>显卡</b>性能

    摩尔线程发布新版显卡驱动,游戏性能大幅提升

    近日,摩尔线程正式发布了其最新的图形显卡驱动程序v280.90.2。此次更新的驱动带来了多项针对主流游戏的性能优化,玩家提供了更加流畅、高效的游戏体验。 据悉,新的驱动程序对《飞向月
    的头像 发表于 01-21 14:51 1076次阅读

    电子助力ROG游戏手机ASUS ROG9发布

    作为游戏手机赛道上的领军者,ROG游戏手机ASUS ROG9 正式发布。ROG代表着高性能与极致体验。ASUS ROG9主摄采用六轴防手震Hybrid云台4.0,内置艾集成式OIS Driver IC,提供±5°的运动补偿,强
    的头像 发表于 01-14 11:36 1155次阅读
    艾<b class='flag-5'>为</b>电子助力ROG<b class='flag-5'>游戏</b>手机ASUS ROG9发布

    技嘉CES 2025发布RTX 50系列显卡,升级散热缩小体积

    和RTX™ 5070等型号。这些显卡均基于NVIDIA Blackwell架构及AI技术,用户带来前所未有的游戏体验。 技嘉新一代RTX 50系列显卡搭载了专为NVIDIA GeFo
    的头像 发表于 01-13 11:16 1207次阅读