看虚拟化在PowerVR GPU中是如何进行

电子设计 2018-05-17 09:14 次阅读

过去的几年里,虚拟化的概念——将软件从承载其的硬件中分离出来——已经为许多人所熟知。在本文中,我们将描述虚拟化是什么,看看它在PowerVR GPU中是如何工作的,并解释它是如何给各种市场(尤其是汽车行业)带来巨大的利益。

对于电脑来说,目前的虚拟化技术能够让一台计算机同时运行多个操作系统,例如,一个开发人员可以在Microsoft Windows主机上运行一个Linux“访客”操作系统,而对于企业而言,它通常用来整合工作负载以减少CapEx和OpEx。在嵌入式平台上,虚拟化技术的主要目的则是在降低成本的同时通过分离确保安全性。

当涉及到GPU时,虚拟化提供了支持多个操作系统同时运行的能力,每个操作系统都能够将图形工作负载提交给底层的图形硬件实体。这在汽车领域变得越来越重要。例如,通过将一些要求严格的系统比如ADAS(高级驾驶辅助系统)和数字化显示面板分别放在完全独立域内以保证他们安全独立的运行。

为了打破它,虚拟化GPU需要执行如下操作:

•  管理程序(Hypervisor):这基本上是为访客操作系统提供共享虚拟硬件平台(在本例中为GPU硬件)并管理客户操作系统托管的软件实体。

•  主机操作系统(Host OS)——相比访客操作系统,主机操作系统具有完整的驱动程序并且对底层硬件具有更高级的控制能力。

•  访客操作系统(Guest OS):由虚拟机管理程序托管的具有操作系统的虚拟机,可以是一个或多个,它们可以共享底层可用的硬件资源。

硬件虚拟化 vs 半虚拟化

自Series6系列GPU内核以来,PowerVR已经具备高级的、完整的硬件虚拟化特性,并且在Series8XT中得到了进一步的增强,我们将在本文后面深入讨论这个细节。通过完全虚拟化,这意味着管理程序下运行的每个访客操作系统都不会意识到它正与其他访客操作系统和主机操作系统共享GPU资源。每个访客系统都具有完整的驱动程序,并且可以以独立和并发的方式直接向底层硬件提交任务。这种方式的好处是在处理不同“访客”的任务提交时不会再有管理程序的开销,从而也减少了向GPU提交任务的等待时间,因此具有更高的利用率。

这与半虚拟化解决方案有所不同,在半虚拟化方式中,访客操作系统能够意识到它们是虚拟化的并且与其他访客系统共享底层硬件资源。这种情况下访客系统需要通过管理程序(Hypervisor)提交任务,整个系统必须作为一个内聚单元协同工作。该解决方案的缺点是管理程序(运行在CPU上)的开销过高,任务提交延迟过长,这潜在的降低了底层GPU硬件的有效利用率。此外,还需要修改访客操作系统(添加额外的功能)以使得它们能够通过管理程序进行通信。

GPU虚拟化使用案例:

GPU虚拟化应用案例很多,下面列举的主要集中在嵌入式市场:
 •  汽车
 •  数字电视(DTV)/机顶盒(STB)
 •  物联网(IoT)/可穿戴设备
 •  智能手机/平板电脑

我们在这篇文章中讨论的虚拟化主要集中在汽车方面,因为在这个市场,虚拟化将会带来很多的好处。它有特定的要求,这使它成为比较复杂的市场之一,对于这方面的内容你可以参考我们的白皮书

为什么汽车市场需要虚拟化?

GPU虚拟化正在成为汽车行业的必备需求。大多数一级代理商和OEM厂商都选择加入更多的ADAS功能,在新款汽车中多个高分辨率的显示器也变得越来越普遍。

随着汽车越来越自动化,ADAS的功能也随之增加。这些功能在计算上十分复杂,而现在GPU强大的并行计算能力使得它们能够很好的处理这些任务。于此同时,仪表板集群和信息娱乐设备(在仪表板和后排座位处)以及挡风玻璃上更高分辨率的显示正在成为发展趋势。

PowerVR虚拟化和Series8XT为汽车行业带来变革

汽车系统虚拟化环境中支持多个应用程序展示

面向汽车行业

那么,为什么PowerVR虚拟化特性如此适合汽车呢?从本质上讲,这是因为它提供了一系列解决多种问题的特性,例如,硬件稳健性以实现最大的安全性和服务质量,以确保持续的性能,同时确保硬件的最大硬件利用率。

隔离

首先让我们看看基本的隔离方式,这是不同操作系统(OS)及其对应的应用程序之间的隔离,这些应用程序通过分离应用程序来提供安全性,当然这是虚拟化基本的好处之一。

下面的视频演示了这个特性,视频中显示的是一个操作系统,一个显示关键信息比如速度、警示灯等的显示器,并在其旁边有一个导航应用程序,这是一个不太重要的操作系统,先是卫星导航应用程序崩溃(人为),紧随其后是“内核崩溃”,然后是全面的重启。我们要注意的关键点是这些并不会影响运行在其他操作系统上的仪表板显示应用;它继续完全不间断的工作,另外请注意,一旦这个操作系统重新启动,它就能再次无缝的向GPU提交任务。

服务质量:保证性能水平

汽车行业的关键要求之一是要求一个或多个关键应用程序/操作系统得到足够的资源来提供所需的性能。在PowerVR上,这是通过优先级机制实现的,GPU中一个专用的微控制器(MCU)处理调度并对每个操作系统的优先级进行设置(如果需要也可以设置每个操作系统中应用程序/工作负载的优先级)。当更高优先级操作系统的工作负载提交给GPU时,低优先级操作系统的工作负载会从上下文中切换出来。

在简单的术语中,“上下文切换”是当前操作在尽可能早的时间点暂停的地方,所需的数据会被保存出来以便在稍后的时间点恢复操作时使用。

在本次演示中使用的Series6XT(第一代PowerVR GPU支持完全硬件虚拟化)平台最早可能使用的时间点是:
 •  几何处理:调用绘制粒度
 •  像素处理:贴片粒度
 •  计算处理:工作组粒度

一旦更高优先级操作系统的工作复杂完成后,较低优先级的工作负载就会恢复并完成,这个特性有助于确保关键的更高优先级的工作负载获得所需的GPU资源,从而保证所需性能要求。

下面的视频演示了这一点,视频中在GPU上运

更进一步:Series 8XT增强虚拟化

第一个支持完全硬件虚拟化的PowerVR系列是Series6XT,上文中所有视频/演示使用的都是Series 6XT平台。在本节,我们将讨论在Series8XT如何进一步增强,并提供了一些新特性和增强功能。

上下文切换细粒度

在Series8XT上,中上下文切换可以更细粒度地执行,从而确保更快速的上下文切换,在较低优先级的工作负载和较高优先级的工作负载之间的切换,上下文切换细粒度目前主要是:
  •   顶点处理:原始粒度
  •   像素处理:次平铺或最坏情况下回到贴片粒度

每个数据主的终止

在优先级较低的应用没有在定义的时间范围内切换上下文的情况下,这时需要根据数据主(计算、顶点或像素处理)采用DoS机制终止某个集成或者将应用程序进行软件复位。前几代只支持计算终止,而顶点和像素处理则需要软复位,因此如果与不安全的低优先级应用程序重叠运行,则会影响高优先级的工作负载。在Series8XT中,现在所有数据主都可以被终止,确保即使高优先级/关键的工作负载与需要结束的应用程序重叠时也不会受到影响。

每个SPU工作负载的提交控制

得益于此特性,一个特定的应用程序就可以在GPU中为它自己的可扩展处理单元(SPU)执行它的工作负载。例如,有利于汽车中基于计算的长时间运行的ADAS应用,在应用程序中可以不间断的运行自己的专用SPU,而其他应用程序,可能来自于其他操作系统,则使用另一种机制(比如基于上下文切换的更高优先级任务)分享剩余的GPU资源。

紧密集成二级MMU

上一代的GPU采用一级MMU,因此要求SoC供应商设计并实现二级/系统级MMU或相似的机制来支持虚拟化。现在Series8XT已经在GPU中集成了二级MMU,这带来了以下好处:
  •   优化设计并与一级MMU紧密耦合,实现低延迟并提高效率
  •   降低SoC供应商的开发难度,使产品更快的上市
  •   在管理应用程序中对于可用的实体设置对应的独立软件
  •   支持全/双向相干支持,提高性能并减少系统带宽
  •   从本质上说,可以在虚拟化环境中提供更高级别的保护和更小的细粒度(页界,计算机专用名词)安全支持

总结

PowerVR GPU集成的硬件虚拟化技术非常的有效,非常适合并满足汽车行业的许多需求。我们最新的Series8XT GPU已经证明了这一点,它进一步加强了它的功能,以帮助实现下一代车载信息娱乐和自动驾驶, 安全且经济高效。

热门推荐

收藏 人收藏
分享:

评论

相关推荐

Congruity360利用AI提高风险评估过程的速度和精度

风险评估对于大多数行业都是一项至关重要的工作,而在企业合并或收购中尤为关键。如今,AI的应用也延伸到....

的头像 英伟达NVIDIA企业解决方案 发表于 05-23 11:46 117次阅读
Congruity360利用AI提高风险评估过程的速度和精度

物联网卡是一把双刃剑

顾名思义,物联网卡是运营商根据物联网专线,面向有物联网需求的用户提供的移动通信接入业务。

的头像 物联网技术 发表于 05-23 09:47 64次阅读
物联网卡是一把双刃剑

AI芯片作为AI时代的基础设施,也成为目前行业最热门的领域

不久前,谷歌在I/O大会发布了其第三代TPU,并宣称其性能比去年的TUP 2.0提升8倍之多,达到每....

发表于 05-22 11:51 110次阅读
AI芯片作为AI时代的基础设施,也成为目前行业最热门的领域

ECHELON是一款基于NVIDIA GPU的高性能油藏模拟软件

模拟器一般在基于CPU的硬件上运行,在模型性能和规模方面均受到限制。花费数天来运行模型的情况很常见。....

的头像 英伟达NVIDIA企业解决方案 发表于 05-22 11:40 212次阅读
ECHELON是一款基于NVIDIA GPU的高性能油藏模拟软件

NVIDIA Volta GPU中内置的Tensor Core GPU架构是NVIDIA深度学习平台的巨大进步

Tensor Core所运行的张量应位于存储器的channel-interleaved型数据布局(数....

的头像 英伟达NVIDIA企业解决方案 发表于 05-21 17:35 367次阅读
NVIDIA Volta GPU中内置的Tensor Core GPU架构是NVIDIA深度学习平台的巨大进步

离散化架构WAGE,训练推理合二为一

ICLR 是深度学习领域的顶会,更被誉为深度学习的 “无冕之王”,得到了 google, Faceb....

的头像 新智元 发表于 05-20 11:11 337次阅读
离散化架构WAGE,训练推理合二为一

OpenAI发布了一份关于AI计算能力增长趋势的分析报告

我们没有测量硬件的峰值理论FLOPS,而是尝试估计执行的实际操作的数量。我们将加法和乘法作为单独的操....

的头像 新智元 发表于 05-19 07:46 320次阅读
OpenAI发布了一份关于AI计算能力增长趋势的分析报告

浪潮在美国发布深度学习计算框架Caffe

4月6日消息(美国硅谷当地时间4月5日)今日,在2016年GPU全球技术大会(GTC16)上,浪潮开....

发表于 05-18 18:03 58次阅读
浪潮在美国发布深度学习计算框架Caffe

PowerVR 2NX成为驱动神经网络应用解决方案

毫无疑问,神经网络变得越来越流行,在各式各样的产品中都可以找到它的相关应用。它们会根据你的兴趣自动调....

的头像 电子设计 发表于 05-17 09:23 885次阅读
PowerVR 2NX成为驱动神经网络应用解决方案

为何说OpenGL ES上使用Vulkan不适合作为SDK

我们非常高兴的告诉大家最新版本的PowerVR SDK框架5.0和相关工具第二版本正式推出,这次更新....

的头像 电子设计 发表于 05-17 09:23 716次阅读
为何说OpenGL ES上使用Vulkan不适合作为SDK

从Shader编成入手了解GPU应用方案

由于 GPU 具有高并行结构(highly parallel structure),所以 GPU 在....

的头像 Imagination Tech 发表于 05-17 09:18 560次阅读
从Shader编成入手了解GPU应用方案

锐龙Pro现已同时拥有Zen CPU、Vega GPU两大新架构,并支持AMD GuardMI技术

而今天的锐龙Pro同时拥有Zen CPU、Vega GPU两大新架构,并支持AMD GuardMI技....

发表于 05-16 11:29 101次阅读
锐龙Pro现已同时拥有Zen CPU、Vega GPU两大新架构,并支持AMD GuardMI技术

AMD全面迈入7nm Zen 2和7nm Vega的设计已经完成

昨晚,AMD发布了最新一波新品路线图,其中第二代Ryzen ThreadRipper(锐龙线程撕裂者....

发表于 05-16 11:19 81次阅读
AMD全面迈入7nm  Zen 2和7nm Vega的设计已经完成

英伟达GPU广泛使用 将带来下一场AI变革

日前,英伟达 Developer Blog 上一篇博文详细陈述了英伟达 Volta Tensor C....

的头像 人工智能学家 发表于 05-16 10:03 377次阅读
英伟达GPU广泛使用 将带来下一场AI变革

GPU全球短缺问题 码隆科技获纽约时报、华尔街日报关注

随着人工智能和加密货币发展的日益兴盛,国际间芯片短缺问题也浮上了台面,GPU的价格在过去几个月上涨近....

发表于 05-15 17:11 65次阅读
GPU全球短缺问题 码隆科技获纽约时报、华尔街日报关注

英伟达:GPU虚拟化“风口”来临 VDI+vGPU会是桌面云应用的主流

GPU虚拟化会不会在桌面云应用中成为主流?早在2014年就已经有人给出了肯定的答案。但在应用实践中....

发表于 05-15 10:03 155次阅读
英伟达:GPU虚拟化“风口”来临 VDI+vGPU会是桌面云应用的主流

GPU绘图的四个阶段包括裁剪阶段,光栅化阶段,像素阶段和输出阶段概述

GPU绘图的几个阶段:裁剪,光栅化,像素,输出

的头像 Imagination Tech 发表于 05-13 11:46 575次阅读
GPU绘图的四个阶段包括裁剪阶段,光栅化阶段,像素阶段和输出阶段概述

使用shouldRasterize属性如何解决GPU视图的混合和过度绘制的概述

GPU每一帧可以绘制的像素有一个最大限制(就是所谓的fill rate),这个情况下可以轻易地绘制整....

的头像 Imagination Tech 发表于 05-13 11:36 483次阅读
使用shouldRasterize属性如何解决GPU视图的混合和过度绘制的概述

suggestphone独家披露了骁龙710和骁龙730的规格资料

不过,首次曝光的骁龙730处理器则尚未有其他信息被披露,并且何时面市和出货也同样没有任何信息,但按照....

的头像 电子技术应用ChinaAET 发表于 05-13 10:04 1197次阅读
suggestphone独家披露了骁龙710和骁龙730的规格资料

Imagination 和 OTOY 共同发布突破性的硬件加速渲染平台

Imagination Technologies 和 OTOY 共同发布突破性的硬件加速渲染平台,其....

发表于 05-11 09:38 62次阅读
Imagination 和 OTOY 共同发布突破性的硬件加速渲染平台

领先的机器学习工具,深度学习将如何改变医疗成像领域?

在医学成像领域,疾病的准确诊断或评估取决于图像采集和图像解译。近年来,随着技术的发展,设备能以更快地....

发表于 05-10 11:54 162次阅读
领先的机器学习工具,深度学习将如何改变医疗成像领域?

Intel将推进自家独立显卡的研发

早在CES期间,就有消息曝出Intel将推进自家独立显卡的研发。近日,再有媒体爆料Intel将于明年....

发表于 05-09 16:18 119次阅读
Intel将推进自家独立显卡的研发

看GPU如何打败当今堪称无敌的细菌大敌

我们与耐抗生素的细菌正处于激烈对抗中,但借助GPU加速计算的模拟实验,研究人员将能够为新疗法的研发指....

的头像 英伟达NVIDIA企业解决方案 发表于 05-09 14:29 275次阅读
看GPU如何打败当今堪称无敌的细菌大敌

利用Jetson TK1为低功耗图像识别挑战做好准备

图像识别和GPU相辅相成,特别是在使用深度神经网络(DNN)时。 基于GPU的DNN在图像识别领域的....

的头像 设计idea 发表于 05-08 15:29 313次阅读
利用Jetson TK1为低功耗图像识别挑战做好准备

Cache是什么 CPU和GPU对于cache的应用

在计算机存储系统的层次结构中,介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一....

发表于 05-08 11:15 225次阅读
Cache是什么 CPU和GPU对于cache的应用

GPU光栅化阶段和几何阶段的术语介绍

GPU流水线主要分为两个阶段:几何阶段和光栅化阶段 几何阶段 顶点着色器 ——> 曲面细分着色器(可....

发表于 05-07 12:45 62次阅读
GPU光栅化阶段和几何阶段的术语介绍

一张图看懂GPU计算能力超强的原因是什么

下图对CPU与GPU中的逻辑架构进行了对比。其中Control是控制器、ALU算术逻辑单元、Cach....

发表于 05-07 11:47 372次阅读
一张图看懂GPU计算能力超强的原因是什么

基于GPU下AGP显卡的渲染流程

首先根据下图粗略说明一下当前普遍流行的AGP(Accelerated Graphics Port,图....

发表于 05-07 10:43 63次阅读
基于GPU下AGP显卡的渲染流程

GPU硬件加速时系统运行步骤

这里用时下非常流行的骑游运动做个比方,正常情况下你在骑行的时候只有腿部在进行蹬踩运动(CPU正常运算....

发表于 05-07 10:32 174次阅读
GPU硬件加速时系统运行步骤

优化任何GPU工作负载的峰值性能分析方法

弄清楚如何在个人电脑上降低渲染应用程序的GPU帧时间可能是一项具有挑战性的任务,即使是最有经验的PC....

的头像 设计idea 发表于 05-07 10:10 1170次阅读
优化任何GPU工作负载的峰值性能分析方法

GPU设计中 Furian扩展性详解

假设您已经设计了一个完整的GPU。您可能已经开始处理几何图形、通过光栅化将其转换成像素、纹理单元、从....

发表于 05-07 08:17 45次阅读
GPU设计中 Furian扩展性详解

新华三服务器:三大领域推出新品 指明未来发展潮流

新华三服务器:融通现有技术 对未来求索不止 新华三在服务器领域可以说是一直保持领先状态,总体战略可以....

发表于 05-05 10:16 87次阅读
新华三服务器:三大领域推出新品 指明未来发展潮流

谷歌TPU2和英伟达V100的性能详细对比

本文详细对比了谷歌TPU2和英伟达V100的性能,有两个对比方向:一是测试在没有增强过的合成数据上的....

的头像 智车科技 发表于 05-04 14:38 788次阅读
谷歌TPU2和英伟达V100的性能详细对比

适合在GPU上运行的程序 挖矿为何只用GPU

满足以上两点,就可以用GPU做运算了。 不过你还得先用Open CL 把能在GPU上运行的程序写出来....

发表于 05-04 10:06 131次阅读
适合在GPU上运行的程序 挖矿为何只用GPU

浅谈GPU的渲染流水线实现

颜色表示了不同阶段的可配置性或可编程性:绿色表示该流水线阶段是完全可编程控制的,黄色表示该流水线阶段....

发表于 05-04 09:16 97次阅读
浅谈GPU的渲染流水线实现

构建控制电路和CacheGPU,高性能计算应用设计

基于GPU的通用计算已成为近几年人们关注的一个研究热点。将GPU用于通用计算的主要目的是为了加速计算....

的头像 Imagination Tech 发表于 05-03 09:15 736次阅读
构建控制电路和CacheGPU,高性能计算应用设计

CPU内存或GPU内存进行分组方式实战

在CPU+GPU协同计算中,CPU和GPU的计算能力不同,静态地给CPU和GPU划分任务会导致CPU....

的头像 Imagination Tech 发表于 05-03 09:01 1070次阅读
CPU内存或GPU内存进行分组方式实战

进行移动端Unity开发,针对引擎PowerVR性能建议

大部分优化操作都适用于移动平台,但是也有一些是专门面向PowerVR平台的。也就是说,无论你的目标应....

的头像 Imagination Tech 发表于 05-03 08:58 890次阅读
进行移动端Unity开发,针对引擎PowerVR性能建议

彰显黑科技奥义渲云XRENDER2018耀世而出 支持GPU渲染

渲云是国内最快的云渲染公共服务平台,已成为AUTODESK唯一合法授权的云渲染平台及战略合作伙伴。渲....

发表于 05-02 18:55 57次阅读
彰显黑科技奥义渲云XRENDER2018耀世而出 支持GPU渲染

GPU管线各个阶段知识点详细的分析理解

GPU渲染流水线,是硬件真正体现渲染概念的操作过程,也是最终将图元画到2D屏幕上的阶段。GPU管线涵....

的头像 Imagination Tech 发表于 04-28 16:28 566次阅读
GPU管线各个阶段知识点详细的分析理解

Unity中Sharder的3个类别及区分

GPU上含有两个组件:可编程顶点处理器和可编程片段处理器,顶点和片段处理器被分离成可编程单元,可编程....

的头像 Imagination Tech 发表于 04-28 16:21 445次阅读
Unity中Sharder的3个类别及区分

看看Arm与合作伙伴设计了哪些有大脑的智能手机摄像头

移动仍然是一个充满活力的行业,技术创新为这个行业带来了繁荣,特别是围绕摄像头相关技术。2017 年,....

发表于 04-28 15:41 212次阅读
看看Arm与合作伙伴设计了哪些有大脑的智能手机摄像头

由RTX提供支持的NVIDIA OptiX光线追踪

光线追踪与光栅化 自20世纪90年代以来,传统的3D渲染通常使用称为光栅化的过程。 栅格化使用从三角....

的头像 设计idea 发表于 04-28 14:24 2206次阅读
由RTX提供支持的NVIDIA OptiX光线追踪

浪潮将持续深化“计算+”战略,聚焦人工智能等智慧计算创新技术应用

随着云、大数据等智慧计算形态的发展,ISV、SI等合作伙伴在技术储备、人才以及业务模式等方面也面临着....

的头像 浪潮存储 发表于 04-28 11:11 1226次阅读
浪潮将持续深化“计算+”战略,聚焦人工智能等智慧计算创新技术应用

IBM开发“混合精度内存计算”,能耗降低了80倍

IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习....

的头像 新智元 发表于 04-27 17:42 613次阅读
IBM开发“混合精度内存计算”,能耗降低了80倍

主流的移动GPU研究分析

现在的手机发展远远超出大部分人的预料,四核CPU的出现,内存达到2G,这都是以往我们不敢想象的。但是....

发表于 04-27 15:21 107次阅读
主流的移动GPU研究分析

用GPU加速的深度学习,提高冰雹预测能力

当雷暴中的上升气流强到足以将水滴带到结冰层以上的高空时,冰雹便会产生。这些冻结的水滴变成冰雹,且会随....

的头像 英伟达NVIDIA企业解决方案 发表于 04-27 09:43 624次阅读
用GPU加速的深度学习,提高冰雹预测能力

GPU加速仿真和AI渲染,革新沉浸式设计工作流程

通常在CAD软件中,工作站计算能力及图形处理能力的提高,也将概念设计中的交互性提升至新高度。

的头像 英伟达NVIDIA企业解决方案 发表于 04-27 09:36 381次阅读
GPU加速仿真和AI渲染,革新沉浸式设计工作流程

人工智能到底用 GPU?还是用 FPGA?

发表于 08-23 15:42 1733次阅读
人工智能到底用 GPU?还是用 FPGA?

为什么中国应将Imagination收入囊中?

发表于 06-26 09:04 2934次阅读
为什么中国应将Imagination收入囊中?