0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何选择NVIDIA GPU和虚拟化软件的组合方案呢?

丽台科技 来源:丽台科技 2024-01-12 09:26 次阅读

NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站,加速图形和计算,使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。

完整的 NVIDIA vGPU 方案包含 GPU 硬件与 vGPU 软件,将 GPU 硬件与 vGPU 软件解耦,能够使用户定期从软件的更新功能中受益,同时也为 IT 部门提供灵活性,以满足不同环境中用户的特定需求。

那么,如何选择能满足用户工作负载要求的 NVIDIA GPU 和虚拟化软件的组合方案呢?

今天我们从 vGPU 的许可类型、软件版本、支持的虚拟化平台、物理 GPU、虚拟机 vGPU Profile 等方面来介绍 NVIDIA vGPU 的软硬件选型指南,以帮助您选择适合不同工作负载的虚拟化软件和 GPU。

vGPU 许可类型的选择

NVIDIA vGPU 目前包含三种许可类型,NVIDIA Virtual Applications (vApp)、NVIDIA Virtual PC (vPC)、NVIDIA RTX Virtual Workstation (vWS),原来的 NVIDIA Virtual Compute Server (vCS) 已合并至 NVIDIA AI Enterprise (NVAIE) 软件套件中,本篇不做阐述。那么,在日常的虚拟化应用场景中,如何选择合适的 vGPU 许可类型呢?

8a31d1de-b0de-11ee-8b88-92fbcf53809c.png

1

vApp

vApp 即 NVIDIA Virtual Applications(NVIDIA 虚拟应用程序)软件,专为应用程序流和远程桌面共享主机 (RDSH) 工作负载而设计。

2

vPC

vPC 即 NVIDIA Virtual PC(NVIDIA 虚拟 PC)软件,专为知识工作者 VDI 工作负载而设计,可加速以下软件和应用设备:

办公生产力应用程序,如 Office 软件

流媒体视频

Windows OS

多显示器

高分辨率显示器

2D 电子设计自动化 (EDA)

3

vWS

vWS 即 NVIDIA RTX Virtual Workstation(NVIDIA RTX 虚拟工作站)软件,专为专业图形工作负载而设计,主要优势有:

RTX Enterprise 平台驱动程序和 ISV 认证

支持 NVIDIA CUDA 工具包和 OpenCL

更高分辨率的显示器

具有大量帧缓冲区的 vGPU 配置文件

NVIDIA RTX vWS 可加速专业设计和可视化应用程序,例如:

Autodesk Revit

Dassault Systèmes CATIA

Esri ArcGIS Pro

Maya

Petrel

SolidWorks

NVIDIA vGPU 软件版本及虚拟化平台的推荐

历经十多个版本的迭代更新,NVIDIA vGPU 软件已经更新到最新的 vGPU 16 版本,目前仍在支持的 NVIDIA vGPU 软件版本有 NVIDIA vGPU software 13、NVIDIA vGPU software 15 和 NVIDIA vGPU software 16,其各自的 EOL 日期如下:

8a5252c4-b0de-11ee-8b88-92fbcf53809c.png

考虑到使用日期和售后支持等方面,推荐使用 vGPU 16 版本。

vGPU 16.2 版本为例,其支持的系统和虚拟化产品如下,用户可以根据现有的虚拟化平台进行选择。

1

Citrix Hypervisor

8a68b23a-b0de-11ee-8b88-92fbcf53809c.png

2

Microsoft Azure Stack HCI

8a84950e-b0de-11ee-8b88-92fbcf53809c.png

3

Microsoft Windows Server

8a9ee67a-b0de-11ee-8b88-92fbcf53809c.png

4

Red Hat Enterprise Linux with KVM

8ab1f102-b0de-11ee-8b88-92fbcf53809c.png

5

Ubuntu with KVM

8acf222c-b0de-11ee-8b88-92fbcf53809c.png

6

VMware vSphere ESXi

8ae77fe8-b0de-11ee-8b88-92fbcf53809c.png

7

Nutanix AHV

该版本的 NVIDIA vGPU 软件支持 Nutanix AHV,基于 Linux 的 KVM 虚拟机管理程序。

未在列表中的、基于 Linux KVM 开发的其他虚拟化平台,需要和厂家确认是否兼容适配 vGPU 软件,建议实际测试,确定是否可以正常安装部署。

物理 GPU 的选择

NVIDIA vGPU 软件需要在具备 NVIDIA GPU 的平台上运行。vGPU 通过 time-sliced(时间切分)的方式共享 GPU 引擎,包括图形 (3D)、视频编解码引擎等,不同的 GPU 具备不同的规格,用户可以根据性能、成本和显存大小等因素选择合适的 GPU。针对目前仍在支持的虚拟 GPU 软件版本,支持的 GPU 有:

8b0c27ee-b0de-11ee-8b88-92fbcf53809c.png

虚拟机 vGPU Profile 的设定

可用 vGPU Profile 配置文件,在虚拟化教程 (2) 和虚拟化教程 (3)(点击蓝字跳转链接)中介绍许可类型功能特性时有提到,包括 vWS 的 1Q/2Q/../48Q,vPC 的 1B/2B,vApp 的 1A/2A/.../48A,可以将其认为是给虚拟机分配的显存大小。

经常有用户会问:如何去设定 vGPU Profile,才能满足当下的应用场景和业务需求?

大致可以从以下三个方向去考虑:

首先,反推法,先确定当下使用的物理 GPU 型号,以及支持应用程序或业务工作负载所需的显存大小,再反推应该怎么去划分。

其次,可以根据具体的应用程序官方推荐的 GPU 和显存大小等硬件需求,来进行具体的 vGPU 文件的配置和显存划分。

最后,正向测试方法,比如设计类用户,考虑到运行模型大小以及复杂程度的不同,可以通过一些工具或寻求供应商来评估,获取 POC 支持和优化的方案。这里推荐两个工具:

1

GPU Profiler

GPU Profiler(GitHub 上可下载)是一个常用的工具,可以实时记录资源在虚拟机上执行工作负载时的利用率。该工具通常在 POC 阶段帮助调整虚拟环境大小,以确保可接受的性能。GPU Profiler 可以在具有各种 vGPU 配置文件的单个 VM 上运行。可以获取以下指标:

帧缓冲区

GPU 利用率

vCPU

内存

视频编码

视频解码

2

NVIDIA System Management Interface

(nvidia-smi)

NVIDIA vGPU Manager 提供监控功能,让 IT 人员能够了解更好地利用 NVIDIA vGPU 的各种引擎的使用情况,包括帧缓冲区、编解码器等都可以通过命令行界面工具 nvidia-smi 进行监控和记录,并可以在 Hypervisor 或者虚拟机内进行访问。

适用于虚拟化工作负载的

NVIDIA vGPU解决方案推荐

NVIDIA 虚拟化解决方案与基于当下 NVIDIA Ada Lovelace 和 Ampere 架构的 GPU 配合使用时,可提供巨大的灵活性和性能,从而满足当今企业不断变化的工作负载和组织需求。

8b1e9096-b0de-11ee-8b88-92fbcf53809c.png

▲ 推荐 vGPU 软硬件方案

如上图所示,如果追求最大限度地提高虚拟化工作负载的性能,可以考虑性能优化的 GPU,如果考虑到成本因素,则可以选择高性价比的 GPU。

当然,除了 NVIDIA 数据中心 GPU 之外,还有很多其他 GPU 支持虚拟化,包括 NVIDIA RTX 专业图形卡系列:NVIDIA RTX 5880 Ada Generation、NVIDIA RTX 5000 Ada Generation、NVIDIA RTX A5000 等。用户可根据具体需求,选择合适的 GPU 和软件。

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101713
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126689
  • 虚拟机
    +关注

    关注

    1

    文章

    855

    浏览量

    27374
  • OpenCL
    +关注

    关注

    2

    文章

    47

    浏览量

    33126
  • 多显示器
    +关注

    关注

    0

    文章

    2

    浏览量

    1130

原文标题:虚拟化教程 (4) : NVIDIA vGPU 软硬件选型指南

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    198.云方案5:GPU虚拟,如何通过盒子远程玩游戏(上)

    gpu虚拟
    小凡
    发布于 :2022年10月04日 12:27:00

    NVIDIA GRID K1 K2桌面虚拟图形加速解决方案

    三年质保工业包装现货Nvidia GRID K1GPU 的数量和类型:4*Kepler CUDA核心数量:768 专用存储器总容量:16GB DDR3用于虚拟功耗:139W热设计功耗
    发表于 09-09 11:38

    NVIDIA Tesla K20C K20M 高精密并行计算GPU

    Nvidia GRID K2GPU 的数量和类型:2*Kepler CUDA核心数量:3072 专用存储器总容量:8GB DDR5用于虚拟功耗:225W热设计功耗 被动散热 2100
    发表于 02-05 16:14

    【技术系列】浅谈GPU虚拟技术(第一章)

    的基于GRID的各种方案,比如非常炫酷的Game Streaming。其实GRID 是大概念。代表了NvidiaGPU虚拟的一大摞产品。
    发表于 04-16 10:51

    NVIDIA-SMI:监控GPU的绝佳起点

    nvidia-smi可执行文件位于虚拟机管理程序上。如果在同一部署中您选择GPU上使用作为传递,那么GPU正在寻找访客上的
    发表于 09-04 15:18

    GPU虚拟在哪里发生?

    GPU虚拟在哪里发生?它是否出现在GRID卡中,然后将vGPU呈现给管理程序然后呈现给客户?或者,GPU虚拟
    发表于 09-28 16:45

    如何在vGPU环境中优化GPU性能

    选择和NUMA注意事项的调整技巧和窍门。可在此处找到GTC 2014图形虚拟峰会的会话录音:https://gridforums.nvidia.com/default/topic/1
    发表于 09-29 14:18

    可以使用适用于云计算中HPC的GPU虚拟

    是否可以使用NVidia虚拟在云计算中使用GPU虚拟创建VM群集?怎么能实现
    发表于 09-30 10:47

    使用NVIDIA GPU虚拟环境中进行视频转码

    ?310-Server-specifications-for-NVIDIA-NVENC-and-NVIDIA-CUDA-acceleration-with-Wowza-Transcoder你能告诉我决定:1. NVIDIA M6 SW许可仅以桌面
    发表于 09-30 10:43

    Nvidia GPU风扇和电源显示ERR怎么解决

    连接显示屏的GPU的风扇和电源报错:解决方案自动风扇控制在nvidia论坛有人给出了解决方案,即问题的根源可能是风扇转速不足使GPU过热导致
    发表于 12-30 06:44

    在Ubuntu上使用Nvidia GPU训练模型

    问题最近在Ubuntu上使用Nvidia GPU训练模型的时候,没有问题,过一会再训练出现非常卡顿,使用nvidia-smi查看发现,显示GPU的风扇和电源报错:解决
    发表于 01-03 08:24

    NVIDIA虚拟GPU技术:用户将享受来自“云端”的极致体验

    NVIDIA虚拟GPU业务副总裁John Fanelli近期接受采访时介绍NVIDIA虚拟GPU
    的头像 发表于 07-09 15:44 2661次阅读

    基于NVIDIA虚拟GPU解决方案的桌面云正式商用

    日前,基于NVIDIA®虚拟GPU的深信服桌面云产品正式发布,这也是国内首批基于KVM技术的vGPU虚拟桌面解决方案
    的头像 发表于 07-25 18:18 4950次阅读

    NVIDIA虚拟GPU助力华辰重机直面挑战

    华辰重机选用NVIDIA虚拟GPU解决方案,构建了高效、集约、安全的数控机虚拟化终端设计平台,保证了近百亿知识资产的数据。
    的头像 发表于 07-28 10:54 3363次阅读

    湘电风能为何选择NVIDIA虚拟GPU解决方案

    湘电风能利用NVIDIA虚拟GPU技术,保护核心关键数据资产,进一步提升工作效率。
    的头像 发表于 09-11 17:06 3736次阅读