0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RTX PRO 2000 Blackwell GPU性能测试

丽台科技 来源:丽台科技 2025-11-28 09:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell是全新 NVIDIA Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。

今天我们带来全新NVIDIA RTX PRO2000 Blackwell的测试,对比上一代产品 NVIDIA RTX 2000 Ada Generation 具体有哪些提升。

测试环境

c121469a-c6bf-11f0-8c8f-92fbcf53809c.png

软件测试列表

c189b9dc-c6bf-11f0-8c8f-92fbcf53809c.png

显卡规格

c1ed0e38-c6bf-11f0-8c8f-92fbcf53809c.png

软件测试结果及分析

1. 计算性能:CUDA-Z

CUDA-Z 和 CPU-Z、GPU-Z 相类似,能直观地展现 GPU 显卡的一些性能信息。

c252860a-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c2ad162e-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

2025 丽台(上海)信息科技有限公司

本文所有测试结果均由丽台科技实测得出,如果您有任何疑问或需要使用此测试结果,请联系丽台科技(下同)

单精度浮点运算性能是显卡一项重要的指标,很多计算都是使用单精度完成的。从测试结果来看,RTX PRO 2000 Blackwell 的单精度和 32 位整数计算能力是 RTX 2000 Ada 的1.78倍,RTX PRO 2000 的双精度性能是 RTX 2000 Ada 的1.61倍,RTX PRO 2000 的 64 位整数计算能力是 RTX 2000 Ada 的1.48倍,RTX PRO 2000 的 24 位整数计算能力是 RTX 2000 Ada 的1.67倍。

2. 图形性能:SPECviewperf 15

SPECviewperf 15 主要是用来评测显卡专业图形性能的软件,其中包括了我们常见的 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape、Unreal_engine 软件性能测试,以及医疗和能量仿真性能测试。通过模拟对软件场景的交互操作的速度来评分,最终得出显卡的图形性能的相对性能。

c315a252-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c377cba8-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

从 SPECviewperf 15 的测试结果看,RTX PRO 2000 和 RTX 2000 Ada 的图形交互性能在 Unreal_engine、Medical、Maya、3ds Max的测试中均有1.4倍左右的提升。RTX PRO 2000 在 Solidworks、Creo、Catia、blender 的测试中是 RTX 2000 Ada 的1.5倍左右,RTX PRO 2000 在 Energy 的测试中是 RTX 2000 Ada 的1.72倍,RTX PRO 2000 在 Enscape 的测试中是 RTX 2000 Ada 的2.33倍,图形性能普遍提升。

3. 实时渲染性能

3.1 FurMark

FurMark 是 GPU 测试中常用工具,可以做 OpenGL 性能测试,主要用于评估 GPU 性能级稳定性测试。本次测试 OpenGL 的 4K 实时渲染图形性能,以及室温下 GPU 散热表现。

c3d62626-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c4359336-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

从 FurMark 的实时渲染测试结果中可以看出, RTX PRO 2000 的 OpenGL 4K 性能是 RTX 2000 Ada 的1.46倍。通过长时间烤机(稳定性测试),RTX PRO 2000 的温度控制在 76 度以下。这个温度是在显卡满载运行的情况下测得的,反映了 RTX PRO 2000 在高负载下的散热能力。

3.2 3DMark

3DMark 主要是测试基于大型 3D 场景图形性能的软件,此次测试我们找了两个相对较大的场景进行测试,并测试了 DXR 和 Vulkan 的性能,使用 Port Royal 测试光追的性能。

c49220b0-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c4fc72f8-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

从 3DMark Steel Nomad 的测试结果看,基于 DX 和 Vulkan 的性能测试,RTX PRO 2000 的性能是 RTX 2000 Ada 的1.4倍。在 Port Royal 光追性能测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.5倍。RTX PRO 2000 的渲染性能和光追性能都有了很大的提高。

3.3 NVIDIA Omniverse 工作流实时渲染

NVIDIA Omniverse 是一个包含 APISDK 和服务的平台,使开发者能够将 OpenUSD、NVIDIA RTX 渲染技术和生成式物理 AI 集成到工业和机器人用例的现有软件工具和仿真工作流中。可以支持多人同时在线进行 3D 立体场景的协同搭建,支持丰富的 DCC 生态融合,可以支持光线追踪极具真实感的实时渲染。

c5616a14-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c5c960e2-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

在 Omniverse 实时渲染中,分别测试了开启 NVIDIA DLSS 和关闭 DLSS 进行测试。针对相同场景的 4K 实时渲染,在启用 DLSS 时 RTX PRO 2000 的性能是 RTX 2000 Ada 的5.6倍性能,在不启用 DLSS 时,RTX PRO 2000 的性能是 RTX 2000 Ada 的3.2倍。由于 RTX PRO 2000 具备第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在开启 DLSS 功能后增帧效果显著。

4. 离线渲染性能

渲染在媒体娱乐、设计制造以及建筑行业被广泛的应用,目前很多渲染器均支持 GPU 渲染,而 GPU 渲染的速度就取决于显卡的计算速度。

4.1 V-Ray Benchmark

V-Ray Benchmark 是一款免费的独立渲染速度测试软件,用于测试您计算机的渲染速度。它可以简单快速的测试两种渲染引擎:

> V-Ray GPU CUDA — GPU 渲染模式测试

> V-Ray GPU RTX — RTX GPU 渲染模式测试

本次测试不同 GPU 在不同 V-Ray 5 渲染引擎下的离线渲染性能,并记录最终得分。

c624a75e-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c68d6550-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

在使用 CUDA 和 RTX 渲染测试中,RTX PRO 2000 的性能都是 RTX 2000 Ada 的1.42倍。

4.2 Blender Benchmark

在 Blender Benchmark 中分别使用 3 个场景 monster、junkshop、classroom 进行渲染性能的测试。

c6e438a8-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c7440d50-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

其中在 monster 场景的测试中,RTX PRO 2000 是 RTX 2000 Ada 的1.22倍。在 junkshop 的测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.23倍。在 classroom 的测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.17倍。

5. AI 性能测试

Procyon 推出了面向专业用户的基准测试。Procyon 是 UL 专为工业、企业、政府、零售和媒体领域的专业用户打造的全新基准测试套件。每个 Procyon 基准测试都采用通用的设计和功能集,提供熟悉且一致的体验。灵活的许可机制意味着您可以根据自身需求选择最合适的基准测试。

随着更多测试即将推出,Procyon 基准测试套件将很快为专业用户提供一系列基准测试和性能测试。每个基准测试都针对特定用例而设计,并尽可能使用真实的应用程序。

5.1 AI Compute Video benchmark

在此项测试中,我们选择 NVIDIA TensorRT 来进行测试 NVIDIA GPU 的推理性能,使用精度 Float16 进行推理计算,推理速度越快,得分越高。

c79f3ed2-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c7fe1d94-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

针对 AI 视频计算在 TensorRT Float16 位精度的测试中,RTX PRO 2000 是 RTX 2000 Ada 的1.30倍。

5.2 AI Text Generation Benchmark

在此项测试中,软件分别使用 4 个模型进行测试,分别基于 Llama 2、Llama 3.1、Mistral 7B、Phi 3.5 四个大模型进行推理生成,通过推理速度相对应的时间来对比 GPU 的性能。

c85eb69a-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c8bb6462-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

从上图测试的结果来看,在 Llama 2 测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.40倍。在 Llama 3.1 测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.34倍。在 Mistral 7B 测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.38倍。在 Phi 3.5 测试中 RTX PRO 2000 是 RTX 2000 Ada 的1.31倍。

5.3 AI Image Generation Benchmark

本项测试 Procyon 将调用 Stable Diffusion XL 进行测试,分别使用 FP16、W8A16 以及 XL 版本 FP16 进行推测试,来测试 GPU 的图像生成性能。

c9126938-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

c9734e24-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

从上图测试的结果来看,使用 Stable Diffusion 1.5 Light 进行测试时,RTX PRO 2000 是 RTX 2000 Ada 的1.35倍。使用 Stable Diffusion 1.5 FP16 精度进行测试时,RTX PRO 2000 是 RTX 2000 Ada 的1.53倍。在 SDXL 中使用 FP16 精度测试,RTX PRO 2000 是 RTX 2000 Ada 的1.51倍。

5.4 Flux.1 AI Image Generation

使用 Flux.1 量化 FP4 的模型,对比上一代产品使用 FP8 精度的生成速度。

c9d3218c-c6bf-11f0-8c8f-92fbcf53809c.png

▲ RTX PRO 2000 Blackwell 测试结果截图

ca3255c6-c6bf-11f0-8c8f-92fbcf53809c.png

▲ 测试结果图表

由于 Blackwell 架构的 Tensor Core 可以支持 FP4 精度的推理,所以在很多 AIGC 的应用领域中,在不影响生成质量的情况下可以使用 FP4 来进行加速生成。而上一代 Ada Lovelace 架构的产品仅支持 FP8,在这种情况下,在相同的任务下使用 RTX PRO 2000 的性能是 RTX 2000 Ada 的6.14倍。

总结

NVIDIA RTX PRO 2000 Blackwell GPU 采用节能高效的紧凑外观规格,可提供卓越的性能。测试结果表明,其综合性能较前代产品 RTX 2000 Ada 有大幅提升。

CUDA 核心数相较上一代产品增加了 54%,因此在诸多应用场景下性能都有了很大的提高。

在 AI 性能方面,第 5 代 Tensor Core 增加了对 FP4 精度的支持,并结合 GDDR7 显存,可加速 AI 增强型工作流,所以这个功能未来会在 AI 推理上会有很大的应用,对应的推理性能也会有很大提升。原本使用 FP16 或者 FP8 的推理的场景,也有了 30%~50% 的提升。

在 DLSS 的应用上,可以支持最新的帧生成技术,从 Omniverse 的测试中可以看出,对实时渲染的帧数确实有很大的提升作用。

在专业 CAD 和 DCC 的交互性能提升幅度巨大,可以适配小机箱,支持更多的工业制图、DCC 内容生产的更大应用场景。

在离线渲染方面也有了 20%~40% 的性能提升,渲染出图或者视频的性能会更快。

综上所述,在半高专业图形卡中,NVIDIA RTX PRO 2000 凭借其紧凑的外型及出众的性能,在新技术的加持下,为小机箱用户提供了更好的选择。此外 RTX PRO 2000 带有全高档片,也可适配于 4U 全高机箱,结构紧凑,性能强大。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5259

    浏览量

    136039
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302517

原文标题:小巧机身,强大 AI:NVIDIA RTX PRO 2000 Blackwell 测评解读

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    ,推理能力提升 15 倍 GB200由两个B200Blackwell GPU和一个基于Arm的Grace CPU组成,采用[台积电]4纳米工艺制程,共有2080亿个[晶体管],其AI性能为每秒20
    发表于 05-13 17:16

    NVIDIA火热招聘GPU性能计算架构师

    这边是NVIDIA HR Allen, 我们目前在上海招聘GPU性能计算架构师(功能验证)的岗位,有意向的朋友欢迎发送简历到 allelin@nvidia
    发表于 09-01 17:22

    NVIDIA发布RTX A2000 GPU加速设计工作流程中的AI和光线追踪

    全新RTX A2000 GPU采用小巧、节能的设计,适用于更多台式机,同时加速设计工作流程中的AI和光线追踪。 NVIDIA RTX技术凭借
    的头像 发表于 08-13 11:06 8378次阅读

    NVIDIA发布 GeForce RTX 40 系列 GPU

    NVIDIA 发布 GeForce RTX 40 系列 GPU,旨在为游戏玩家和创作者提供革命性性能,其中新旗舰产品 RTX 4090
    的头像 发表于 09-22 10:38 2083次阅读

    全新 NVIDIA RTX Enterprise 驱动程序支持最新的 RTX 6000 Ada 架构 GPU,助力改进图形工作流

    的定期更新还能够优化并提高 GPU 性能,为专业人员提供强大助力。 NVIDIA RTX Enterprise Release 525(R525) 现已上线,可支持
    的头像 发表于 12-27 21:15 2559次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1680次阅读

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 2734次阅读

    NVIDIA Blackwell白皮书:NVIDIA Blackwell Architecture Technical Brief

    NVIDIA Blackwell白皮书:NVIDIA Blackwell Architecture Technical Brief
    的头像 发表于 03-20 18:35 3442次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束
    的头像 发表于 03-28 09:59 1429次阅读

    NVIDIA Blackwell推动流式传输和数据分析的未来发展

    RTX PRO Blackwell GPU 系列推动智能内容创建、超个性化媒体和实时视频管线的发展。
    的头像 发表于 03-28 10:02 1199次阅读

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition
    的头像 发表于 08-18 11:50 1623次阅读

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO
    的头像 发表于 08-28 11:02 4320次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 4500 <b class='flag-5'>Blackwell</b> <b class='flag-5'>GPU</b><b class='flag-5'>测试</b>分析

    NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 现已全面上市,将基于 NV
    的头像 发表于 12-24 10:32 1073次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 5000 72GB <b class='flag-5'>Blackwell</b> <b class='flag-5'>GPU</b>现已全面上市

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    Generation 的全面超越。那么,这款划时代的专业 GPU 在真实应用场景中的表现究竟如何?今天,我们将通过深度实测,为您揭晓 NVIDIA RTX PRO 4000
    的头像 发表于 12-29 15:30 1804次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 4000 <b class='flag-5'>Blackwell</b> <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>测试</b>

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 BlackwellNVIDIA RTX 5000
    的头像 发表于 01-06 09:51 3849次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> <b class='flag-5'>PRO</b> 5000 <b class='flag-5'>Blackwell</b> <b class='flag-5'>GPU</b>的深度评测