0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Nsight Systems 2021.5优化效率

星星科技指导员 来源:NVIDIA 作者:Chaitrali Joshi 2022-04-13 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Nsight Systems 是强大的调试和评测 NVIDIA Nsight Tools Suite 的一部分。您可以从 Nsight Systems 开始查看整个系统视图,避免基于假设和误报指标选择效率较低的优化。

2021.5 亮点

用户界面中现在提供统计信息

具有水平和垂直布局的多报告视图,有助于跨服务器节点、 VM 、容器、列组和进程进行调查(即将推出)

专家系统现在包括 OpenGL 和 DX12 的 GPU 利用率分析

NVIDIA NIC Infiniband 度量采样(实验)

DirectX12 内存操作和警告

DXGI / DX12 / Vulkan API 调用与 WDDM 队列数据包的相关性

Windows 11 支持

多报告视图增强功能(即将推出)可以改进调查。它们支持合并到单个时间轴报表中,这些报表是现有会话的延续,或者是从其他服务器节点、 VM 、容器、列组和进程同时捕获的报表。

pYYBAGJWKJSAAaAHAAGO5g0XWFY090.png

图 1 来自在共享时间线上一起查看的独立报告文件的两个 MPI 列组

NVIDIA NIC Infiniband 度量采样(实验)使您能够了解服务器通信的详细信息,例如吞吐量、数据包计数和拥塞通知。

poYBAGJWKJyAcp7BAACsbE6SNko576.png

图 2 NVIDIA NIC Infiniband 度量采样

使用 DirectX12 跟踪,一个新的内存操作行将突出显示内存使用警告以及资源非持久映射时调用昂贵函数的情况。

pYYBAGJWKKKAJsghAACAmhlt3yo263.png

图 3 DirectX12 内存操作和警告

WDDM trace 现在将图形 API 调用与队列数据包关联起来,这样您就可以通过 Windows 显示驱动程序模型更好地了解工作负载创建及其进度。

pYYBAGJWKKeARjpYAAJOFVwfOcE849.png

图 4 DXGI 、 DX12 和 Vulkan API 调用与 WDDM 队列数据包的相关性

关于作者

Chaitrali Joshi 是 NVIDIA 的产品营销经理,专注于电信 5G 系统的设计和开发。她对网络空间有着深入的了解,是移动通信系统和云栈方面的专家。在英特尔之前,她是一名领导,向开发人员宣传电信技术和边缘计算技术。她获得了加利福尼亚大学计算机科学硕士学位,戴维斯专注于软件定义的网络和多址边缘计算( MEC )。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109102
  • WINDOWS
    +关注

    关注

    4

    文章

    3697

    浏览量

    93237
  • API
    API
    +关注

    关注

    2

    文章

    2156

    浏览量

    66245
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通过优化代码来提高MCU运行效率

    调用开销。 使用 const 和 volatile 关键字,帮助编译器进行更好的优化。 数据类型选择 使用与MCU字长匹配的数据类型。在32位MCU上,int 和 uint32_t 的处理效率通常
    发表于 11-12 08:21

    蜂鸟E203内核优化方法

    对蜂鸟E203内核进行优化可以考虑以下几个方面: 编译器优化:使用适合蜂鸟E203的编译器选项和指令集,优化编译器的选项和参数,开启对硬件的特定支持,比如使用-O2等优化选项,以提高代
    发表于 10-21 07:55

    如何评估通信协议优化对数据传输效率的提升效果?

    评估通信协议优化对数据传输效率的提升效果,核心逻辑是 “控制变量 + 多维度量化对比”—— 即通过定义明确的评估目标、构建一致的测试环境、选取关键效率指标,对比优化前后的协议表现,最终
    的头像 发表于 08-29 17:52 689次阅读

    面向手持吸尘器的高效FOC驱动系统:优化真空效率与整机能效

    随着智能家居的普及和消费者对清洁效率要求的提升,手持吸尘器的性能优化成为行业焦点。其中,电机驱动系统作为核心部件,直接影响产品的真空效率和整机能效。本文将深入探讨基于磁场定向控制(FOC)的高效驱动系统如何通过技术创新实现手持吸
    的头像 发表于 08-12 17:53 814次阅读

    如何在Ray分布式计算框架下集成NVIDIA Nsight Systems进行GPU性能分析

    在大语言模型的强化学习训练过程中,GPU 性能优化至关重要。随着模型规模不断扩大,如何高效地分析和优化 GPU 性能成为开发者面临的主要挑战之一。
    的头像 发表于 07-23 10:34 2044次阅读
    如何在Ray分布式计算框架下集成NVIDIA <b class='flag-5'>Nsight</b> <b class='flag-5'>Systems</b>进行GPU性能分析

    VirtualLab:光栅的优化与分析

    的算法: TEA和FMM(也称为RCWA)。比较了不同周期的两种类型的光栅(正弦和闪耀)结果。 倾斜光栅的参数优化及公差分析 以傅里叶模态法(FMM)作为参数优化的核心,设计了一个倾斜光栅来实现高衍射效率将光耦合到光波导中的目
    发表于 05-23 08:49

    VirtualLab 应用:倾斜光栅的参数优化及公差分析

    ,也称为RCWA)对倾斜光栅的优化方法。优化后的光栅的衍射效率超过90%。此外,还研究了其对光栅的倾角偏差和圆角边缘的影响。 建模任务 **优化 ** 为了为倾斜光栅找到一组
    发表于 05-22 08:52

    伟创力与Arch Systems深化合作

    在制造业蓬勃发展的时代,利用数据和分析提升竞争力已成为热门话题。伟创力近日进一步深化与制造业数据解决方案领军企业Arch Systems的合作,基于2019年的初步合作,再次携手旨在加速伟创力的数字化转型,提升运营效率与智能自动化水平。
    的头像 发表于 05-08 16:46 698次阅读

    激光送丝焊锡效率优化解决焊接缺陷难题

    在现代电子制造及精密机械生产领域,激光送丝焊锡技术已成为关键工艺。对其效率进行优化,能显著解决诸多生产难题,推动生产效能大幅提升。
    的头像 发表于 03-31 16:15 529次阅读

    氮化镓系统 (GaN Systems) E-HEMTs 的EZDriveTM方案

    氮化镓系统 (GaN Systems) E-HEMTs 的EZDriveTM方案
    的头像 发表于 03-13 16:33 4386次阅读
    氮化镓系统 (GaN <b class='flag-5'>Systems</b>) E-HEMTs 的EZDriveTM方案

    优化汽车点焊生产线,提升制造效率与质量

    在当前的制造业环境中,提高生产效率和产品质量是企业追求的核心目标之一。汽车点焊作为汽车制造过程中的关键环节,其效率和质量直接影响到整车的性能和安全。因此,优化汽车点焊生产线,不仅能够显著提升生产
    的头像 发表于 02-23 11:14 799次阅读

    VirtualLab Fusion应用:倾斜光栅的鲁棒性优化

    纳入优化过程,例如参数变化分析仪。该工具结合了同一系统的多次迭代,在优化过程中实现了评价函数的表示和自动计算,如平均效率。在这个用例中,我们通过稍微改变填充因子来优化倾斜光栅来演示这个
    发表于 02-19 08:58

    如何通过直流负载箱优化电源测试效率

    以下是通过直流负载箱优化电源测试效率的方法: 精准模拟负载 多样化负载模拟:直流负载箱可模拟电阻、电感、电容等不同类型的负载,能根据实际应用场景需求,灵活调整参数,精确模拟各种复杂的负载情况。例如
    发表于 02-13 13:45

    如何优化光耦电路以提高效率

    优化光耦电路以提高效率可以从多个方面进行考虑和实施。以下是一些关键的优化策略: 一、选择高速光耦 高速光耦在设计和材料上进行了优化,具有更快的响应时间和更低的分布电容。因此,在需要高速
    的头像 发表于 01-14 16:44 1379次阅读

    如何使用 UCC28056x 优化离线应用中的效率和待机功耗

    介绍了如何使用 UCC28056x 优化离线应用中的效率和待机功耗,以满足现代产品法规对低待机功耗和高转换效率的要求。
    的头像 发表于 12-17 16:29 2172次阅读
    如何使用 UCC28056x <b class='flag-5'>优化</b>离线应用中的<b class='flag-5'>效率</b>和待机功耗