0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Nsight Systems 2021.5优化效率

星星科技指导员 来源:NVIDIA 作者:Chaitrali Joshi 2022-04-13 09:33 次阅读

Nsight Systems 是强大的调试和评测 NVIDIA Nsight Tools Suite 的一部分。您可以从 Nsight Systems 开始查看整个系统视图,避免基于假设和误报指标选择效率较低的优化。

2021.5 亮点

用户界面中现在提供统计信息

具有水平和垂直布局的多报告视图,有助于跨服务器节点、 VM 、容器、列组和进程进行调查(即将推出)

专家系统现在包括 OpenGL 和 DX12 的 GPU 利用率分析

NVIDIA NIC Infiniband 度量采样(实验)

DirectX12 内存操作和警告

DXGI / DX12 / Vulkan API 调用与 WDDM 队列数据包的相关性

Windows 11 支持

多报告视图增强功能(即将推出)可以改进调查。它们支持合并到单个时间轴报表中,这些报表是现有会话的延续,或者是从其他服务器节点、 VM 、容器、列组和进程同时捕获的报表。

pYYBAGJWKJSAAaAHAAGO5g0XWFY090.png

图 1 来自在共享时间线上一起查看的独立报告文件的两个 MPI 列组

NVIDIA NIC Infiniband 度量采样(实验)使您能够了解服务器通信的详细信息,例如吞吐量、数据包计数和拥塞通知。

poYBAGJWKJyAcp7BAACsbE6SNko576.png

图 2 NVIDIA NIC Infiniband 度量采样

使用 DirectX12 跟踪,一个新的内存操作行将突出显示内存使用警告以及资源非持久映射时调用昂贵函数的情况。

pYYBAGJWKKKAJsghAACAmhlt3yo263.png

图 3 DirectX12 内存操作和警告

WDDM trace 现在将图形 API 调用与队列数据包关联起来,这样您就可以通过 Windows 显示驱动程序模型更好地了解工作负载创建及其进度。

pYYBAGJWKKeARjpYAAJOFVwfOcE849.png

图 4 DXGI 、 DX12 和 Vulkan API 调用与 WDDM 队列数据包的相关性

关于作者

Chaitrali Joshi 是 NVIDIA 的产品营销经理,专注于电信 5G 系统的设计和开发。她对网络空间有着深入的了解,是移动通信系统和云栈方面的专家。在英特尔之前,她是一名领导,向开发人员宣传电信技术和边缘计算技术。她获得了加利福尼亚大学计算机科学硕士学位,戴维斯专注于软件定义的网络和多址边缘计算( MEC )。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4588

    浏览量

    101702
  • WINDOWS
    +关注

    关注

    3

    文章

    3438

    浏览量

    87142
  • API
    API
    +关注

    关注

    2

    文章

    1381

    浏览量

    60988
收藏 人收藏

    评论

    相关推荐

    光伏并网逆变器如何提升转换效率

    提升光伏并网逆变器的转换效率是光伏系统优化和提高经济效益的重要途径。
    的头像 发表于 04-18 16:39 132次阅读

    具有轻载效率优化的单相 PWM 控制器TPS53211数据表

    电子发烧友网站提供《具有轻载效率优化的单相 PWM 控制器TPS53211数据表.pdf》资料免费下载
    发表于 04-17 10:42 0次下载
    具有轻载<b class='flag-5'>效率</b><b class='flag-5'>优化</b>的单相 PWM 控制器TPS53211数据表

    安达发|基于约束和优化理论的APS智能优化排程软件

    随着制造业竞争的加剧,企业需要不断提高生产效率以降低成本。APS智能优化排程系统应运而生,通过先进的数学算法和智能化技术,为企业提供最优的生产计划,助力制造业实现高效生产。 背景:近年来,制造业
    的头像 发表于 01-05 17:42 149次阅读

    如何使用微逆变器、功率优化器提高光伏系统发电效率

    一块太阳能板因为阴影或其他问题导致发电效率下降会导致系统的整体发电效率下降,如图一所示。而且,单板的远程监控也很难实现。因此,此方式正逐渐被更优的方案替代。 图一、组串逆变器,单板阴影影响整体发电效率 使用功率
    的头像 发表于 01-03 14:55 258次阅读
    如何使用微逆变器、功率<b class='flag-5'>优化</b>器提高光伏系统发电<b class='flag-5'>效率</b>?

    DC电源模块的能效优化探索与应用

    DC电源模块的能效优化探索与应用是一项重要的研究领域。能效优化可以提高电源模块的功率转换效率,减少能源的浪费,降低电源模块的发热量,延长其使用寿命。以下是一些能效优化的探索和应用方向:
    的头像 发表于 12-22 14:28 176次阅读
    DC电源模块的能效<b class='flag-5'>优化</b>探索与应用

    MySQL性能优化方法

    MySQL 性能优化是一项关键的任务,可以提高数据库的运行速度和效率。以下是一些优化方法,包括具体代码和详细优化方案。
    的头像 发表于 11-22 09:59 264次阅读

    如何优化Linux内核UDP收包效率

    很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,Linux内核协议栈收包效率
    的头像 发表于 11-10 10:51 279次阅读
    如何<b class='flag-5'>优化</b>Linux内核UDP收包<b class='flag-5'>效率</b>低

    GaN Systems 第四代氮化镓平台概述

    全球氮化镓功率半导体领导厂商GaN Systems 今推出全新第四代氮化镓平台 (Gen 4 GaN Power Platform),不仅在能源效率及尺寸上确立新的标竿,更提供显著的性能表现优化及业界领先的质量因子 (figur
    发表于 10-08 17:22 286次阅读

    GaN Systems 推出第四代氮化镓平台 突破能源效率瓶颈 加速应用版图拓展

    重点摘要 GaN Systems第四代氮化镓平台 (Gen 4 GaN Platform) 帮助全球客户在能源效率及尺寸微缩上突破瓶颈。 以业界领先的质量因子 (figures of merit
    发表于 09-28 09:28 273次阅读

    keil的编译优化等级要怎么设置?

    使用低的话担心效率太低,优化太高担心运行中出错,要怎么设置
    发表于 09-21 06:45

    优化Unity程序的方法

    优化是接受应用程序并使其更有效率的过程。对于图形应用程序,优化通常意味着修改应用程序以使其更快。例如,低帧率的游戏可能会显得跳跃,这会给人留下不好的印象,并可能使游戏难以玩。您可以使用优化
    发表于 08-02 18:52

    使用STM32缓存来优化性能与功率效率应用笔记

    电子发烧友网站提供《使用STM32缓存来优化性能与功率效率应用笔记.pdf》资料免费下载
    发表于 08-01 10:02 0次下载
    使用STM32缓存来<b class='flag-5'>优化</b>性能与功率<b class='flag-5'>效率</b>应用笔记

    有条理开发和无条理开发的效率对比

    有条理开发和无条理开发的效率对比 1有条理 功能表(30分钟) 草稿(30分钟) 程序(30分钟) 调试(30分钟) 优化(30分钟) 总计2小时30分钟 2无条理 程序(30分钟) 调试(2小时) 优化(2小时) 总计:4小时
    发表于 06-09 13:33

    NVIDIA AI 技术助力 vivo 文本预训练大模型性能提升

    NVIDIA Nsight Systems 性能分析工具进行性能瓶颈分析,并在此基础上,针对 gather、dropout、softmax、scale、layernorm 等算子进行优化。 客户简介及应用背景
    的头像 发表于 05-26 07:15 444次阅读
    NVIDIA AI 技术助力 vivo 文本预训练大模型性能提升

    一文终结SQL子查询优化

    子查询(Subquery)的优化一直以来都是 SQL 查询优化中的难点之一。关联子查询的基本执行方式类似于 Nested-Loop,但是这种执行方式的效率常常低到难以忍受。
    的头像 发表于 04-28 14:19 474次阅读
    一文终结SQL子查询<b class='flag-5'>优化</b>