0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过NSight Compute 2021.3优化GPU利用率

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-13 09:38 次阅读

NVIDIA 发布了最新的 NSight 计算 2021.3,它具有用于测量和建模占用率、源代码和汇编代码相关性的新功能,以及用于识别访问缓存造成的瓶颈的分层屋顶线模型。

占用率计算器

NSight Compute 2021. 3 添加了一个新的占用率计算器活动,帮助您了解内核的硬件资源利用率,并建模调整如何影响占用率。

占用率是每个 SM 的活动扭曲与活动扭曲理论最大数量的比率。占用率低可能表示内核太小、工作负载不平衡或资源争用。所有这些都会限制 GPU 上具有特定可用资源集的内核的性能。

pYYBAGJWKZWAN3dkAAE9rEm4Y0c918.png

图 1 NSight 计算占用计算器的显示

命令行源页面

此版本添加了一个高要求的功能,允许直接从命令行从 GUI 中的源页面访问信息。通过使用--page source标志,用户可以在命令行上看到源代码行、 PTX 行或程序集行以及这些行的收集指标。

在分析收集的数据以及编写脚本和后期处理结果以进行进一步报告和分析时,此功能提供了额外的灵活性。

pYYBAGJWKZqAcxGGAAFKiXuxXQ0498.png

图 2 命令行源输出功能的示例。

分层屋顶线

屋顶线图表现在支持分层屋顶线,除了设备内存之外,还为 L1 和 L2 缓存添加屋顶线。您可以查看它们的内核与每个内存级别的带宽限制有多接近,以确定它们的内核是否存在与访问内存相关的瓶颈。

pYYBAGJWKaGAI4WbAAA-5Gri-ms804.png

图 3 NSight 计算显示屋顶线层次结构比较。

其他增强功能

进一步的功能包括更多可配置的基线比较、从 CLI 直接访问源代码级信息以及附加的 SSH 功能。

关于作者

Jackson Marusarz 是 NVIDIA 计算开发工具的产品经理。他关注如何使用工具使所有开发人员能够轻松高效地评测、调试和优化 CUDA 代码。杰克逊拥有 Boulder 科罗拉多大学计算机工程硕士学位。

Chaitrali Joshi 是 NVIDIA 的产品营销经理,专注于电信 5G 系统的设计和开发。她对网络空间有着深入的了解,是移动通信系统和云栈方面的专家。在英特尔之前,她是一名领导,向开发人员宣传电信技术和边缘计算技术。她获得了加利福尼亚大学计算机科学硕士学位,戴维斯专注于软件定义的网络和多址边缘计算( MEC )。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4576

    浏览量

    101635
  • 内存
    +关注

    关注

    8

    文章

    2759

    浏览量

    72682
  • 计算器
    +关注

    关注

    16

    文章

    424

    浏览量

    36487
收藏 人收藏

    评论

    相关推荐

    台积电晶圆厂产能利用率将全面提高

    消息来源表示,TSMC 8英寸及12英寸晶圆工厂的利用率已分别回升至70-80%和80%。尤其值得注意的是,28纳米制程的利用率已重返80%的常态范围;而7/6纳米与5/4纳米制程的利用率更分别达到75%以及接近饱和状态。
    的头像 发表于 01-17 13:56 221次阅读

    产能利用率降至四成!电池行业迎深度洗牌

    据统计,我国电池生产的平均产能利用率低于50%,即便是龙头企业宁德时代上半年产能利用率也降至60.5%,三季度也仅回升至70%以上,仍处于历史较低水平。
    的头像 发表于 12-28 17:16 399次阅读

    产能利用率低迷,传台积电7nm将降价10%!

    早在今年10月的法说会上,台积电总裁魏哲家就曾被外资当面询问7nm产能利用率不断下滑的问题,台积电7nm在总营收当中的占比持续滑落,从第二季度的23%降至了第三季度17%,相比去年同期的26%更是下跌了近10个百分点。
    的头像 发表于 12-04 17:16 463次阅读

    SPWM与SVPWM—调制比与电压利用率

    学习调制方法时,**调制比**与**电压利用率**是个重要的概念。我发现教材中却对这两个内容介绍的很模糊,网上也没有很多包含具体推导过程的公式。
    的头像 发表于 12-01 17:04 6019次阅读
    SPWM与SVPWM—调制比与电压<b class='flag-5'>利用率</b>

    全球晶圆厂利用率,将降至67%

    尽管情况有所改善,但芯片制造指标仍然疲软,预计 2023 年第四季度晶圆厂利用率将降至 67%,部分原因是库存消耗增加了销售额。因此,预计 2023 年下半年资本支出将下降。
    的头像 发表于 11-15 17:08 427次阅读
    全球晶圆厂<b class='flag-5'>利用率</b>,将降至67%

    晶圆代工产能利用率下降,降价大战一触即发

    晶圆代工行业正面临产能利用率的重大挑战,据悉,联电、世界先进和力积电等主要代工厂纷纷降低明年首季的报价,幅度高达两位数百分比,项目客户降幅更高达15%至20%,各大晶圆代工厂深陷产能利用率六成保卫战。
    的头像 发表于 11-13 17:17 556次阅读

    利用率达到100%的SVPWM控制算法介绍

    在Part4中得到SPWM在理想情况下调制比为1,直流电压利用率为0.866即86.6%,电压利用率也不高,还有13.4%的母线电压没有利用到。
    的头像 发表于 10-18 15:01 2029次阅读
    <b class='flag-5'>利用率</b>达到100%的SVPWM控制算法介绍

    SPWM直流电压利用率之过调制

    本文学习介绍前面几部分还未解决的重要问题提高直流电压利用率之过调制。
    的头像 发表于 10-18 12:49 1753次阅读
    SPWM直流电压<b class='flag-5'>利用率</b>之过调制

    供应链:2023下半年MacBook产能利用率下降40-50%

    苹果公司的许多零部件需要供应商的垂直整合,与其他品牌客户相比,生产能力利用率不仅影响收益,而且对总利润率的影响更显著。
    的头像 发表于 09-13 14:34 508次阅读

    频分复用可以提高通信线路的利用率

    频分复用可以提高通信线路的利用率?  频分复用,英文名为Frequency Division Multiplexing(FDM), 是一种多路复用技术,它可以将多个低速信号合成成一个高速信号进行传输
    的头像 发表于 09-01 15:38 898次阅读

    中芯国际发布第二季度财报,产能利用率上涨10.2%

    利用率方面,财报显示,2023年第二季度的产能利用率为78.3%,相较第一季度上涨了10.2%。此外,中芯国际管理层在对财报的评论中表示,公司第二季度12英寸产能需求相对饱满,虽然8英寸客户需求疲弱,产能利用率低于12英寸,但仍
    的头像 发表于 08-16 16:19 318次阅读

    三星5nm/7nm综合利用率达到90%

    由于人工智能和汽车电子需求不断增长,三星的代工业务利用率超过90%,高于2022年的60%。为此三星已经获得了更多先进处理节点的订单。
    的头像 发表于 07-20 16:52 997次阅读

    GPU利用率低的本质原因

    GPU 利用率主要指 GPU 在时间片上的利用率,即通过 nvidia-smi 显示的 GPU
    的头像 发表于 06-19 14:07 685次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>利用率</b>低的本质原因

    常见GPU利用率低原因分析

    GPU 任务会交替的使用 CPU 和 GPU 进行计算,当 CPU 计算成为瓶颈时,就会出现 GPU 等待的问题,GPU 空跑那利用率就低了
    发表于 06-19 12:22 942次阅读
    常见<b class='flag-5'>GPU</b><b class='flag-5'>利用率</b>低原因分析

    Qt6应用程序的CPU使用率高是什么原因造成的?怎么解决?

    imx6qsabresd 板上运行单个 qt6 应用程序时,我可以看到 %CPU 利用率约为 220%,而在运行 4 个类似的应用程序时,每个 CPU 利用率高达 75%,这看起来确实很大。 在 Irix 模式
    发表于 05-29 07:39