0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新版本CUDA 11.6工具包的功能

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-02 16:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 发布的 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。 CUDA 继续推动 GPU 加速度的边界,并为 HPC 、可视化、 AI 、 ML 和 DL 和数据科学中的新应用奠定基础。

CUDA 11.6 有几个重要特性。这篇文章概述了关键功能:

GSP 驱动程序架构现在默认为图灵和安培 GPU

新 API 允许禁用实例化图中的节点

完全支持 128 位整数类型

协作组命名空间更新

CUDA 编译器更新

Nsight Compute 2022.1 版本

CUDA 11.6 附带 R510 驱动程序,这是一个更新分支。 CUDA 11.6 工具包可供下载 。

GSP 驱动程序体系结构

GSP 驱动程序体系结构现在是所有列出的图灵和安培 GPU 的默认驱动程序模式。较旧的驱动程序体系结构作为后备支持。有关更多信息,请参阅 R510 驱动程序自述 。

实例化的图形节点 API 添加

我们添加了一个新的 API cudaGraphNodeSetEnabled,以允许禁用实例化图中的节点。在此版本中,支持仅限于内核节点。相应的 API cudaGraphNodeGetEnabled允许查询节点的启用状态。我们还添加了禁用空内核图节点启动的功能。

128 位整数支持

CUDA 11.6 包括 128 位整数(__int128)数据类型的完整版本,包括编译器和开发工具支持。主机端编译器必须支持__int128类型才能使用此功能。

协作组名称空间

协作组名称空间已更新为新函数,以提高命名、函数范围以及单元维度和大小的一致性。

CUDA 编译器

在编译过程中向目标安装的 GPU 添加了-arch=native编译选项。这扩展了现有的-gencode=arch=compute_xx,code=sm_xx体系结构规范

添加从nvlink创建 PTX 文件的功能

不推荐的功能

不推荐使用用于设备上 fork 和 join 并行的cudaDeviceSynchronize(),以便为具有更高性能的替换编程模型做准备。这些函数在本版本中继续工作,但这些工具会发出有关即将发生的更改的警告。

CentOS Linux 8 已经到了生命的尽头 在 2021 年 12 月 31 日,对这个操作系统的支持现在在 CUDA 工具包中被弃用。 CentOS Linux 8 支持将在未来版本中完全取消。

关于作者

Rob Armstrong 是 CUDA 工具包的主要技术产品经理。 20 多年来,他一直专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互特别感兴趣。

Arthy Sundaram 是 CUDA 平台的技术产品经理。她拥有哥伦比亚大学计算机科学硕士学位。她感兴趣的领域是操作系统、编译器和计算机体系结构。

Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高级产品营销经理。弗雷德拥有加州大学戴维斯分校计算机科学和数学学士学位。他的职业生涯开始于一名 UNIX 软件工程师,负责将内核服务和设备驱动程序移植到 x86 体系结构。他喜欢《星球大战》、《星际迷航》和 NBA 勇士队。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110323
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5335

    浏览量

    136240
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一款让工具管理更自由的RFID智能工具包

    CK-B1A是一款采用RFID技术的双肩工具背包,在设计上没有改变传统工具包的使用方式,但在内部增加了识别能力。在人员准备离开现场时,通过一键锁定,工具包会自动完成一次内部工具状态确认
    的头像 发表于 05-21 16:15 600次阅读
    一款让<b class='flag-5'>工具</b>管理更自由的RFID智能<b class='flag-5'>工具包</b>

    普华基础软件开源小满V25.04-patch和V25.10-patch版本发布

    坚实底层基座。新版本现已全面开放,用户可前往社区获取新版本全部源代码、工具安装、示例工程及相关文档,并支持从原有版本平滑升级。
    的头像 发表于 05-11 15:38 208次阅读

    eIQ 工具包在 Ubuntu 22.04 中不起作用怎么解决?

    I\'ve downloaded eIQ 工具包 1.16.0.106 Ubuntu 安装程序 and installed it with: chmod +x
    发表于 04-22 06:54

    芯科科技发布Simplicity Studio 6软件开发套件最新版本SiSDK 2025.12.0

    Silicon Labs(芯科科技)近期发布了Simplicity Studio 6软件开发套件的最新版本-SiSDK 2025.12.0,这代表着嵌入式与无线软件开发的一次重大进步。该版本重点关注
    的头像 发表于 01-29 10:29 1558次阅读

    蔚来世界模型NWM全新版本使用指南

    今天,「蔚来世界模型 NWM」全新版本正式开启推送。首批超过46万辆「Banyan 榕」车型将陆续收到推送。「Cedar 雪松」和「Cedar S 雪松」车型,也将于近期推送。此次,蔚来率先将「世界
    的头像 发表于 01-29 09:13 899次阅读

    蔚来世界模型NWM全新版本正式推送

    2026年1月28日,「蔚来世界模型 NWM」全新版本正式开启推送,首批将为超过46万辆「Banyan 榕」车型推送。「Cedar 雪松」车型及「Cedar S 雪松」车型,也将于近期开启推送。
    的头像 发表于 01-28 15:38 675次阅读

    客户在升级新版本的开发工具后,打开工程,有发现工程中系统字体找不到?

    客户在升级新版本的开发工具后,打开工程,有发现工程中系统字体找不到?
    发表于 01-20 15:16

    嵌入式开发工具版本的选择策略

    ,很多时候,还会亲自下载安装尝鲜。 新版本有时候会引入一些bug,所以用新版本做项目一定要【慎重】,并不一定完全适合你的项目。 软件工具是否需要升级到最新版本?我的观点是:如果你做项
    发表于 11-25 06:11

    如何使用新版本J-Flash编程CW32 MCU

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users<用户名>
    发表于 11-12 07:24

    【直播预告】RT-Trace 全新版本发布|ITM输出 MemoryWatch 功能首发实测! | 问学直播

    RT-Trace迎来又一次重要更新!本次新版本带来了两项备受期待的功能——ITM输出与MemoryWatch内存监控,让调试可视化更高效、问题定位更精准。为帮助开发者快速上手新特性
    的头像 发表于 10-14 11:57 743次阅读
    【直播预告】RT-Trace 全<b class='flag-5'>新版本</b>发布|ITM输出  MemoryWatch <b class='flag-5'>功能</b>首发实测! | 问学直播

    HarmonyOSAI编程DevEco AI辅助编程工具

    DevEco CodeGenie。 若使用非最新版本的DevEco Studio,可通过下载中心获取并使用相关功能。 点击Sign in ,跳转华为账号登录页面。授权登录完成后返回DevEco Studio
    发表于 08-18 14:54

    Silicon Labs最新版本Simplicity Studio开发工具包SiSDK 2025.6.0增添多项无线技术协作

      Silicon Labs(芯科科技)在2025年第二季度发布了Simplicity Studio软件开发工具的最新版本— SiSDK 2025.6.0。此次更新在无线协议栈、通信协议及开发工具
    的头像 发表于 07-02 15:39 2887次阅读

    如何使用新版本J-Flash编程CW32 MCU?

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users AppDataRoamingSEGGER目录
    的头像 发表于 07-01 15:05 1222次阅读
    如何使用<b class='flag-5'>新版本</b>J-Flash编程CW32 MCU?

    戴尔数据保护软件迎来全新版本

    无缝运行的异常检测,一站式监控多达150个系统,额外的MFA多重身份验证Dell PowerProtect Data Manager19.19全新版本现已到来!
    的头像 发表于 06-27 13:55 1131次阅读

    前端开发中依赖有问题怎么办

    的 GitHub issue,可能已经有解决方案或临时解决办法。 2. 更新依赖 : 检查是否有该的更新版本,更新可能已经修复了这个问题。 使用 npm update package-name 或 pnpm
    的头像 发表于 06-10 11:31 654次阅读