0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新版本CUDA 11.6工具包的功能

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-02 16:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 发布的 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。 CUDA 继续推动 GPU 加速度的边界,并为 HPC 、可视化、 AI 、 ML 和 DL 和数据科学中的新应用奠定基础。

CUDA 11.6 有几个重要特性。这篇文章概述了关键功能:

GSP 驱动程序架构现在默认为图灵和安培 GPU

新 API 允许禁用实例化图中的节点

完全支持 128 位整数类型

协作组命名空间更新

CUDA 编译器更新

Nsight Compute 2022.1 版本

CUDA 11.6 附带 R510 驱动程序,这是一个更新分支。 CUDA 11.6 工具包可供下载 。

GSP 驱动程序体系结构

GSP 驱动程序体系结构现在是所有列出的图灵和安培 GPU 的默认驱动程序模式。较旧的驱动程序体系结构作为后备支持。有关更多信息,请参阅 R510 驱动程序自述 。

实例化的图形节点 API 添加

我们添加了一个新的 API cudaGraphNodeSetEnabled,以允许禁用实例化图中的节点。在此版本中,支持仅限于内核节点。相应的 API cudaGraphNodeGetEnabled允许查询节点的启用状态。我们还添加了禁用空内核图节点启动的功能。

128 位整数支持

CUDA 11.6 包括 128 位整数(__int128)数据类型的完整版本,包括编译器和开发工具支持。主机端编译器必须支持__int128类型才能使用此功能。

协作组名称空间

协作组名称空间已更新为新函数,以提高命名、函数范围以及单元维度和大小的一致性。

CUDA 编译器

在编译过程中向目标安装的 GPU 添加了-arch=native编译选项。这扩展了现有的-gencode=arch=compute_xx,code=sm_xx体系结构规范

添加从nvlink创建 PTX 文件的功能

不推荐的功能

不推荐使用用于设备上 fork 和 join 并行的cudaDeviceSynchronize(),以便为具有更高性能的替换编程模型做准备。这些函数在本版本中继续工作,但这些工具会发出有关即将发生的更改的警告。

CentOS Linux 8 已经到了生命的尽头 在 2021 年 12 月 31 日,对这个操作系统的支持现在在 CUDA 工具包中被弃用。 CentOS Linux 8 支持将在未来版本中完全取消。

关于作者

Rob Armstrong 是 CUDA 工具包的主要技术产品经理。 20 多年来,他一直专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互特别感兴趣。

Arthy Sundaram 是 CUDA 平台的技术产品经理。她拥有哥伦比亚大学计算机科学硕士学位。她感兴趣的领域是操作系统、编译器和计算机体系结构。

Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高级产品营销经理。弗雷德拥有加州大学戴维斯分校计算机科学和数学学士学位。他的职业生涯开始于一名 UNIX 软件工程师,负责将内核服务和设备驱动程序移植到 x86 体系结构。他喜欢《星球大战》、《星际迷航》和 NBA 勇士队。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5508

    浏览量

    109119
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5105

    浏览量

    134489
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式开发工具版本的选择策略

    ,很多时候,还会亲自下载安装尝鲜。 新版本有时候会引入一些bug,所以用新版本做项目一定要【慎重】,并不一定完全适合你的项目。 软件工具是否需要升级到最新版本?我的观点是:如果你做项
    发表于 11-25 06:11

    如何使用新版本J-Flash编程CW32 MCU

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users<用户名>
    发表于 11-12 07:24

    【直播预告】RT-Trace 全新版本发布|ITM输出 MemoryWatch 功能首发实测! | 问学直播

    RT-Trace迎来又一次重要更新!本次新版本带来了两项备受期待的功能——ITM输出与MemoryWatch内存监控,让调试可视化更高效、问题定位更精准。为帮助开发者快速上手新特性
    的头像 发表于 10-14 11:57 371次阅读
    【直播预告】RT-Trace 全<b class='flag-5'>新版本</b>发布|ITM输出  MemoryWatch <b class='flag-5'>功能</b>首发实测! | 问学直播

    Silicon Labs最新版本Simplicity Studio开发工具包SiSDK 2025.6.0增添多项无线技术协作

      Silicon Labs(芯科科技)在2025年第二季度发布了Simplicity Studio软件开发工具的最新版本— SiSDK 2025.6.0。此次更新在无线协议栈、通信协议及开发工具
    的头像 发表于 07-02 15:39 2030次阅读

    戴尔数据保护软件迎来全新版本

    无缝运行的异常检测,一站式监控多达150个系统,额外的MFA多重身份验证Dell PowerProtect Data Manager19.19全新版本现已到来!
    的头像 发表于 06-27 13:55 717次阅读

    普华基础软件开源汽车操作系统新版本代码上线

    近日,第二十一届上海国际汽车工业展览会现场,开源车用操作系统新版本代码上线仪式在中国电科展台成功召开。全球首个开源智能驾驶操作系统微内核龘EasyAda V2.1和首个规模化、量产级安全车控操作系统
    的头像 发表于 04-30 09:17 810次阅读

    普华基础软件开源车用操作系统迎来全新版本

    近日,普华基础软件开源车用操作系统媒体发布会在上海中国汽车会客厅召开——全球首个开源智能驾驶操作系统微内核龘EasyAda、开源安全车控操作系统小满EasyXMen全新版本正式发布。现场,普华基础软件开源项目技术团队专家就开源项目新版本技术亮点、新增
    的头像 发表于 04-25 16:18 803次阅读

    SOA架构开发小助手PAVELINK.SOA-Converter 2.1.2新版本发布

    为提升汽车SOA架构设计开发效率,优化用户体验,我们对PAVELINK.SOA-Converter进行了全新升级。本次2.1.2新版本升级,聚焦于提升软件性能、扩展功能特性及增强用户交互体验。
    的头像 发表于 04-09 10:37 1269次阅读
    SOA架构开发小助手PAVELINK.SOA-Converter 2.1.2<b class='flag-5'>新版本</b>发布

    win7 64位系统STM32CubeMX安装完成后数据无法升级到最新版本,怎么解决?

    win7 64位系统 STM32CubeMX安装完成后数据无法安装,安装较低版本后又无法升级到最新版本,这个界面出现闪退,无法输入用户名和密码,导致无法升级。也试过下载STM32Cube FW
    发表于 03-10 07:04

    云计算开发工具包功能

    随着云计算技术的不断成熟,越来越多的企业开始将应用和服务迁移到云端,以享受弹性计算资源、高可用性和成本效益等优势。为了加速这一进程,云计算服务提供商推出了各种开发工具包。下面,AI部落小编带您了解云计算开发工具包的主要功能
    的头像 发表于 02-21 11:02 558次阅读

    GUI Guider v1.9.0全新版本上线

    新年伊始,GUI Guider也迎来了全新版本!这一次,我们带来了多项重磅更新,旨在为你提供更强大、更便捷的开发体验。无论你是工业控制、智能家居,还是消费电子领域的开发者,这些更新都将为你的项目注入新的活力!
    的头像 发表于 02-07 10:43 4551次阅读

    新版本 IDE 的启动速度变快了?原来是在背后做了这些!

    新版本 IntelliJ IDEA 中为提高性能而采取的措施,这些措施缩短了代码可交互时间并使 IDE 从启动开始就具有更高的响应速度。
    的头像 发表于 01-24 13:49 767次阅读
    <b class='flag-5'>新版本</b> IDE 的启动速度变快了?原来是在背后做了这些!

    Labview声音和振动工具包示例文件Sound Level

    Labview 声音和振动工具包示例文件,声压测试,有模拟和DAQ两个文件。
    发表于 01-05 09:15 5次下载

    索尼发布空间现实显示播放器新版本

    索尼于2024年12月发布适用于空间现实显示屏ELF-SR1和ELF-SR2的空间现实显示播放器新版本
    的头像 发表于 12-24 15:19 966次阅读

    最新Simplicity SDK软件开发工具包发布

    最新的SimplicitySDK软件开发工具包已经发布!此次更新针对SiliconLabs(芯科科技)第二代无线开发平台带来了包括蓝牙6.0的信道探测(Channel Sounding
    的头像 发表于 12-24 09:47 1510次阅读