0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA CUDA-X库加速科学和工程发展

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-03-25 15:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

超级芯片架构上的库可将计算工程工具的运算速度提升至原来的 11 倍,并可处理计算规模达 5 倍的任务。

借助由 NVIDIA 超级芯片提供支持的NVIDIA CUDA-X库,各类科学家和工程师能够更快地解决棘手问题。

NVIDIA GTC 全球 AI 大会上宣布,开发者现在可以通过 CUDA-X 与新一代超级芯片架构的协同,实现 CPUGPU 资源间深度自动化整合与调度,相较于传统加速计算架构,该技术可使计算工程工具运行速度提升至原来的 11 倍,计算规模增加至 5 倍。

这极大地加速并改进了工程模拟、设计优化等方面的工作流程,帮助科学家和研究人员更快地取得突破性成果。

NVIDIA 于 2006 年推出了 CUDA,开启了加速计算的应用新纪元。历经多年发展,NVIDIA 已经构建了 900 多个专业领域的 NVIDIA CUDA-X 库和 AI 模型,推动加速计算的应用,并催生多项重大的科学突破。如今,CUDA-X 将加速计算拓展至一系列新的工程领域,包括天文学、粒子物理学、量子物理学、汽车、航空航天及半导体设计。

NVIDIA Grace CPU 架构可显著提升显存带宽,同时降低功耗。NVIDIANVLink-C2C互连技术可提供超高带宽,使 GPU 和 CPU 能够共享存储单元,从而让开发者简化专用代码编写、处理更大规模的计算任务,并提高应用性能。

借助 NVIDIA cuDSS 加速工程求解器

NVIDIA 的超级芯片架构使用户能够更高效地利用 CPU 和 GPU 处理能力,从而可以从相同的底层 GPU 中获得更高的性能。

NVIDIA cuDSS库专为解决涉及稀疏矩阵的大型工程模拟问题而设计,可广泛用于设计优化、电磁模拟工作流程等应用。cuDSS 通过 Grace GPU 显存与高带宽 NVLink-C2C 互连技术,实现对超出设备显存容量限制的大型矩阵的分解和求解,从而使用户能够在极短时间内解决极其庞大的问题。

GPU 和 Grace GPU 之间的一致共享存储单元可最大限度地减少数据迁移,从而显著降低大型系统的运行开销。对于各类大规模计算工程问题,通过 Grace CPU 存储单元和超级芯片架构,在相同 GPU 和 cuDSS 混合显存技术下,可将最耗时的求解环节速度提升至原来的 4 倍。

Ansys 已将 cuDSS 集成到其 HFSS 求解器中,显著增强了电磁模拟的性能。借助 cuDSS,HFSS 软件可将矩阵求解器速度提升至原来的 11 倍。

Altair OptiStruct 采用了 cuDSS Direct Sparse Solver 库,极大加速了其有限元分析的工作负载。

这些性能的提升是通过优化 GPU 上的关键操作,同时智能地使用 CPU 进行共享存储单元以及异构 CPU 和 GPU 执行来实现的。cuDSS 可自动检测利用 CPU 能提供额外优势的区域,从而进一步提高效率。

借助超级芯片显存以超快速度进行扩展

NVLink-CNC 互联技术可提供 CPU 和 GPU 之间的显存一致性,从而在单个 GPU 上扩展显存受限的应用程序。

许多工程模拟都受到规模的限制,需要进行大量模拟才能生成设计包含复杂组件(如飞机引擎)的设备所需的分辨率。通过利用在 CPU 和 GPU 显存之间无缝读写的能力,工程师可以轻松实现核外求解器来处理更大的数据。

NVIDIA cuQuantum 助力量子计算研究

量子计算机有望加速解决许多科学和工业学科的核心问题。缩短有用量子计算的时间,很大程度上取决于模拟极其复杂的量子系统的能力。

模拟使研究人员能够在当下开发新算法,以适应未来的量子计算机规模。此外,它们还在优化量子处理器、运行复杂的性能仿真,以及新量子比特设计的噪声特性方面发挥着关键作用。

量子算法的所谓状态向量模拟需要对存储在显存中的指数级大规模向量执行矩阵运算。而张量网络模拟则通过张量收缩来模拟量子算法,对于特定重要类别的应用,能够实现成百上千个量子比特的模拟规模。

NVIDIA cuQuantum库可加速这些工作负载。cuQuantum 与每个领先的量子计算框架集成,因此所有量子研究人员都可以在不更改代码的情况下利用模拟性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110291
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136211
  • AI
    AI
    +关注

    关注

    91

    文章

    41976

    浏览量

    303077
  • 超级芯片
    +关注

    关注

    0

    文章

    39

    浏览量

    9345

原文标题:GTC25 | NVIDIA 借助由超级芯片提供支持的 CUDA-X 库加速科学和工程发展

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推出cuEST量子化学加速

    本周,NVIDIA 发布了 NVIDIA cuEST。这是一款全新的 NVIDIA CUDA-X ,可将电子结构计算迁移到 GPU 上执行
    的头像 发表于 03-23 15:11 626次阅读

    NVIDIA cuDF和cuVS获全球领先数据平台采用

    企业每年产生数百 ZB (Zettabyte) 的数据,并在争相将这些信息转化为洞察。NVIDIA cuDF 和 cuVS 作为基于 NVIDIA CUDA-X 构建的加速数据
    的头像 发表于 03-19 15:46 591次阅读

    NVIDIA携手全球工业软件巨头构建AI智能体加速设计与工程开发流程

    GTC — NVIDIA 今日宣布,正与包括 Cadence、达索系统、PTC、西门子和新思科技等在内的全球领先工业软件厂商合作,将 NVIDIA CUDA-X™、NVIDIA Omn
    的头像 发表于 03-19 15:39 516次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 630次阅读

    如何在NVIDIA CUDA Tile中编写高性能矩阵乘法

    本博文是系列课程的一部分,旨在帮助开发者学习 NVIDIA CUDA Tile 编程,掌握构建高性能 GPU 内核的方法,并以矩阵乘法作为核心示例。
    的头像 发表于 01-22 16:43 5444次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile中编写高性能矩阵乘法

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    新闻摘要: l 礼来与 NVIDIA 宣布成立 AI 联合创新实验室以应对药物研发挑战。 l NVIDIA 携手赛默飞打造自主实验室基础设施,加速可规模化的科学发现。 l Chai
    的头像 发表于 01-14 11:40 742次阅读
    生命<b class='flag-5'>科学</b>领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平台<b class='flag-5'>加速</b> AI 驱动的药物研发

    NVIDIA CUDA Tile的创新之处、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,这是自 2006 年 NVIDIA
    的头像 发表于 12-24 10:17 757次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的创新之处、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的头像 发表于 12-13 10:12 1564次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile简化GPU编程

    NVIDIA CUDA 13.1版本的新增功能与改进

    NVIDIA CUDA 13.1 是自 CUDA 二十年前发明以来,规模最大、内容最全面的一次更新。
    的头像 发表于 12-13 10:08 2565次阅读

    NVIDIA 与新思科技宣布建立战略合作伙伴关系,携手重塑工程与设计未来

    长期战略合作涵盖了 NVIDIA CUDA 加速计算、代理式 AI 和物理 AI 以及 Omniverse 数字孪生,以实现以前通过传统 CPU 计算难以企及的仿真速度和规模,为工程
    的头像 发表于 12-03 10:27 1306次阅读
    <b class='flag-5'>NVIDIA</b> 与新思科技宣布建立战略合作伙伴关系,携手重塑<b class='flag-5'>工程</b>与设计未来

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse
    的头像 发表于 12-01 09:25 1624次阅读

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学NVIDIA CUDA-X ,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是
    的头像 发表于 09-09 09:54 1367次阅读

    NVIDIA助力欧洲金融服务行业智能化发展

    NVIDIA AI 与数据科学帮助欧洲大陆加速金融机构欺诈检测、实时风险建模及客户服务应用。
    的头像 发表于 06-19 14:28 1099次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的
    的头像 发表于 05-27 14:03 1334次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDIA cuDSS 和
    的头像 发表于 05-27 13:59 1355次阅读