0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA CUDA-X库加速科学和工程发展

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-03-25 15:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

超级芯片架构上的库可将计算工程工具的运算速度提升至原来的 11 倍,并可处理计算规模达 5 倍的任务。

借助由 NVIDIA 超级芯片提供支持的NVIDIA CUDA-X库,各类科学家和工程师能够更快地解决棘手问题。

NVIDIA GTC 全球 AI 大会上宣布,开发者现在可以通过 CUDA-X 与新一代超级芯片架构的协同,实现 CPUGPU 资源间深度自动化整合与调度,相较于传统加速计算架构,该技术可使计算工程工具运行速度提升至原来的 11 倍,计算规模增加至 5 倍。

这极大地加速并改进了工程模拟、设计优化等方面的工作流程,帮助科学家和研究人员更快地取得突破性成果。

NVIDIA 于 2006 年推出了 CUDA,开启了加速计算的应用新纪元。历经多年发展,NVIDIA 已经构建了 900 多个专业领域的 NVIDIA CUDA-X 库和 AI 模型,推动加速计算的应用,并催生多项重大的科学突破。如今,CUDA-X 将加速计算拓展至一系列新的工程领域,包括天文学、粒子物理学、量子物理学、汽车、航空航天及半导体设计。

NVIDIA Grace CPU 架构可显著提升显存带宽,同时降低功耗。NVIDIANVLink-C2C互连技术可提供超高带宽,使 GPU 和 CPU 能够共享存储单元,从而让开发者简化专用代码编写、处理更大规模的计算任务,并提高应用性能。

借助 NVIDIA cuDSS 加速工程求解器

NVIDIA 的超级芯片架构使用户能够更高效地利用 CPU 和 GPU 处理能力,从而可以从相同的底层 GPU 中获得更高的性能。

NVIDIA cuDSS库专为解决涉及稀疏矩阵的大型工程模拟问题而设计,可广泛用于设计优化、电磁模拟工作流程等应用。cuDSS 通过 Grace GPU 显存与高带宽 NVLink-C2C 互连技术,实现对超出设备显存容量限制的大型矩阵的分解和求解,从而使用户能够在极短时间内解决极其庞大的问题。

GPU 和 Grace GPU 之间的一致共享存储单元可最大限度地减少数据迁移,从而显著降低大型系统的运行开销。对于各类大规模计算工程问题,通过 Grace CPU 存储单元和超级芯片架构,在相同 GPU 和 cuDSS 混合显存技术下,可将最耗时的求解环节速度提升至原来的 4 倍。

Ansys 已将 cuDSS 集成到其 HFSS 求解器中,显著增强了电磁模拟的性能。借助 cuDSS,HFSS 软件可将矩阵求解器速度提升至原来的 11 倍。

Altair OptiStruct 采用了 cuDSS Direct Sparse Solver 库,极大加速了其有限元分析的工作负载。

这些性能的提升是通过优化 GPU 上的关键操作,同时智能地使用 CPU 进行共享存储单元以及异构 CPU 和 GPU 执行来实现的。cuDSS 可自动检测利用 CPU 能提供额外优势的区域,从而进一步提高效率。

借助超级芯片显存以超快速度进行扩展

NVLink-CNC 互联技术可提供 CPU 和 GPU 之间的显存一致性,从而在单个 GPU 上扩展显存受限的应用程序。

许多工程模拟都受到规模的限制,需要进行大量模拟才能生成设计包含复杂组件(如飞机引擎)的设备所需的分辨率。通过利用在 CPU 和 GPU 显存之间无缝读写的能力,工程师可以轻松实现核外求解器来处理更大的数据。

NVIDIA cuQuantum 助力量子计算研究

量子计算机有望加速解决许多科学和工业学科的核心问题。缩短有用量子计算的时间,很大程度上取决于模拟极其复杂的量子系统的能力。

模拟使研究人员能够在当下开发新算法,以适应未来的量子计算机规模。此外,它们还在优化量子处理器、运行复杂的性能仿真,以及新量子比特设计的噪声特性方面发挥着关键作用。

量子算法的所谓状态向量模拟需要对存储在显存中的指数级大规模向量执行矩阵运算。而张量网络模拟则通过张量收缩来模拟量子算法,对于特定重要类别的应用,能够实现成百上千个量子比特的模拟规模。

NVIDIA cuQuantum库可加速这些工作负载。cuQuantum 与每个领先的量子计算框架集成,因此所有量子研究人员都可以在不更改代码的情况下利用模拟性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109095
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134464
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296664
  • 超级芯片
    +关注

    关注

    0

    文章

    38

    浏览量

    9280

原文标题:GTC25 | NVIDIA 借助由超级芯片提供支持的 CUDA-X 库加速科学和工程发展

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 与新思科技宣布建立战略合作伙伴关系,携手重塑工程与设计未来

    长期战略合作涵盖了 NVIDIA CUDA 加速计算、代理式 AI 和物理 AI 以及 Omniverse 数字孪生,以实现以前通过传统 CPU 计算难以企及的仿真速度和规模,为工程
    的头像 发表于 12-03 10:27 386次阅读
    <b class='flag-5'>NVIDIA</b> 与新思科技宣布建立战略合作伙伴关系,携手重塑<b class='flag-5'>工程</b>与设计未来

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse
    的头像 发表于 12-01 09:25 497次阅读

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布。
    的头像 发表于 11-25 11:15 2.4w次阅读

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学NVIDIA CUDA-X ,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是
    的头像 发表于 09-09 09:54 734次阅读

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及
    的头像 发表于 08-27 12:52 1627次阅读

    NVIDIA助力欧洲金融服务行业智能化发展

    NVIDIA AI 与数据科学帮助欧洲大陆加速金融机构欺诈检测、实时风险建模及客户服务应用。
    的头像 发表于 06-19 14:28 822次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的
    的头像 发表于 05-27 14:03 760次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDIA cuDSS 和
    的头像 发表于 05-27 13:59 883次阅读

    NVIDIA Cosmos加速机器人和自动驾驶汽车物理AI发展

    NVIDIA Cosmos 通过可预测未来世界状态的世界基础模型加速物理 AI 的发展
    的头像 发表于 04-24 11:01 938次阅读
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>机器人和自动驾驶汽车物理AI<b class='flag-5'>发展</b>

    Cadence 利用 NVIDIA Grace Blackwell 加速AI驱动的工程设计和科学应用

    融合设计专业知识与加速计算,推动科技创新、实现能效和工程生产力方面的突破性进展,引领全球生活新范式 内容提要 ● Cadence 借助 NVIDIA 最新 Blackwell 系统,将求解器的速度
    的头像 发表于 03-24 10:14 1218次阅读

    英伟达GTC2025亮点:NVIDIA Blackwell加速计算机辅助工程软件,实现实时数字孪生性能数量级提升

    。 有了这些加速的软件和用于进一步优化性能的 NVIDIA CUDA-X 和蓝图,汽车、航空航天、能源、制造业和生命科学等行业可在保持能效
    的头像 发表于 03-21 15:12 1258次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    Oracle 数据NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI       美国加利福尼亚州圣何塞 —— GTC  —— 2025 年 3 月 18 日
    发表于 03-19 15:24 470次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 AI 推理

    简述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了对NVIDIA Isaac的重要更新。NVIDIA Isaac 是一个由加速、应用框架和 AI
    的头像 发表于 01-17 09:57 1756次阅读
    简述<b class='flag-5'>NVIDIA</b> Isaac的重要更新

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型将推动行业创新和效率提升。
    的头像 发表于 12-18 13:49 1706次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    监控/利用率、选择可用GPU卡子集等内容。 6. 故障排除:针对NVIDIA驱动安装、多GPU设置、GPU模式、硬件识别、CUDA错误、TCC模式等问题给出了相应的解决方法。
    发表于 12-16 14:25