0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布cuPyNumeric加速计算库

NVIDIA英伟达 来源:NVIDIA英伟达 2024-11-21 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

加速计算库帮助科研人员无缝地扩展到强大的计算集群,并且无需修改 Python 代码,推进科学发现。

无论研究纳米级电子行为,还是数百万光年之外的星系碰撞,众多科学家都面临着一个共同的挑战,那就是必须梳理数 PB 的数据,才能从中获得能够推动相关领域发展的洞察。

借助 NVIDIA cuPyNumeric 加速计算库,科研人员现在可以将他们的数据处理 Python 代码毫不费力地运行在基于 CPU 的笔记本电脑GPU 加速工作站、云服务器或大型超级计算机上。处理数据的速度越快,科学家们就能越快地针对有前景的数据点、值得研究的趋势以及实验调整做出决策。

想要跃进到加速计算,科研人员并不需要计算机科学方面的专业知识。他们只需使用熟悉的 NumPy 界面编写代码,或将 cuPyNumeric 应用于现有代码,并遵循最佳实践即可享受到卓越的性能和可扩展性。

一旦使用了 cuPyNumeric,他们就可以在一个或数千个 GPU 上运行代码,并且无需修改任何代码。

最新版 cuPyNumeric 现已在 Conda 和 GitHub 上发布,它支持 NVIDIA GH200 Grace Hopper 超级芯片、运行时自动进行资源配置以及改进的内存扩展。它还支持 HDF5,这种在科学界非常流行的文件格式有助于高效地管理大型的复杂数据。

SLAC 国家加速器实验室、洛斯阿拉莫斯国家实验室、澳大利亚国立大学、马萨诸塞大学波士顿分校、斯坦福大学湍流研究中心和印度国家支付公司等机构的科研人员均集成了 cuPyNumeric,这显著地改善了他们的数据分析工作流程。

少即是多:无需修改代码

即可享受到无限的 GPU 可扩展性

Python 是数据科学、机器学习和数值计算领域最常用的编程语言,被天文学、药物发现、材料科学和核物理等科学领域的数百万科研人员所使用。GitHub 上数以万计的软件包都依赖于 NumPy 数学和矩阵库,该库在上个月的下载量超过 3 亿次。所有这些应用都能受益于 cuPyNumeric 加速计算。

许多科学家都在构建使用 NumPy 的程序,并在一个仅采用 CPU 的节点上运行,这限制了其算法的吞吐量,无法处理电子显微镜、粒子对撞机和射电望远镜等仪器收集的日益庞大的数据集。

通过提供一个可扩展到数千个 GPU 的 NumPy 替代品,cuPyNumeric 帮助科研人员跟上数据集日益增长的规模和复杂性。从单个 GPU 扩展到整个超级计算机时,cuPyNumeric 不需要更改代码。这使得科研人员可以轻松地在任何规模的加速计算系统上运行分析。

解决大数据问题,加速科学发现

美国能源部下属的 SLAC 国家加速器实验室(由斯坦福大学运营)的科研人员发现,cuPyNumeric 可帮助他们更快地使用直线加速器相干光源进行 X 射线实验。

一个专注于半导体材料科学发现的 SLAC 团队发现,cuPyNumeric 将数据分析应用程序的速度提高了 6 倍,将运行时间从几分钟缩短到几秒钟。凭借这样的提速,该团队能够在这个高度专业化的设施内同时进行重要的分析和实验。

通过更高效地进行实验,该团队预计将能更快地发现新的材料特性、分享成果并发表论文。

以下机构也正在使用 cuPyNumeric:

澳大利亚国立大学的科研人员利用 cuPyNumeric 来扩展勒文伯格-马夸尔特优化算法,以便在澳大利亚国家计算基础设施中的多 GPU 系统上运行。虽然该算法可用于多种应用,但科研人员的最初目标是构建大规模的气候和天气模型。

洛斯阿拉莫斯国家实验室的科研人员正在运用 cuPyNumeric 来加速数据科学、计算科学和机器学习算法。cuPyNumeri 将为他们提供更多工具,以便有效地利用最近推出的 Venado 超级计算机,该超级计算机配备了 2,500 多颗 NVIDIA GH200 Grace Hopper 超级芯片。

斯坦福大学湍流研究中心的科研人员正在开发基于 Python 的计算流体动力学求解器,该求解器可使用 cuPyNumeric 在大型加速计算集群上大规模地运行。这些求解器可以将大型流体模拟集合与 PyTorch 等流行的机器学习库无缝集成,从而支持包括在线训练和强化学习在内的复杂应用。

马萨诸塞大学波士顿分校的一个研究团队正在加速线性代数计算,以分析显微镜视频并确定活性材料耗散的能量。该团队使用 cuPyNumeric 来分解一个包含 1600 万行和 4000 列的矩阵。

印度国家支付公司提供的实时数字支付系统每天大约被 2.5 亿印度人所用,并在走向全球。印度国家支付公司使用复杂的矩阵计算来跟踪付款人和收款人之间的交易路径。使用当前的方法,在 CPU 系统上处理一周的交易数据大约需要 5 个小时。一项试验表明,通过在多节点 NVIDIA DGX 系统上应用 cuPyNumeric 来加速计算,可以将矩阵乘法的速度提高 50 倍,从而使印度国家支付公司能够在不到一个小时的时间内处理更长时间内的交易,并近乎实时地检测到可疑的洗钱行为。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109095
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134462
  • 超级芯片
    +关注

    关注

    0

    文章

    38

    浏览量

    9280

原文标题:SC24 | NVIDIA 发布 cuPyNumeric,使科学家能够充分利用集群规模的 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 497次阅读

    面向科学仿真的开放模型系列NVIDIA Apollo正式发布

    用于加速工业和计算工程的开放模型系列 NVIDIA Apollo 于近日举行的 SC25 大会上正式发布
    的头像 发表于 11-25 11:15 2.4w次阅读

    Cadence 借助 NVIDIA DGX SuperPOD 模型扩展数字孪生平台加速 AI 数据中心部署与运营

    [1]  利用搭载 DGX GB200 系统的 NVIDIA DGX SuperPOD[2] 数字孪生系统实现了的重大扩展 。借助 NVIDIA 高性能加速
    的头像 发表于 09-15 15:19 1245次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDIA cuDSS 和
    的头像 发表于 05-27 13:59 883次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 997次阅读

    使用NVIDIA CUDA-X加速科学和工程发展

    NVIDIA GTC 全球 AI 大会上宣布,开发者现在可以通过 CUDA-X 与新一代超级芯片架构的协同,实现 CPU 和 GPU 资源间深度自动化整合与调度,相较于传统加速计算架构,该技术可使
    的头像 发表于 03-25 15:11 1205次阅读

    英伟达GTC2025亮点:NVIDIA Blackwell加速计算机辅助工程软件,实现实时数字孪生性能数量级提升

    、Altair、Cadence、Siemens 和 Synopsys 等在内的领先计算机辅助工程(CAE)软件供应商正在使用 NVIDIA Blackwell 平台加速其仿真工具,速度提升高达 50 倍
    的头像 发表于 03-21 15:12 1258次阅读

    英伟达GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Oracle 数据NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的头像 发表于 03-21 12:01 1177次阅读
    英伟达GTC2025亮点:Oracle与<b class='flag-5'>NVIDIA</b>合作助力企业<b class='flag-5'>加速</b>代理式AI推理

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technolog
    的头像 发表于 03-20 18:59 1271次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人AI<b class='flag-5'>计算</b>机

    英伟达GTC25亮点:NVIDIA Dynamo开源加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。 作
    的头像 发表于 03-20 15:03 1077次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速计算和推理软件与 Oracle 的 AI 基础设施以及生成式 AI 服务首次实现集成,以帮助全球企业组织
    发表于 03-19 15:24 470次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 AI 推理

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technolog
    发表于 03-19 09:59 504次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 个人 AI <b class='flag-5'>计算</b>机

    利用NVIDIA DPF引领DPU加速计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA Blu
    的头像 发表于 01-24 09:29 1278次阅读
    利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

    简述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了对NVIDIA Isaac的重要更新。NVIDIA Isaac 是一个由加速、应用框架和 AI
    的头像 发表于 01-17 09:57 1756次阅读
    简述<b class='flag-5'>NVIDIA</b> Isaac的重要更新

    《CST Studio Suite 2024 GPU加速计算指南》

    《GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024的GPU计算指南。涵盖GPU计算
    发表于 12-16 14:25