0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS 25.06版本新增多项功能

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-09-09 09:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图神经网络(GNN)的统一 API,以及无需更改代码即可实现的支持向量机加速功能。在本篇博客中,我们将介绍其中的几项重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 与 Polars 团队合作推出了基于 NVIDIA cuDF 开发的 Polars GPU 引擎。此次发布的 25.06 版对 Polars GPU 引擎的功能进行了重大更新。

流执行器现已进入实验阶段

25.06 版在 Polars GPU 引擎中引入了流执行功能。流执行器利用数据分区和并行处理技术,能够处理超出显存容量的数据集。要使用这个新的流执行器,用户可以将恰当配置的 GPUEngine 对象传递给 Polars 的 collect 调用。

这种新的流模式还能让用户将数据处理工作流扩展到多个 GPU,有助于加速分析数百 GB 到 TB 级的数据集。对于需要在分区之间移动数据的操作(例如连接和分组),新引入的数据混洗(shuffle)机制可在设备之间重新分配数据。多 GPU 执行通过 Dask 分布式调度器进行编排,使用前需要先设置一个 Dask 客户端。

流执行器目前仍在积极开发中,尚未支持的操作将自动回退到内存执行器。

支持滚动聚合及更多列操作

最新版本还包含了对 Polars GPU 引擎中一些关键新 DataFrame 功能的支持。首先,我们在 Polars 中添加了对 .rolling() 操作的支持,允许用户基于一些 DataFrame 中的其他列创建滚动组。这在处理时间序列数据集时尤为实用。

此外 GPU 引擎现在支持更丰富的日期时间列表达式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。随着我们继续扩展整体 API 覆盖范围,未来版本还将支持更多方法。

统一的 GNN API

NVIDIA cuGraph-PyG 进一步集成了 WholeGraph 以加速特征提取,形成了我们所说的统一 API。这个新 API 现在允许用户在单 GPU 工作流中使用 WholeGraph 的加速特征存储,同时无需修改脚本即可用于多 GPU 或多节点工作流。

借助统一 API,在单 GPU 上进行原型开发时使用相同的 GNN 训练脚本就能在具有多个 GPU 的单节点以及多节点上运行。通过 PyTorch 的 torchrun 命令管理进程设置,使得大多数 PyTorch 用户都可以熟练地使用统一 API。

无需更改代码的 cuML 增强功能

今年 3 月,NVIDIA 推出了由 cuML 驱动、用于 scikit-learn 的无需更改代码的加速器,该加速器已进入公测阶段。在 25.06 版本中,cuML 为用户带来了更多无需更改代码的功能。

无需更改代码的支持向量机

NVIDIA cuML 扩展了其无需更改代码的加速功能,新增了对支持向量机的支持。支持向量分类(SVC)和支持向量回归(SVR)这两种强大的算法在 GPU 上执行时,能很好地处理高维数据并显著地提升速度。通过在 cuML 的零代码变更接口中添加这些估计器,利用支持向量机的现有 scikit-learn 工作流无需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的实现上存在一些关键差异,还请用户加以了解。

改进的 scikit-learn 兼容性

25.06 版本对 cuML 加速 scikit-learn 估计器的方式进行了重大重构,增强了 scikit-learn 一致性,还改进了参数验证和异常处理。此外,通过这次重新设计,cuML 也增强了与 scikit-learn API 的兼容性,可以更轻松地加速目前与 scikit-learn 集成的第三方库。

随机森林与更新后的森林推理库(FIL)集成

通过集成更快、更强大的森林推理库(FIL),cuML 的随机森林估计器得到了升级,在保持向后兼容性的同时,提供了更高的性能和更好的内存管理。

需注意,旧版特有的一些 API 调节参数(knobs)现已弃用,并将在即将发布的 25.08 版本中移除。

RAPIDS 内存管理器与NVIDIABlackwell 解压缩引擎的兼容性

RAPIDS 内存管理器(RMM)库增加了全新功能,确保用户能够使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 异步内存资源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解压缩引擎,让 IO 密集型工作流中的性能得到提升。

此外,RMM 现在以一个预编译共享库的形式存在,取代了之前的仅包含头文件的库。我们相信这一变化将为未来解锁新功能奠定基础。

平台更新:Python 和NVIDIA CUDA 支持

25.06 版本为所有 RAPIDS 库添加了对 Python 3.13 的支持,同时也是最后一个支持 CUDA 11 的版本。从 25.08 版开始,RAPIDS 将不再支持 CUDA 11。如需继续使用 CUDA 11,可以固定使用 25.06 版本。

结语

RAPIDS 25.06 版为新的机器学习算法带来了零代码变更功能、新的 Polars GPU 流引擎、异步内存资源的硬件解压缩功能等多项功能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110096
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5259

    浏览量

    136039
  • 引擎
    +关注

    关注

    1

    文章

    368

    浏览量

    23510

原文标题:RAPIDS 新增 GPU Polars 流执行等多项新功能

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    请问如何使用MCUXpresso Secure Provisioning Tool 25.06创建便携式制造包?

    我目前正在使用 MCUX 安全配置工具 v25.06 为 i.MX RT1052 设备生成制造包。 该包已成功创建并在生成包的同一台 PC 上正常工作。但是,当我尝试在另一台计算机上使用相同的制造包
    发表于 04-10 12:29

    ASPICE 3.1 与 4.0 版本的核心差异:从软件专属到全系统覆盖(四)

    软件,4.0 新增硬件全流程管控 ASPICE v3.1版本 ASPICE 3.1 版本的核心聚焦于系统工程(SYS)与软件工程(SWE) 两大模块,仅覆盖车载软件与系统级的研发过程要求, 完全
    发表于 04-08 09:48

    索尼更新相机遥控软件开发包2.01版本

    2026年2月03日,索尼(中国)有限公司正式发布了可通过电脑远程操控索尼相机的相机遥控软件开发包(Camera Remote SDK)2.01版本,本次更新带来了2个新功能新增支持机型ILCE-7M5、PXW-Z380、DS
    的头像 发表于 02-03 16:59 818次阅读

    西门子PCB DFM分析工具Valor NPI 2510版本新增功能

    Valor NPI 2510 版本新增多项检查功能、提升制造风险识别,并推出令人瞩目的 3D 可视化增强特性,这标志着产品的重大升级。Valor NPI 的 3D 视图经过重新设计,让可制造性设计 (DFM) 结果的查看更直观、
    的头像 发表于 01-04 16:10 649次阅读
    西门子PCB DFM分析工具Valor NPI 2510<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b><b class='flag-5'>功能</b>

    睿擎平台v1.7.2版本正式发布|技术集结

    核心亮点:●RC3562新产品系列重磅上线●RC3506平台新增多项核心功能RC3562新产品系列重磅推出RC3562作为睿擎平台全新产品系列,具备以下核心优势:●默认集成AMP混合部署方案,提升
    的头像 发表于 12-17 18:10 716次阅读
    睿擎平台v1.7.2<b class='flag-5'>版本</b>正式发布|技术集结

    NVIDIA CUDA 13.1版本新增功能与改进

    NVIDIA CUDA 13.1 是自 CUDA 二十年前发明以来,规模最大、内容最全面的一次更新。
    的头像 发表于 12-13 10:08 2429次阅读

    AMD Vivado Design Suite 2025.2版本现已发布

    AMD Vivado Design Suite 2025.2 版本现已发布,新增对 AMD Versal 自适应 SoC 的设计支持,包含新器件支持、QoR 功能及易用性增强。
    的头像 发表于 12-09 15:11 1279次阅读

    连接标准联盟正式推出Matter 1.5版本

    、土壤传感器的支持,同时还新增多项能源管理功能。此次更新延续了 Matter 的核心使命,即简化智能家居开发流程、增强设备互操作性,为消费者与开发者打造更丰富、更可持续的互操作体验。
    的头像 发表于 11-30 10:34 1255次阅读

    开鸿Bot系列大版本更新:体验稳定升级,乐享高效协同!

    V5.0.1.22版本开鸿Bot系列今日,开鸿Bot系列迎来第二次大版本更新——V5.0.1.22。此次版本更新致力于进一步提升系统稳定性与用户体验,新增多项实用
    的头像 发表于 09-26 17:06 1488次阅读
    开鸿Bot系列大<b class='flag-5'>版本</b>更新:体验稳定升级,乐享高效协同!

    开鸿Bot系列V5.0.1.10版本升级!

    开鸿Bot系列更新至V5.0.1.10版本,此次升级聚焦功能优化及系统稳定性提升,在分布式能力、文件分享、打印功能及界面显示等方面进行了多项改进,同时修复了多个已知问题,进一步提升了系
    的头像 发表于 08-08 18:58 854次阅读
    开鸿Bot系列V5.0.1.10<b class='flag-5'>版本</b>升级!

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。在V1.3.0版本中,AiUIBuilder新增了多国语言切换功能
    的头像 发表于 08-07 15:36 1506次阅读
    匠芯创发布新版GUI开发工具 <b class='flag-5'>新增多</b>国语言设置等<b class='flag-5'>功能</b>

    匠芯创发布新版GUI开发工具 新增多国语言设置等功能

    。此次版本更新,为用户带来了诸多实用的新功能,进一步提升了设计体验和开发效率。 在V1.3.0版本中,AiUIBuilder新增了 多国语言切换功能
    发表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了
    的头像 发表于 07-04 14:27 1370次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮点解析

    CANoe产品体系19版本新特性及新增Option(上)

    版本持续助力当前车辆E/E架构中ECU开发验证,同时赋能后续智能网联电动车型预研验证。新版本CANoe产品体系新增数据驱动的DDS、车辆互联服务和高效电机模型库,进一步支持CANXL
    的头像 发表于 06-11 10:03 3185次阅读
    CANoe产品体系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多项最新研究成果

    在亚特兰大举行的国际机器人与自动化大会 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果。
    的头像 发表于 06-06 14:56 1567次阅读