0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

将NVIDIA加速计算引入Polars

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-11-20 10:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Polars 近日发布了一款由 RAPIDS cuDF 驱动的全新 GPU 引擎,该引擎可将 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使数据科学家仅在一台机器上就能实现在数秒内处理数亿行数据。

日新月异的数据挑战

Pandas 等传统数据处理库均为单线程,当处理数据超过数百万行时就会显得“力不从心”。分布式数据处理系统虽然可以处理数十亿行数据,但又会增加处理中小型数据集的复杂程度和经费开支。

在高效处理数千万至数亿行数据的工具之间一直存在着差距。这类工作负载常见于金融、零售、制造等行业的模型开发、需求预测和物流中。

在面向数据科学家和工程师Python 库中,Polars 的增长速度位居前列,其设计初衷就是为了应对这些挑战。该程序库使用了先进的查询优化技术,以减少不必要的数据移动和处理,使数据科学家可以仅用一台机器就能流畅地处理数亿行规模的工作负载。Polars 弥补了单线程解决方案速度过慢和分布式系统会增加非必要复杂性的缺陷,提供了一个极具吸引力的“中等规模”数据处理解决方案。

将 NVIDIA 加速计算引入 Polars

与其他仅使用 CPU 的数据处理工具相比,Polars 利用多线程执行、高级内存优化和惰性求值(lazy evaluation)功能,可显著提升开箱即用的加速性能。

但由于各行各业的企业面临日益增长的数据处理需求,例如需要分析数十亿笔金融交易、管理复杂的库存系统等,都需要更加强大的性能。这时就该轮到加速计算发挥作用了:

cuDF 是 NVIDIA CUDA-X 加速库中的 RAPIDS 套件的一部分,它是一个由 GPU 提供加速的 DataFrame 程序库,能够利用 GPU 的大规模并行处理能力显著提高数据处理性能。

Polars 团队与 NVIDIA 一起将 cuDF 的速度与 Polars 的效率相结合,使性能最高提速至在 CPU 上 Polars 的 13 倍。如此,即便用户的数据处理工作量增长到数亿甚至数十亿行数据,依然能够保持交互。

9f9cb96c-a016-11ef-93f3-92fbcf53809c.jpg

图 1.图中所示的是 PDS-H 基准测试 22 个查询中加速幅度最大的 4 个查询。在运行包含众多复杂分组和连接操作的查询时,RAPIDS cuDF 驱动的 Polars GPU 引擎的速度提速至 CPU 上 Polars 的 13 倍。

PDS-H基准测试规模系数 80 | GPU:NVIDIA H100 | CPU:英特尔 Xeon W9-3495X(Sapphire Rapids) | 存储:本地NVMe。备注:PDS-H 源自 TPC-H,但这些结果与 TPC-H 的结果不具有可比性。

由于 Polars GPU 引擎直接内置在 Polars Lazy API 中,用户只需通过 pip 安装 polars[gpu] 并将 [engine=”gpu”] 发送至 collect 操作,即可将 GPU 加速应用于他们的工作流。在后台,Polars 会尝试首先在 GPU 上执行操作,必要时再返回 CPU。这种方法可确保:

通过使用 Polars 的查询优化器,实现高效执行和最低内存使用

用户无须修改现有 Polars 代码,即可访问 GPU 引擎

完全兼容 Polars 不断发展的数据可视化、I/O 和机器学习库生态系统

pip install polars[gpu] --extra-index-url=https://pypi.nvidia.com
 
import polars as pl
 
(transactions
 .group_by("CUST_ID")
 .agg(pl.col("AMOUNT").sum())
 .sort(by="AMOUNT", descending=True)
 .head()
 .collect(engine="gpu"))

结语

RAPIDS cuDF 驱动的 Polars GPU 引擎现已发布公测版,为各行各业的数据科学家和工程师提供了一种适用于中等规模数据处理的强大工具。该引擎最高能够将 NVIDIA GPU 上的 Polars 工作流速度提速 13 倍,可以在不产生分布式系统开销的情况下,高效处理数亿行规模的数据集。Polars GPU 引擎直接内置在 Polars API 中,使所有用户都能轻松访问。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109072
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134443
  • 引擎
    +关注

    关注

    1

    文章

    367

    浏览量

    23366

原文标题:RAPIDS cuDF 驱动的 Polars GPU 引擎发布公测版

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展
    的头像 发表于 11-25 10:59 479次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级<b class='flag-5'>计算</b>进展

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX Spark 平台,为研究人员提供强大的工具和便
    的头像 发表于 11-03 15:14 567次阅读

    NVIDIA IGX Thor 机器人处理器实时物理 AI 引入工业和医疗边缘场景

    年 10 月 28 日——  AI 正由数字世界走向物理世界。在工厂车间和手术室等场景中,机器正逐步进化为能够实时观察、感知并作出决策的协作伙伴。   为加速这一变革,NVIDIA 今日推出
    的头像 发表于 10-29 10:31 907次阅读
    <b class='flag-5'>NVIDIA</b> IGX Thor 机器人处理器<b class='flag-5'>将</b>实时物理 AI <b class='flag-5'>引入</b>工业和医疗边缘场景

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图
    的头像 发表于 09-09 09:54 728次阅读

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion AI 超级计算机的协议落地
    的头像 发表于 06-12 15:49 973次阅读

    高效地扩展Polars GPU Parquet读取器

    在处理大型数据集时,数据处理工具的性能至关重要。Polars 作为一个以速度和效率著称的开源数据处理库,它提供了由 cuDF 驱动的 GPU 加速后端,能够显著提升性能。
    的头像 发表于 04-21 17:12 657次阅读
    高效地扩展<b class='flag-5'>Polars</b> GPU Parquet读取器

    NVIDIA携手谷歌云助力企业引入代理式AI

    谷歌 Gemini 模型即将支持本地部署,可通过搭载 NVIDIA Blackwell 架构的基础设施,在 Google 分布式云上运行 NVIDIA 机密计算
    的头像 发表于 04-11 16:32 903次阅读

    NVIDIA助力解决量子计算领域重大挑战

    NVIDIA 加速量子研究中心提供了强大的工具,助力解决量子计算领域的重大挑战。
    的头像 发表于 03-27 09:17 992次阅读

    NVIDIA加速的Apache Spark助力企业节省大量成本

    随着 NVIDIA 推出 Aether 项目,通过采用 NVIDIA 加速的 Apache Spark 企业得以自动加速其数据中心规模的分析工作负载,从而节省数百万美元。
    的头像 发表于 03-25 15:09 894次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力企业节省大量成本

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technolog
    的头像 发表于 03-20 18:59 1268次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人AI<b class='flag-5'>计算</b>机

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速计算和推理软件与 Oracle 的 AI 基础设施以及生成式 AI 服务首次实现集成,以帮助全球企业组织
    发表于 03-19 15:24 469次阅读
    Oracle 与 <b class='flag-5'>NVIDIA</b> 合作助力企业<b class='flag-5'>加速</b>代理式 AI 推理

    NVIDIA使用加速计算与AI推动精准医学发展

    在加利福尼亚州圣克拉拉举行的精准医学世界大会上,NVIDIA 因推动了医学成像、基因组学、计算化学和 AI 驱动机器人技术的发展而受到表彰。NVIDIA 创始人兼首席执行官黄仁勋荣获“Luminary award”。
    的头像 发表于 02-17 17:14 776次阅读

    利用NVIDIA DPF引领DPU加速计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA Blu
    的头像 发表于 01-24 09:29 1271次阅读
    利用<b class='flag-5'>NVIDIA</b> DPF引领DPU<b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型推动行业创新和效率提升。
    的头像 发表于 12-18 13:49 1702次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA GPU:详细列出了支持
    发表于 12-16 14:25