0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RAPIDS加速器可将工作分配集群中各节点

科技绿洲 来源:NVIDIA 作者:NVIDIA 2022-04-01 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

借助适用于 Apache Spark 的 NVIDIA RAPIDS 加速器,团队能够更快处理数万亿条记录,在降低成本的同时优化网络并提高客户满意度。

AT&T 通过无线网络连接了从阿留申群岛到佛罗里达礁岛群的 1 亿多名用户,催生出一片大数据海洋。

Abhay Dabholkar 管理着一个研究小组,他们如同闪耀的灯塔,在数据海洋中寻找最佳导航工具。

作为在 AT&T 工作十余年的杰出 AI 架构师,Dabholkar 表示:“我们可以使用新工具来改变在 AT&T 的日常工作,这一过程十分有趣,并且当我们为员工提供最新的核心工具时,他们会对自己的工作感到更满意。”

近期,该团队在 GPU 助力的服务器上测试了适用于 Apache Spark 的 NVIDIA RAPIDS 加速器,该软件可将工作分配到集群中的各节点。

在本次测试中,仅 5 小时便处理完一个月的移动数据 - 2.8 万亿行信息。相较于先前的测试,速度提升 3.3 倍,而成本则降低 60%。

惊叹时刻

Dabholkar 表示:“这真是令人惊叹,因为在 CPU 集群上,仅处理 7 天的数据我们就需要耗费超过 48 小时的时间。过去尽管我们拥有数据,但却无法充分利用,因为处理这些数据需要很长时间。”

具体而言,该测试对所谓的 ETL(即提取、转换和加载流程)进行了基准测试,以便筛选出无用数据,然后再用筛选后的数据训练 AI 模型,发现全新见解。

他还表示:“目前我们认为 GPU 可用于 ETL 以及我们在 Spark 中执行的所有批处理工作负载,因此我们正在探索其他 RAPIDS 库,将工作从特征工程扩展到 ETL 和机器学习。”

目前 AT&T 在 CPU 服务器上运行 ETL,然后将数据转移至 GPU 服务器进行训练。他补充道,在单个 GPU 工作流中完成所有工作可以节省时间和成本。

提高客户满意度,加速网络设计

时间和成本的节省在众多用例中都有所体现。

例如,用户可以更快获取最佳连接,从而提高客户满意度并减少客户流失率。Dabholkar 表示:“我们还能更快确定 5G 信号塔和天线的参数。”

负责监督 RAPIDS 测试的团队高级成员 Chris Vo 表示,要确定在哪些 AT&T 光纤覆盖区域推出支持卡车,需要进行耗时的地理空间计算,而 RAPIDS 和 GPU 可以加速这一过程。

Dabholkar 说:“这项技术给我们带来极大影响,我们每天可能会收到 300-400TB 的新数据,先前需要耗费两三周以上的时间制作报告,而现在只需几小时便可完成。”

三个用例和统计结果

研究人员正在与 AT&T 数据平台团队成员分享他们的研究成果。

他说:“如果作业时间过长,且您拥有大量数据,我们建议您开启 GPU ,并借助 Spark,让在 CPU 上运行的代码也可以在 GPU 上运行。”

目前为止,各个团队在三个不同的用例中各有收获;其他团队也计划着测试其工作负载。

Dabholkar 乐观地表示,业务部门会将其测试结果引入生产系统中。

他说:“我们是一家拥有各类数据集的电信公司,每天都需要处理 PB 级数的数据,这种方法可以大大节省我们的时间和成本。”

此外,包括美国国家税务局在内的其他企业用户也纷纷选择使用这项技术。现有超过 13000 家公司(包括 400 家《财富》500 强公司)使用 Apache Spark,这表明大多数公司都愿意选择这种方式。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40235
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • 无线网络
    +关注

    关注

    6

    文章

    1523

    浏览量

    69321
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用 powerquad 加速器的一些功能以及 CMSIS 原始实现的一些功能?

    )。 如何使用 powerquad 加速器的一些功能以及 CMSIS 原始实现的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    发表于 04-03 06:37

    Prometheus千节点集群的横向扩展实践

    在2026年的运维环境,千节点规模的Kubernetes集群已经稀松平常。一个典型的中大型互联网公司,其Kubernetes集群规模通常在3000至5000个
    的头像 发表于 03-31 14:37 219次阅读

    罗氏中国加速器科研坊正式启动

    "罗氏中国加速器科研坊"在上海举办,首批来自三甲医院的二十多位临床科研人员,参加了为期五天的肿瘤临床开发训练营。
    的头像 发表于 03-28 09:55 325次阅读

    工作节点说明---工作节点

    平台提供工作节点,实现工作流嵌套工作流的效果。 节点说明 在一个工作
    发表于 03-24 21:05

    节点分析法的工作原理和基本步骤

    节点分析法(节点电压法、节点电位法)是一种电路分析技术,以电路各节点(连接点)的电位作为未知量,运用基尔霍夫电流定律(KCL)建立联立方程
    的头像 发表于 02-05 14:50 950次阅读
    <b class='flag-5'>节点</b>分析法的<b class='flag-5'>工作</b>原理和基本步骤

    边缘计算的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 982次阅读
    边缘计算<b class='flag-5'>中</b>的AI<b class='flag-5'>加速器</b>类型与应用

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理紧密结合,以构建加速的量子
    的头像 发表于 11-03 14:53 883次阅读

    航裕电源以大电流技术为国内外超导加速器项目提供优质方案

    航裕电源:以大电流技术,护航尖端科技 大科学装置建设热潮,超导加速器作为探索微观世界、推动前沿科研的 “国之重”,对供电系统的稳定性、精度及功率提出极致要求。航裕电源以31.5kA、80kA万安
    的头像 发表于 10-12 15:02 1736次阅读

    “超节点+集群”:华为撞出来的算力之路

    “超节点+集群”,成为彻底解决AI算力困局的契机
    的头像 发表于 09-24 10:55 1335次阅读
    “超<b class='flag-5'>节点</b>+<b class='flag-5'>集群</b>”:华为撞出来的算力之路

    NVIDIA RAPIDS 25.06版本新增多项功能

    RAPIDS 是一套面向 Python 数据科学的 NVIDIA CUDA-X 库,最新发布的 25.06 版本引入了多项亮眼新功能,其中包括 Polars GPU 流执行引擎——这是一种面向图
    的头像 发表于 09-09 09:54 1245次阅读

    创客总部加入MathWorks加速器计划

    全球领先的数学计算软件开发商 MathWorks 日前宣布,创客总部已加入 MathWorks 加速器计划。作为中关村科创孵化,创客总部致力于为人工智能创业企业、高校院所技术精英搭建推动与实体经济
    的头像 发表于 08-22 10:00 1339次阅读

    Microchip推出Adaptec® SmartRAID 4300 系列加速器 提供安全的可扩展 NVMe® RAID 存储解决方案

    ,专为NVMe部署而设计。该系列加速器尤其适用于现代人工智能数据中心环境。在此类环境加速访问NVMe存储对于支持高强度工作负载
    的头像 发表于 08-06 16:31 1.9w次阅读
    Microchip推出Adaptec® SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可扩展 NVMe® RAID 存储解决方案

    高压放大器在粒子加速器研究的应用

    粒子加速器是现代科学研究不可或缺的大型实验装置,广泛应用于物理学、化学、材料科学、生物学等多个领域。其核心原理是利用电场和磁场对带电粒子进行加速和约束,使粒子达到极高的能量,从而为研究微观世界
    的头像 发表于 06-19 17:09 707次阅读
    高压放大器在粒子<b class='flag-5'>加速器</b>研究<b class='flag-5'>中</b>的应用

    粒子加速器 —— 科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器
    的头像 发表于 06-19 12:05 4055次阅读
    粒子<b class='flag-5'>加速器</b> —— 科技前沿的核心装置

    云电竞服务 工作原理

    云电竞服务工作原理详解 一、核心架构原理 虚拟化资源池‌ 通过 ‌KVM/VMware‌ 等虚拟化技术将物理服务(含NVIDIA GPU集群
    的头像 发表于 05-14 07:44 759次阅读
    云电竞服务<b class='flag-5'>器</b> <b class='flag-5'>工作</b>原理