0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是流处理?为何选择流处理?

丽台科技 来源:丽台科技 2023-12-05 09:22 次阅读

1

什么是流处理?

流是从生产者到消费者的一系列无限事件。大量数据生成为金融交易、传感器测量或 Web 服务器日志等事件流。流处理是对接收到的新数据事件的连续处理。

Streamz 等流处理库有助于构建用于管理连续数据流的流程,允许应用程序在事件发生时对其作出响应。

9c4a74f8-9305-11ee-939d-92fbcf53809c.png

流处理流程通常涉及多个操作,例如过滤、聚合、计数、分析、转换、充实、分支、连接、流量控制、早期阶段反馈、回压和存储。

2

为何选择流处理?

数据流的持续处理在许多应用程序中都非常有帮助,例如:

医疗健康:持续监控仪器数据

智慧城市:交通模式和拥塞管理

制造:优化和预测性维护

运输:优化路线和燃料消耗

汽车:智能汽车

网络安全和异常检测:Web 或网络日志处理

金融:股票上市时间序列

机器学习:实时预测

广告:基于位置或动作的广告

由于各企业高度依赖实时分析、推理、监控等功能,因此流处理市场正经历指数级发展。现在,基于流构建的服务是日常业务的核心组成部分,结构化遥测事件和非结构化日志正以每年超过 5 倍的速度增长。在现代商业环境中,这种规模的大数据流愈加复杂并且难以有效地运行,因此,经济高效的可靠流对其至关重要。

3

GPU 加速流处理

NVIDIA RAPIDScuStreamz 是 GPU 加速流数据处理库,旨在加速流处理吞吐量并降低总拥有成本 (TCO)。NVIDIA 的 cuStreamz 制作流程每年可节省数十万美元。cuStreamz 使用 Python 编写,基于 RAPIDS(用于数据科学库的 GPU 加速器)而构建。通过添加 GPU 支持的 Flink 可以看出,端到端 GPU 加速正迅速成为行业标准,NVIDIA 很高兴能成为此趋势的一个组成部分。

cuStreamz 基于以下内容构建:

Streamz,一个能够帮助构建管理连续数据流流程的开源 Python 库;

Dask,一个能够并行处理流工作负载的稳健可靠的调度程序;

RAPIDS,一种用于流计算的 GPU 加速库套件。

cuStreamz 通过在后台利用 RAPIDS cuDF 来加速 Streamz,从而使用 GPU 加速流数据计算。cuStreamz 还受益于 cuDF 的加速 JSON、Parquet 和 CSV 读取器和写入器。cuStreamz 团队构建了一个加速 Kafka 数据源连接器,能够非常快速地将 Kafka 的数据直接读取到 cuDF 数据帧中,从而显著提升端到端性能。然后,可以使用 Dask 在分布式模式下并行运行流流程,从而大规模提高性能。

9c62f5dc-9305-11ee-939d-92fbcf53809c.png

在下图中对 cuStreamz 架构进行了概括总结。cuStreamz 是连接 Python 流与 GPU 的桥梁,应用了检查点和状态管理等复杂可靠的流功能。cuStreamz 还提供了必要的基础模块来编写流作业,这些作业在 GPU 上安全运行,并且性能更好,成本更低。

9c7f509c-9305-11ee-939d-92fbcf53809c.png

4

GPU 加速的端到端数据科学

基于 NVIDIA CUDA-X AI构建的 RAPIDS 开源软件库,使您完全能够在 GPU 上执行端到端数据科学和分析流程。此套件依靠 NVIDIA CUDA基元进行低级别计算优化,但通过用户友好型 Python 接口能够实现 GPU 并行化和高带宽显存速度。

9c8b6440-9305-11ee-939d-92fbcf53809c.png

借助 RAPIDS GPU DataFrame,数据可以通过一个类似 Pandas 的接口加载到 GPU 上,然后用于各种连接的机器学习和图形分析算法,而无需离开 GPU。这种级别的互操作性是通过 Apache Arrow 这样的库实现的。允许加速数据准备、机器学习和深度学习等端到端流程。

RAPIDS cuML 的机器学习算法和数学基元遵循熟悉的类似于 scikit-learn 的 API。单块 GPU 和大型数据中心部署均支持 XGBoost 等主流算法。针对大型数据集,相较于同等功效的 CPU,这些基于 GPU 的实施方案能够以 10 到 50 倍的速度更快地完成任务。

RAPIDS 支持在许多热门数据科学库之间共享设备内存。这样可将数据保留在 GPU 上,并省去了来回复制主机内存的高昂成本。

9c988a44-9305-11ee-939d-92fbcf53809c.png

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2525

    文章

    48129

    浏览量

    740202
  • 加速器
    +关注

    关注

    2

    文章

    746

    浏览量

    36600
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580
  • 智能汽车
    +关注

    关注

    30

    文章

    2626

    浏览量

    106400
  • GPU芯片
    +关注

    关注

    1

    文章

    291

    浏览量

    5692

原文标题:丽台科普丨什么是流处理?

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    变频器的硬件过保护和软件过保护分别是怎么判断的?

    通用变频器分别由硬件过保护和软件过保护,我随便距离一个变频器设计定标方案,举例输出额定电流的两倍峰值为过流点,那么从硬件和软件方面是怎么判断出变频器输出过的?硬件电路大概知道,电流检测电路
    发表于 02-25 20:40

    如何选择pcb表面处理方法

    PCB的表面处理选择是PCB制造过程中最关键的步骤,因为它直接影响到工艺产量、返工数量、现场故障率、测试能力、废品率和成本。那么如何选择pcb表面处理方法呢?
    的头像 发表于 02-16 17:09 1350次阅读
    如何<b class='flag-5'>选择</b>pcb表面<b class='flag-5'>处理</b>方法

    如何选择高品质的LED大屏幕处理器?

    选择高品质的LED大屏幕处理器,需要注意以下几点: 处理器性能:选择具备高性能的处理器,能够保证LED大屏幕的流畅操作和快速响应。 画质表现
    的头像 发表于 01-25 14:49 208次阅读

    变频器的软件过的检测原理是什么?

    针对变频器输出电流的检测分为硬件过检测和软件过检测,硬件过检测是利用电流检测电路实现输出电流的检测,当输出电流超出整定时,电平翻转触发过。软件过
    发表于 01-17 13:49

    基于MT6853 安卓11.0,实现 RTSP视频的演示

    RTSP视频
    jf_87063710
    发布于 :2023年12月22日 10:06:17

    选择处理器的几个关键因素

    选择处理器的几个关键因素  选择处理器时,有几个关键因素需要考虑。这些因素包括处理器的性能、功耗、价格、架构和生产工艺。 首先,性能是
    的头像 发表于 12-15 09:43 390次阅读

    PCB表面处理选择和优化,如何选择最合适的工艺?

    PCB表面处理选择和优化,如何选择最合适的工艺?
    的头像 发表于 11-24 17:16 374次阅读

    大功率恒调光驱动芯片FP7125讲解

    驱动芯片
    jf_77818851
    发布于 :2023年11月06日 09:14:09

    采用TCP传输码的时候如果码服务器停止推,ffmpeg阻塞在av_read_frame如何解决?

    采用TCP传输码的时候如果码服务器停止推,ffmpeg阻塞在av_read_frame
    发表于 09-19 07:22

    人工智能中的处理器如何选择

    为长期运行的计算密集型 AI 训练和大规模 AI 推理选择合适的 CPU 或 GPU,本质上是要为您的应用选择适宜的计算解决方案。相比传统 x86 处理器成本高、能耗大,最新的 Ampere 云原生
    的头像 发表于 09-05 10:58 711次阅读
    人工智能中的<b class='flag-5'>处理</b>器如何<b class='flag-5'>选择</b>

    AMBA AXI协议规范

    本章描述了AXI协议,并给出了一些类型的例子。
    发表于 08-08 07:54

    用LM358D做的恒充电模块,测试恒调节无效怎么解决?

    用LM358D做的恒充电模块,测试恒调节无效,恒流电位器往小调就跳到恒压,电流没什么变化。求大佬教解决办法
    发表于 07-31 15:19

    如何在i.MX8M Plus上为13MP摄像头启用双摄像头

    。 定制:i.MX8M Plus 提供不同的配置,可以定制以满足各种嵌入式视觉应用的特定需求。 使用 i.MX8M Plus 处理器时的双流挑战 虽然 i.MX8M Plus 处理器可以支持多个视频,但
    发表于 05-05 08:34

    使用Arduino和网络摄像头的基本视频

    我知道很多人说 arduino 不是处理视频的最佳方式,但我在使用 OctoPi(基于 arduino 的 3D 打印平台,还具有网络摄像头)方面经验丰富,所以我知道它能够做我想做的事情想。 我
    发表于 05-04 06:51