0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是流处理?为何选择流处理?

丽台科技 来源:丽台科技 2023-12-05 09:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1

什么是流处理?

流是从生产者到消费者的一系列无限事件。大量数据生成为金融交易、传感器测量或 Web 服务器日志等事件流。流处理是对接收到的新数据事件的连续处理。

Streamz 等流处理库有助于构建用于管理连续数据流的流程,允许应用程序在事件发生时对其作出响应。

9c4a74f8-9305-11ee-939d-92fbcf53809c.png

流处理流程通常涉及多个操作,例如过滤、聚合、计数、分析、转换、充实、分支、连接、流量控制、早期阶段反馈、回压和存储。

2

为何选择流处理?

数据流的持续处理在许多应用程序中都非常有帮助,例如:

医疗健康:持续监控仪器数据

智慧城市:交通模式和拥塞管理

制造:优化和预测性维护

运输:优化路线和燃料消耗

汽车:智能汽车

网络安全和异常检测:Web 或网络日志处理

金融:股票上市时间序列

机器学习:实时预测

广告:基于位置或动作的广告

由于各企业高度依赖实时分析、推理、监控等功能,因此流处理市场正经历指数级发展。现在,基于流构建的服务是日常业务的核心组成部分,结构化遥测事件和非结构化日志正以每年超过 5 倍的速度增长。在现代商业环境中,这种规模的大数据流愈加复杂并且难以有效地运行,因此,经济高效的可靠流对其至关重要。

3

GPU 加速流处理

NVIDIA RAPIDScuStreamz 是 GPU 加速流数据处理库,旨在加速流处理吞吐量并降低总拥有成本 (TCO)。NVIDIA 的 cuStreamz 制作流程每年可节省数十万美元。cuStreamz 使用 Python 编写,基于 RAPIDS(用于数据科学库的 GPU 加速器)而构建。通过添加 GPU 支持的 Flink 可以看出,端到端 GPU 加速正迅速成为行业标准,NVIDIA 很高兴能成为此趋势的一个组成部分。

cuStreamz 基于以下内容构建:

Streamz,一个能够帮助构建管理连续数据流流程的开源 Python 库;

Dask,一个能够并行处理流工作负载的稳健可靠的调度程序;

RAPIDS,一种用于流计算的 GPU 加速库套件。

cuStreamz 通过在后台利用 RAPIDS cuDF 来加速 Streamz,从而使用 GPU 加速流数据计算。cuStreamz 还受益于 cuDF 的加速 JSON、Parquet 和 CSV 读取器和写入器。cuStreamz 团队构建了一个加速 Kafka 数据源连接器,能够非常快速地将 Kafka 的数据直接读取到 cuDF 数据帧中,从而显著提升端到端性能。然后,可以使用 Dask 在分布式模式下并行运行流流程,从而大规模提高性能。

9c62f5dc-9305-11ee-939d-92fbcf53809c.png

在下图中对 cuStreamz 架构进行了概括总结。cuStreamz 是连接 Python 流与 GPU 的桥梁,应用了检查点和状态管理等复杂可靠的流功能。cuStreamz 还提供了必要的基础模块来编写流作业,这些作业在 GPU 上安全运行,并且性能更好,成本更低。

9c7f509c-9305-11ee-939d-92fbcf53809c.png

4

GPU 加速的端到端数据科学

基于 NVIDIA CUDA-X AI构建的 RAPIDS 开源软件库,使您完全能够在 GPU 上执行端到端数据科学和分析流程。此套件依靠 NVIDIA CUDA基元进行低级别计算优化,但通过用户友好型 Python 接口能够实现 GPU 并行化和高带宽显存速度。

9c8b6440-9305-11ee-939d-92fbcf53809c.png

借助 RAPIDS GPU DataFrame,数据可以通过一个类似 Pandas 的接口加载到 GPU 上,然后用于各种连接的机器学习和图形分析算法,而无需离开 GPU。这种级别的互操作性是通过 Apache Arrow 这样的库实现的。允许加速数据准备、机器学习和深度学习等端到端流程。

RAPIDS cuML 的机器学习算法和数学基元遵循熟悉的类似于 scikit-learn 的 API。单块 GPU 和大型数据中心部署均支持 XGBoost 等主流算法。针对大型数据集,相较于同等功效的 CPU,这些基于 GPU 的实施方案能够以 10 到 50 倍的速度更快地完成任务。

RAPIDS 支持在许多热门数据科学库之间共享设备内存。这样可将数据保留在 GPU 上,并省去了来回复制主机内存的高昂成本。

9c988a44-9305-11ee-939d-92fbcf53809c.png

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2573

    文章

    54366

    浏览量

    785960
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39711
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136230
  • 智能汽车
    +关注

    关注

    30

    文章

    3230

    浏览量

    109138
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6394

原文标题:丽台科普丨什么是流处理?

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是反时限过保护?深入解析反时限过保护的应用场景与优势

    在电力系统中,过保护是保障设备安全运行和电网稳定性的重要环节。其中,反时限过保护以其独特的动作特性,在特定应用场景下发挥着不可替代的作用。本文将深入探讨反时限过保护的原理、优势,并重点解析在哪
    的头像 发表于 07-17 13:53 2104次阅读
    什么是反时限过<b class='flag-5'>流</b>保护?深入解析反时限过<b class='flag-5'>流</b>保护的应用场景与优势

    基于细胞微控的阻抗测试解决方案

    基于细胞微控的阻抗测试技术,作为一种新兴的技术,结合了微控芯片技术与电阻抗谱(EIS)技术,广泛应用于生物医学、细胞分析以及微控系统的研究与开发。这种技术能够在不依赖光学显微镜的情况下,实现
    的头像 发表于 07-02 11:07 1036次阅读
    基于细胞微<b class='flag-5'>流</b>控的阻抗测试解决方案

    控芯片的封合工艺有哪些

    控芯片封合工艺旨在将芯片的不同部分牢固结合,确保芯片内部流体通道的密封性和稳定性,以实现微控芯片在医学诊断、环境监测等领域的应用。以下为你介绍几种常见的微控芯片封合工艺: 高温封装法
    的头像 发表于 06-13 16:42 584次阅读

    泰克设备在微控技术研究中的应用

    控(Microfluidics)是一种使用微管道(尺寸为数十到数百微米)处理或操控微小流体(体积为纳升到阿升)的系统所涉及的科学和技术。 它是一门涉及化学、流体物理、微电子、新材料、生物学
    的头像 发表于 05-22 16:26 808次阅读
    泰克设备在微<b class='flag-5'>流</b>控技术研究中的应用

    FCX3上的视频乱码怎么解决?

    我们在使用 CX3 和 1.3.5 EzUSB SDK 运行视频传感器时遇到了一些间歇性问题。 打开视频任意时间后,视频似乎已损坏,就像视频缓冲区已被交换一样,如附图中带有条形测试图案所示
    发表于 05-16 07:32

    从报错到修复:Tek AFG31000通道1过问题全流程处理

    近日有客户送修一台泰克信号发生器AFG31000,故障表现为CH1报错过。对仪器进行初步检测,故障与客户描述一致。
    的头像 发表于 05-12 17:41 464次阅读
    从报错到修复:Tek AFG31000通道1过<b class='flag-5'>流</b>问题全流程<b class='flag-5'>处理</b>

    FPGA EDA软件的位验证

    验证,对于芯片研发是一个非常重要的测试手段,对于纯软件开发人员,最难理解的就是位验证。在FPGA芯片研发中,位验证是在做什么,在哪些阶段需要做位验证,如何做?都是问题。
    的头像 发表于 04-25 09:42 2057次阅读
    FPGA EDA软件的位<b class='flag-5'>流</b>验证

    变频器过(oc)类故障原因分析及处理

    变频器过(OC)故障是工业控制中常见且影响严重的故障之一。当变频器检测到输出电流超过设定阈值时,会触发保护机制,导致变频器停机报警。以下是对变频器过(OC)类故障的原因分析及处理方法的详细阐述
    的头像 发表于 03-16 17:15 3003次阅读

    保护的讲解(可下载)

    保护对电源来说是一种标配了,可以说所以的电源都会有过保护功能,过保护可以分为关断保护与限流保护两种。关断保护是,当过载后,电路检测到电源过流了,电源芯片停止 PWM,过故 障
    发表于 03-08 15:02 1次下载

    MOS管的并联使用:如何保证电流均

    。因此,如何保证并联MOS管的电流均,是设计中的一个关键问题。今天我们将从选型、布局和电路设计三个方面,探讨实现电流均的方法: 1. MOS管选型与匹配 1.1 选择参数一致的MOS管 导通电阻(Rds(on)) :MOS管
    的头像 发表于 02-13 14:06 3847次阅读
    MOS管的并联使用:如何保证电流均<b class='flag-5'>流</b>?

    单片机通过TLC5615控制LM2596恒,控制不住怎么处理

    单片机通过TLC5615控制LM2596恒,但是 控制不住,开的时候电流上升太快,关的时候又下降太慢。
    发表于 02-06 07:11

    AI工作自动化是做什么的

    AI工作自动化是指利用人工智能技术,对工作流程中的重复性、规则明确的任务进行自动化处理的过程。那么,AI工作自动化是做什么的呢?接下来,AI部落小编为您分享。
    的头像 发表于 01-06 17:57 1418次阅读

    控芯片键合技术

    控芯片键合技术的重要性 微控芯片的键合技术是实现其功能的关键步骤之一,特别是在密封技术方面。键合技术的选择直接影响到微控芯片的整体性能和可靠性。 不同材料的键合方式 玻璃材料:
    的头像 发表于 12-30 13:56 1125次阅读

    ASCP200 过保护参数设置

    保护
    acrelxqx
    发布于 :2024年12月18日 09:26:52

    玻璃微控芯片的特点

    玻璃微控芯片作为一种重要的微控器件,具有许多独特的特点,使其在各种微控应用中得到广泛应用。以下是玻璃微控芯片的一些主要特点: 1. 优秀的光学透明度 玻璃微
    的头像 发表于 12-13 15:26 855次阅读