0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析时序数据库的流计算支持

OSC开源社区 来源:KaiwuDB 2023-03-23 09:24 次阅读

01

时序数据及其特点

时序数据(Time Series Data)是基于相对稳定频率持续产生的一系列指标监测数据,比如一年内的道琼斯指数、一天内不同时间点的测量气温等。时序数据有以下几个特点:

●历史数据的不变性

● 数据的有效性

● 数据的时效性

● 结构化的数据

● 数据的大量性

02

时序数据库基本架构

b7896dea-c8e0-11ed-bfe3-dac502259ad0.png

针对时序数据的特点,时序数据库一般具有以下特性:

● 高速的数据入库

● 数据的生命周期管理

● 数据的流处理

● 高效的数据查询

● 定制的数据压缩

03

流计算介绍

流计算主要是指针对实时获取来自不同数据源的海量数据,经过实时分析处理,从而获得有价值的信息。常见的业务场景包括实时事件的快速反应,市场变化的实时告警,实时数据的交互分析等。流计算一般包括如下几方面的功能:

1)过滤和转换 (filter & map)

2)聚合以及窗口函数 (reduce,aggregation/window)

3)多数据流合并以及模式匹配 (joining & pattern detection)

4)从流到块处理

04

时序数据库对流计算的支持

案例一:使用定制化的流计算 API,如下面例子所示:

from(bucket: "mydb")  
|> range(start: -1h)  
|> filter(fn: (r) => r["_measurement"] == "mymeasurement")  
|> map(fn: (r) => ({ r with value: r.value * 2 }))  
|> filter(fn: (r) => r.value > 100)  
|> aggregateWindow(every: 1m, fn: sum, createEmpty: false)  
|> group(columns: ["location"])  
|>join(tables:{stream1:{bucket:"mydb",measurement:"stream1",start:-1h},stream2:{bucket:"mydb",measurement:"stream2",start:-1h}},on:["location"])
|>alert(name:"value_above_threshold",message:"Valueisabovethreshold",crit:(r)=>r.value>100)
|>to(bucket:"mydb",measurement:"output",tagColumns:["location"])

案例二:使用类 SQL 指令,创建流计算以及定义流计算规则,如下:

CREATE STREAM current_stream        
TRIGGER AT_ONCE        
INTO current_stream_output_stb AS        
SELECT
_wstartasstart,
_wendasend,
max(current)asmax_current
FROMmeters        
WHERE voltage <= 220        
 INTEVAL (5S) SLIDING (1s);





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SQL
    SQL
    +关注

    关注

    1

    文章

    738

    浏览量

    43461
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63369
  • API接口
    +关注

    关注

    1

    文章

    79

    浏览量

    10314

原文标题:时序数据库的流计算支持

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    时间序列数据的存储和计算 - 开源时序数据库解析

    摘要: Prometheus 开源时序数据库解析的系列文章在之前已经完成了几篇,对比分析了Hbase系的OpenTSDB、Cassandra系的KairosDB、BlueFlood及Heroic
    发表于 01-25 14:53

    时间序列数据的处理

    的异构计算,自动填充热数据·数据分片,支持高QPS读取3.索引·全局的索引 vs 文件局部索引4.大数据·可以直接在大量的文件上跑MR,也可
    发表于 05-30 16:08

    时序数据库HiTSDB的深度解析!

    深度解读!时序数据库HiTSDB:分布式流式聚合引擎
    发表于 07-22 13:22

    云栖深度干货 | 打造“云边一体化”,时序时空数据库TSDB技术原理深度解密

    。时空数据另外一个特点是数据量级呈指数型增长,也是时序数据的在高维空间的展开。传统数据库可伸缩性差,难以管理海量时空数据。高并发情况下,由于
    发表于 10-21 18:04

    嵌入式系统到底该选哪款数据库,SQLite真的是最优解吗?

    数据库选型的最优解吗?在边缘计算、物联网网关、嵌入式系统中,数据往往是各种传感器或设备采集的时序数据,这些数据具有如下鲜明的特点,1:
    发表于 02-11 11:02

    关于时序数据库的内容

    简介: 这是一篇无法一口气读完的、文字过万[正文字数14390]的长文,这是一个无法中途不上厕所就看完的、关于时序数据库的视频[时长111分钟]分享的文字整理..大家好,很开心能够和大家一起交流时序数据库
    发表于 07-12 08:00

    什么是时序数据库

    本文根据演讲视频以及PPT整理而成。本文将主要围绕以下四个方面进行分享:时序数据时序数据库时序数据库的演变时序数据库对比总结一、时序数据
    发表于 07-12 08:35

    TableStore时序数据存储 - 架构篇

    时序数据场景的需求。但我们作为一个通用模型数据库时序数据存储要完全发挥底层数据库的能力,在表Schema设计以及计算对接上,都要有比较特殊
    发表于 08-08 16:17 435次阅读
    TableStore<b class='flag-5'>时序数据</b>存储 - 架构篇

    时序数据库的前世今生

      时序数据库忽然火了起来。Facebook开源了beringei时序数据库,基于PostgreSQL打造的时序数据库TimeScaleDB也开源了。时序数据库作为物联网方向一个非常重
    的头像 发表于 12-17 17:51 3326次阅读

    工业互联网时代:我们为什么需要时序数据库之二

    作为资深“杠精”,当然需要先知道要“杠”的到底是什么?就时序数据库而言,就是要“杠”两个东西:1、“杠”数据;2、“杠”数据库
    的头像 发表于 12-25 18:04 652次阅读

    华为时序数据库为智慧健康养老行业贡献应用之道

    随着 IoT 技术的快速发展,物联网设备产生的数据呈爆炸式增长。这些数据通常随时间产生,称之为时序数据。这样的一种专门用于管理时序数据数据库
    的头像 发表于 11-07 15:10 5577次阅读

    华为PB级时序数据库Gauss DB,助力海量数据处理

    下,时序数据作为大数据、机器学习、实时预测的基础数据,作用更加显著。因此,对时序数据的研究与应用应当更为深入。   近 5 年来,时序数据库
    的头像 发表于 10-15 19:15 832次阅读
    华为PB级<b class='flag-5'>时序数据库</b>Gauss DB,助力海量<b class='flag-5'>数据</b>处理

    华为自研分布式时序数据库集群:初始GaussDB(for Influx)

    随着云计算规模越来越大,以及物联网应用逐渐普及,在物联网(AIoT)以及运维监控(AIOps)领域,存在海量的时序数据需要存储管理。以华为云监控服务(Cloud Eye Service,CES
    的头像 发表于 12-02 09:08 638次阅读
    华为自研分布式<b class='flag-5'>时序数据库</b>集群:初始GaussDB(for Influx)

    涂鸦推出NekoDB时序数据库,助力全球客户实现低成本部署

    随着IoT技术逐渐成熟,众多设备产出的数据呈现指数级增长。企业亟需用行之有效的方式管理海量时序数据。由此,各类时序数据库开始成为市场宠儿。与市场需求相悖的是,时序数据库水平参差不齐。纵
    的头像 发表于 07-24 10:08 1443次阅读
    涂鸦推出NekoDB<b class='flag-5'>时序数据库</b>,助力全球客户实现低成本部署

    时序数据库是什么?时序数据库的特点

    时序数据库是一种在处理时间序列数据方面具有高效和专门化能力的数据库。它主要用于存储和处理时间序列数据,比如传感器数据、监控
    的头像 发表于 04-26 16:02 48次阅读