0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式实时日志:ELK的部署架构方案

马哥Linux运维 来源:oschina 2023-01-08 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、概述

ELK 已经成为目前最流行的集中式日志解决方案,它主要是由 Beats、Logstash、Elasticsearch、Kibana 等组件组成,来共同完成实时日志的收集,存储,展示等一站式的解决方案。本文将会介绍ELK常见的架构以及相关问题解决。

  • Filebeat:Filebeat是一款轻量级,占用服务资源非常少的数据收集引擎,它是ELK家族的新成员,可以代替 Logstash 作为在应用服务器端的日志收集引擎,支持将收集到的数据输出到Kafka,Redis等队列。

  • Logstash:数据收集引擎,相较于Filebeat比较重量级,但它集成了大量的插件,支持丰富的数据源收集,对收集的数据可以过滤,分析,格式化日志格式。

  • Elasticsearch:分布式数据搜索引擎,基于Apache Lucene实现,可集群,提供数据的集中式存储,分析,以及强大的数据搜索和聚合功能。

  • Kibana:数据的可视化平台,通过该web平台可以实时的查看 Elasticsearch 中的相关数据,并提供了丰富的图表统计功能。

二、ELK常见部署架构

2.1 Logstash作为日志收集器

这种架构是比较原始的部署架构,在各应用服务器端分别部署一个 Logstash 组件,作为日志收集器,然后将 Logstash 收集到的数据过滤、分析、格式化处理后发送至Elasticsearch 存储,最后使用 Kibana 进行可视化展示,这种架构不足的是:

Logstash 比较耗服务器资源,所以会增加应用服务器端的负载压力。

dd3db814-8e8b-11ed-bfe3-dac502259ad0.png

2.2 Filebeat作为日志收集器

该架构与第一种架构唯一不同的是:应用端日志收集器换成了Filebeat,Filebeat轻量,占用服务器资源少,所以使用Filebeat作为应用服务器端的日志收集器,一般Filebeat会配合Logstash一起使用,这种部署方式也是目前最常用的架构。

dd64a172-8e8b-11ed-bfe3-dac502259ad0.png

2.3 引入缓存队列的部署架构

该架构在第二种架构的基础上引入了 Redis 缓存队列(还可以是其他消息队列),将Filebeat收集到的数据发送至Redis,然后在通过 Logstasth 读取 Redis 中的数据,这种架构主要是解决大数据量下的日志收集方案,使用缓存队列主要是解决数据安全与均衡Logstash与Elasticsearch负载压力。

dd8ed262-8e8b-11ed-bfe3-dac502259ad0.png

2.4 以上三种架构的总结

第一种部署架构由于资源占用问题,现已很少使用,目前使用最多的是第二种部署架构,至于第三种部署架构个人觉得没有必要引入消息队列,除非有其他需求,因为在数据量较大的情况下,Filebeat 使用压力敏感协议向 Logstash 或 Elasticsearch 发送数据。如果 Logstash 正在繁忙地处理数据,它会告知 Filebeat 减慢读取速度。拥塞解决后,Filebeat 将恢复初始速度并继续发送数据。

三、问题及解决方案

问题:如何实现日志的多行合并功能?

系统应用中的日志一般都是以特定格式进行打印的,属于同一条日志的数据可能分多行进行打印,那么在使用ELK收集日志的时候就需要将属于同一条日志的多行数据进行合并。

解决方案:使用 Filebeat 或 Logstash 中的 multiline 多行合并插件来实现。

在使用 multiline 多行合并插件的时候需要注意,不同的 ELK 部署架构可能 multiline 的使用方式也不同,如果是本文的第一种部署架构,那么 multiline 需要在 Logstash 中配置使用,如果是第二种部署架构,那么 multiline 需要在 Filebeat 中配置使用,无需再在Logstash 中配置 multiline。

1、multiline 在 Filebeat 中的配置方式:

dda9efe8-8e8b-11ed-bfe3-dac502259ad0.png

  • pattern:正则表达式;
  • negate:默认为false,表示匹配pattern的行合并到上一行;true表示不匹配pattern的行合并到上一行;
  • match:after表示合并到上一行的末尾,before表示合并到上一行的行首。

如:

pattern: ‘[‘
negate: true
match: after

该配置表示将不匹配pattern模式的行合并到上一行的末尾2、multiline在Logstash中的配置方式

ddcb82f2-8e8b-11ed-bfe3-dac502259ad0.png

(1)Logstash 中配置的 what 属性值为 previous,相当于 Filebeat 中的 after,Logstash 中配置的 what 属性值为 next,相当于 Filebeat 中的 before。

(2)pattern => “%{LOGLEVEL}s*]“ 中的LOGLEVEL是Logstash预制的正则匹配模式,预制的还有好多常用的正则匹配模式,详细请看:https://github.com/logstash-plugins/logstash-patterns-core/tree/master/patterns

问题:如何将 Kibana 中显示日志的时间字段替换为日志信息中的时间?

默认情况下,我们在 Kibana 中查看的时间字段与日志信息中的时间不一致,因为默认的时间字段值是日志收集时的当前时间,所以需要将该字段的时间替换为日志信息中的时间。

解决方案:使用 grok 分词插件与 date 时间格式化插件来实现

在 Logstash 的配置文件的过滤器中配置 grok 分词插件与 date 时间格式化插件,如:

ddea7cfc-8e8b-11ed-bfe3-dac502259ad0.png

如要匹配的日志格式为:“[DEBUG][20170811 1031,359][DefaultBeanDefinitionDocumentReader:106] Loading bean definitions”,解析出该日志的时间字段的方式有:① 通过引入写好的表达式文件,如表达式文件为customer_patterns,内容为:
CUSTOMER_TIME %{YEAR}%{MONTHNUM}%{MONTHDAY}s+%{TIME}

注:内容格式为:[自定义表达式名称] [正则表达式]

然后 logstash 中就可以这样引用:

de11cae6-8e8b-11ed-bfe3-dac502259ad0.png

② 以配置项的方式,规则为:(?<自定义表达式名称>正则匹配规则),如:

de2083b0-8e8b-11ed-bfe3-dac502259ad0.png

问题:如何在Kibana中通过选择不同的系统日志模块来查看数据

一般在Kibana中显示的日志数据混合了来自不同系统模块的数据,那么如何来选择或者过滤只查看指定的系统模块的日志数据?

解决方案:新增标识不同系统模块的字段或根据不同系统模块建ES索引

1、新增标识不同系统模块的字段,然后在Kibana中可以根据该字段来过滤查询不同模块的数据

这里以第二种部署架构讲解,在 Filebeat 中的配置内容为:

de444e8a-8e8b-11ed-bfe3-dac502259ad0.png

通过新增:log_from字段来标识不同的系统模块日志

2、根据不同的系统模块配置对应的ES索引,然后在Kibana中创建对应的索引模式匹配,即可在页面通过索引模式下拉框选择不同的系统模块数据。

这里以第二种部署架构讲解,分为两步:

① 在Filebeat中的配置内容为:

de6e244e-8e8b-11ed-bfe3-dac502259ad0.png

通过document_type来标识不同系统模块

② 修改Logstash中output的配置内容为:

在 output 中增加 index 属性,%{type}表示按不同的document_type值建ES索引

四、总结

本文主要介绍了ELK实时日志分析的三种部署架构,以及不同架构所能解决的问题,这三种架构中第二种部署方式是时下最流行也是最常用的部署方式,最后介绍了ELK作在日志分析中的一些问题与解决方案,说在最后,ELK不仅仅可以用来作为分布式日志数据集中式查询和管理,还可以用来作为项目应用以及服务器资源监控等场景,更多内容请看官网。
审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    14

    文章

    10353

    浏览量

    91742
  • 日志
    +关注

    关注

    0

    文章

    149

    浏览量

    11097
  • 收集器
    +关注

    关注

    0

    文章

    30

    浏览量

    3495

原文标题:分布式实时日志:ELK 的部署架构方案

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微电网集中式架构vs分布式架构:设计差异与选型依据

    微电网作为整合“源、储、荷、网”的新型能源系统,其架构设计直接决定系统的运行效率、可靠性、扩展性与经济性,是微电网规划建设的核心环节。在微电网主流架构中,集中式架构分布式
    的头像 发表于 04-02 11:40 420次阅读
    微电网集中式<b class='flag-5'>架构</b>vs<b class='flag-5'>分布式</b><b class='flag-5'>架构</b>:设计差异与选型依据

    西格电力微电网总体架构设计:分层分布式控制体系构建

    随着分布式新能源规模化渗透、负荷需求多元化升级,微电网作为整合“源、储、荷、网”多单元的新型能源系统,其安全稳定、高效经济运行的核心诉求,对总体架构设计与控制体系提出了更高要求。微电网总体架构是系统
    的头像 发表于 03-31 11:44 492次阅读
    西格电力微电网总体<b class='flag-5'>架构</b>设计:分层<b class='flag-5'>分布式</b>控制体系构建

    2022全新版!Java分布式架构设计与开发实战(完结)

    2022全新版!Java分布式架构设计与开发实战(完结) 分库分表实战:Java海量数据存储架构设计 在现代互联网应用中,随着业务规模的指数级增长,数据库性能瓶颈已成为制约系统发展的关键因素。当单
    发表于 03-30 15:20

    分布式能源管理物联网解决方案

    ,构建全链路能源数据采集与管控体系,实现分布式能源的精细化管理与智能化运维。 方案架构 终端设备层:现场设备包括光伏逆变器、智能电表、电池管理系统(BMS)等各类能源设备,支持IEC61850、IEC101/103/104、DL
    的头像 发表于 01-21 11:39 461次阅读
    <b class='flag-5'>分布式</b>能源管理物联网解决<b class='flag-5'>方案</b>

    从0到1搭建实时日志监控系统:基于WebSocket + Elasticsearch的实战方案

    1. 背景与痛点 在开发分布式系统时,日志分散在多个服务节点中,传统轮询查询方式存在延迟高、资源浪费的问题。某次线上故障中,因未能实时发现错误日志,导致问题排查时间延长2小时。因此,决
    发表于 01-09 16:43

    分布式 IO 选型注意事项

    定义​ 分布式IO是一种脱离传统集中式 IO 柜,将输入 / 输出模块分散部署在工业现场设备附近,通过工业总线(如 Profinet、EtherNet/IP、Modbus TCP 等)与 PLC、MES 等控制系统实现数据交互的工业控制设备。其核心
    的头像 发表于 12-30 14:14 510次阅读
    <b class='flag-5'>分布式</b> IO 选型注意事项

    分布式光伏环境监测站的技术架构与应用实践

    分布式光伏环境监测站的技术架构与应用实践 柏峰【BF-GFQX】一、系统技术架构解析 分布式光伏环境监测站采用“感知层-传输层-应用层”三层架构
    的头像 发表于 10-13 10:05 738次阅读
    <b class='flag-5'>分布式</b>光伏环境监测站的技术<b class='flag-5'>架构</b>与应用实践

    Jtti海外VPS微服务架构下的日志采集与分析优化方案

    随着跨境业务和分布式应用的普及,越来越多的企业在海外VPS上构建微服务架构,以提升系统扩展性和灵活性。然而,微服务化带来了一个新的挑战:日志数据分散在多个服务和节点中,若缺乏统一采集与分析机制,将
    的头像 发表于 08-27 17:13 697次阅读

    【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:在“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小容量工商业
    的头像 发表于 08-23 08:04 3654次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统在奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的全方位、高精度、
    的头像 发表于 08-22 10:51 3462次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统技术<b class='flag-5'>方案</b>

    宏集分享 | 集中式架构还是分布式架构?SCADA架构选型的新趋势

    HongraxIIoT在工业数字化不断推进的今天,SCADA系统早已不仅是简单的数据监控工具,它正在成为保障企业运行效率、安全性和业务连续性的战略核心。而“选择集中式、分布式还是混合式架构?”也正
    的头像 发表于 08-08 18:15 851次阅读
    宏集分享 | 集中式<b class='flag-5'>架构</b>还是<b class='flag-5'>分布式</b><b class='flag-5'>架构</b>?SCADA<b class='flag-5'>架构</b>选型的新趋势

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、AI训练、高性能计算)的关键挑战。
    的头像 发表于 08-04 11:34 1815次阅读
    一键<b class='flag-5'>部署</b>无损网络:EasyRoCE助力<b class='flag-5'>分布式</b>存储效能革命

    园区分布式光伏发电监控系统

    简婷 安科瑞电气股份有限公司 上海嘉定  201801 技术支持18701998775 园区部署分布式光伏发电监控系统,是实现光伏项目高效运营、风险可控、收益大的核心保障,其必要性体现在以下多个维度
    的头像 发表于 07-31 15:49 1224次阅读
    园区<b class='flag-5'>分布式</b>光伏发电监控系统

    上海电信携手华为打造分布式云边协同训推方案

    Deepseek加速行业推理应用,面向企业算力租用以及推理数据不出园区的用算需求,上海电信基于“智云上海”新型基础架构部署华为星河路由器打造400GE IP智算城域POD,提供分布式云边协同推理
    的头像 发表于 05-19 11:20 1050次阅读

    如何在CentOS系统中部署ELK日志分析系统

    日志分析已成为企业监控、故障排查和性能优化的重要组成部分。ELK(Elasticsearch、Logstash 和 Kibana)堆栈作为一种强大的开源解决方案,提供了高效的日志收集、
    的头像 发表于 05-08 11:47 1163次阅读
    如何在CentOS系统中<b class='flag-5'>部署</b><b class='flag-5'>ELK</b><b class='flag-5'>日志</b>分析系统