0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

华为DevCloud 来源:未知 2023-11-29 17:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。


本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究,并提出了一种自动化日志异常检测评估框架LightAD


1. 日志异常检测介绍

日志是AIOps领域需要处理的常见数据,是程序运行过程中由代码打印出的一些非结构化的文本信息,日志通常由时间戳和文本信息组成。日志实时记录了系统的运行状态,包括正常运行状态和故障发生时的状态。因此通过收集和分析日志,可以快速检测和定位出系统中存在的异常。


本文研究了深度学习方法在日志异常检测中与更简单技术相比的优越性,在五个公共的日志异常检测数据集上对轻量级传统机器学习方法(如KNN、SLFN)和深度学习方法(如CNN、NeuralLog)进行了全面的评估。


本文的研究结果表明,通过合适的数据处理方式,轻量级机器学习方法能够在时间效率和准确性方面都优于深度学习方法。为了评估深度学习方法的必要性,本文提出了一种自动化的日志异常检测模型评估框架LightAD。LightAD是一种基于贝叶斯优化器的优化训练时间、推断时间和性能得分的评估框架。通过自动化超参数调优,LightAD可以实现在日志异常检测模型之间进行公正的比较,使运维工程师能够针对不同的在线异常检测目标来选择合适的异常检测模型。


2. 对现有方法的全面评估

深度学习方法除了本身拥有更多的参数量外,其使用的数据处理方式通常也比较耗时。例如,CNN方法需要使用日志解析工具对日志进行解析,NeuralLog需要用深度语言模型BERT来对日志进行处理。本文对轻量级传统机器学习方法采用了更高效的日志处理方式。


具体而言,本文在处理以日志块来聚合的数据集(如HDFS)时,从每个文本日志消息中提取标记,以空格分隔,并删除包含数字的标记。本文使用每个块的ID将日志消息分组成日志序列,并用事件频率对其进行编码。整个预处理工作流程如下图所示。


3. 全新的日志异常检测评估框架:LightAD

为全面综合评估日志异常检测算法,本文提出了基于贝叶斯优化起的自动化算法优化和评估框架LightAD,LightAD结构如下图所示。本文首先准备了一组简单的基准模型及其初始的超参数空间,对于每个模型,本文会自动化的优化模型的超参数。通过综合考虑三个维度的模型收益打分:

(1)准确性

(2)每个日志序列的训练时间

(3)每个日志序列的推断时间

最终抉择出模型收益分数最高的异常检测算法。

模型收益的多目标优化公式如下:

下图是在去除重复数据的HDFS数据集上使用LightAD进行异常检测方法优化和评估的结果,最高模型收益的分数由黑色加粗标识。从图中可以看出,LightAD挑选出的模型都是轻量级的机器学习方法。

4.总结

本文来自华为云PaaS技术创新Lab和香港中文大学(深圳)贺品嘉助理教授团队合作项目成果产出,相关研究成果已被软件工程领域顶会ICSE 2024(CCF A类)正式录用,文章详细内容即将公开,敬请关注。


文章来自 PaaS技术创新Lab,PaaS技术创新Lab隶属于华为云,致力于综合利用软件分析、数据挖掘、机器学习等技术,为软件研发人员提供下一代智能研发工具服务的核心引擎和智慧大脑。我们将聚焦软件工程领域硬核能力,不断构筑研发利器,持续交付高价值商业特性!加入我们,一起开创研发新“境界”!


详情欢迎联系:

mayuchi1@huawei.com;bianpan@huawei.com



 戳“阅读原文”,直达PaaS技术创新Lab!


原文标题:【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

文章出处:【微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35782

    浏览量

    260661

原文标题:【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

文章出处:【微信号:华为DevCloud,微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程新代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新代大语言模型对齐框架——URPO统奖励与策略优化,相关研究论文已被人工智能领域的
    的头像 发表于 11-17 16:03 223次阅读
    摩尔线程新<b class='flag-5'>一</b>代大语言模型对齐<b class='flag-5'>框架</b>URPO入选AAAI 2026

    Nullmax端到端轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能 AAAI 2026 公布论文录用结果,Nullmax 研发团队的端到端轨迹规划论文成功入选。该论文创新提出一种由粗到精的轨迹预测
    的头像 发表于 11-12 10:53 524次阅读

    如何利用AI算法进行装置数据的异常检测

    - 异常闭环” 的全流程设计,实现精准、高效的异常识别。以下是具体实施框架与关键步骤: 、第步:明确装置数据
    的头像 发表于 09-05 15:27 1104次阅读
    如何利用AI算法进行装置数据的<b class='flag-5'>异常</b><b class='flag-5'>检测</b>?

    一种适用于动态环境的自适应先验场景-对象SLAM框架

    由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,全面
    的头像 发表于 08-19 14:17 636次阅读
    <b class='flag-5'>一种</b>适用于动态环境的自适应先验场景-对象SLAM<b class='flag-5'>框架</b>

    DevEcoStudio 中使用模拟器时如何过滤日志

    的使用统计等。这些信息有助于开发者了解模拟器的整体运行状况,判断是否存在资源瓶颈或系统异常。 应用相关日志:当在模拟器中运行应用程序时,记录应用的启动、暂停、恢复、销毁等生命周期事
    发表于 05-23 10:46

    提高IT运维效率,深度解读京东云AIOps落地实践(异常检测篇)

    一种无阈值方法:基于 LSTM 网络的基线(个 LSTM 框架辅助几个优化步骤)和无监督检测(神经网络和多种机器学习算法的组合)协同综合分析时间序列。当时间序列显示出清晰的周期性形
    的头像 发表于 05-22 16:38 796次阅读
    提高IT运维效率,深度解读京东云<b class='flag-5'>AIOps</b>落地实践(<b class='flag-5'>异常</b><b class='flag-5'>检测</b>篇)

    一种实时多线程VSLAM框架vS-Graphs介绍

    针对现有VSLAM系统语义表达不足、地图可解释性差的问题,本文提出vS-Graphs,一种实时多线程VSLAM框架。该方案显著提升了重建地图的语义丰富度、可解释性及定位精度。实验表明
    的头像 发表于 04-19 14:07 715次阅读
    <b class='flag-5'>一种</b>实时多线程VSLAM<b class='flag-5'>框架</b>vS-Graphs介绍

    DLPCRC900EVM评估板USB接口J7工作异常的原因?

    ,但是评估板本身应该是可以正常工作的(电源灯常亮、状态灯直闪烁)。分析USB部分电路图后,结论如下: 0、评估板之前是可以正常工作的,不清楚是否是反复插拔USB线缆的原因,造成了该部分电路
    发表于 02-17 06:35

    科技2024年业绩大幅增长

    近日,汇科技发布了2024年年度业绩预告,数据表明,公司归属于母公司所有者的净利润预计将达到55000万元至64000万元区间,与上年度相比,实现了233.22%到287.75%的惊人增长幅度
    的头像 发表于 02-08 15:29 1073次阅读

    OpenHarmony程序分析框架论文入选ICSE 2025

      近日,ICSE 2025软件工程实践Track放榜,面向OpenAtom OpenHarmony(以下简称“OpenHarmony”)的ArkTS程序分析基础框架--方舟程序分析器(论文题目为
    的头像 发表于 01-02 13:41 1828次阅读
    OpenHarmony程序分析<b class='flag-5'>框架</b>论文入选<b class='flag-5'>ICSE</b> 2025

    通动力受邀出席信息科技审计分会2024暨ITGRA论坛

    近日,由中国计算机用户信息科技审计分会举办的“信息科技审计分会2024暨信息科技风险管理与审计(ITGRA)论坛”在北京顺利召开。会议主题围绕“建标准、学标准、用标准”,总结2024年分
    的头像 发表于 12-23 10:53 988次阅读

    睿驰生态伙伴出席2024睿驰新品发布,共同探讨AIDV时代下的融合创新与生态共赢

    2024年12月8日,以“AI驱动智领未来”为主题的2024睿驰新品发布会在上海成功举办,汇聚了众多来自全球车企以及生态合作伙伴的相关负责人,共同探讨AI定义汽车时代下的技术创新与
    的头像 发表于 12-16 14:29 791次阅读
    东<b class='flag-5'>软</b>睿驰生态伙伴出席<b class='flag-5'>2024</b>东<b class='flag-5'>软</b>睿驰新品发布<b class='flag-5'>会</b>,共同探讨AIDV时代下的融合创新与生态共赢

    通动力入选新华社年度智能零碳成果

    近日,通动力信息技术(集团)股份有限公司(简称:通动力,301236.SZ)凭借领先的ESG和双碳科技创新实践成果硬核实力,成功登榜新华社“2023-2024智能·零碳
    的头像 发表于 12-11 14:08 740次阅读

    BlackBerry QNX亮相东睿驰2024新品发布

    作为基础软件操作系统合作伙伴,黑莓QNX受邀参加Neusoft Reach(东睿驰)在上海举办的“AI驱动 智领未来”2024新品发布。黑莓QNX助力东睿驰发布面向AIDV时代的
    的头像 发表于 12-11 14:04 1120次阅读

    2024睿驰新品发布圆满结束

    近日,以“AI驱动 智领未来”为主题的2024睿驰新品发布会在上海成功举办,本次大会聚集了政府相关部门、行业组织的领导和专家、头部车企领袖及产业链重要合作伙伴相关负责人共200余人
    的头像 发表于 12-10 11:01 1028次阅读