0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

华为DevCloud 来源:未知 2023-11-29 17:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习(DL)虽然在日志异常检测中得到了不少应用,但在实际轻量级运维模型选择中,必须仔细考虑异常检测方法与计算成本的关系。具体来说,尽管深度学习方法在日志异常检测方面取得了出色的性能,但它们通常需要更长的时间来进行日志预处理、模型训练和模型推断,从而阻碍了它们在需要快速部署日志异常检测服务的在线分布式云系统中的采用。


本文对现有的基于经典机器学习和深度学习方法的日志异常检测方法进行了实证研究,并提出了一种自动化日志异常检测评估框架LightAD


1. 日志异常检测介绍

日志是AIOps领域需要处理的常见数据,是程序运行过程中由代码打印出的一些非结构化的文本信息,日志通常由时间戳和文本信息组成。日志实时记录了系统的运行状态,包括正常运行状态和故障发生时的状态。因此通过收集和分析日志,可以快速检测和定位出系统中存在的异常。


本文研究了深度学习方法在日志异常检测中与更简单技术相比的优越性,在五个公共的日志异常检测数据集上对轻量级传统机器学习方法(如KNN、SLFN)和深度学习方法(如CNN、NeuralLog)进行了全面的评估。


本文的研究结果表明,通过合适的数据处理方式,轻量级机器学习方法能够在时间效率和准确性方面都优于深度学习方法。为了评估深度学习方法的必要性,本文提出了一种自动化的日志异常检测模型评估框架LightAD。LightAD是一种基于贝叶斯优化器的优化训练时间、推断时间和性能得分的评估框架。通过自动化超参数调优,LightAD可以实现在日志异常检测模型之间进行公正的比较,使运维工程师能够针对不同的在线异常检测目标来选择合适的异常检测模型。


2. 对现有方法的全面评估

深度学习方法除了本身拥有更多的参数量外,其使用的数据处理方式通常也比较耗时。例如,CNN方法需要使用日志解析工具对日志进行解析,NeuralLog需要用深度语言模型BERT来对日志进行处理。本文对轻量级传统机器学习方法采用了更高效的日志处理方式。


具体而言,本文在处理以日志块来聚合的数据集(如HDFS)时,从每个文本日志消息中提取标记,以空格分隔,并删除包含数字的标记。本文使用每个块的ID将日志消息分组成日志序列,并用事件频率对其进行编码。整个预处理工作流程如下图所示。


3. 全新的日志异常检测评估框架:LightAD

为全面综合评估日志异常检测算法,本文提出了基于贝叶斯优化起的自动化算法优化和评估框架LightAD,LightAD结构如下图所示。本文首先准备了一组简单的基准模型及其初始的超参数空间,对于每个模型,本文会自动化的优化模型的超参数。通过综合考虑三个维度的模型收益打分:

(1)准确性

(2)每个日志序列的训练时间

(3)每个日志序列的推断时间

最终抉择出模型收益分数最高的异常检测算法。

模型收益的多目标优化公式如下:

下图是在去除重复数据的HDFS数据集上使用LightAD进行异常检测方法优化和评估的结果,最高模型收益的分数由黑色加粗标识。从图中可以看出,LightAD挑选出的模型都是轻量级的机器学习方法。

4.总结

本文来自华为云PaaS技术创新Lab和香港中文大学(深圳)贺品嘉助理教授团队合作项目成果产出,相关研究成果已被软件工程领域顶会ICSE 2024(CCF A类)正式录用,文章详细内容即将公开,敬请关注。


文章来自 PaaS技术创新Lab,PaaS技术创新Lab隶属于华为云,致力于综合利用软件分析、数据挖掘、机器学习等技术,为软件研发人员提供下一代智能研发工具服务的核心引擎和智慧大脑。我们将聚焦软件工程领域硬核能力,不断构筑研发利器,持续交付高价值商业特性!加入我们,一起开创研发新“境界”!


详情欢迎联系:

mayuchi1@huawei.com;bianpan@huawei.com



 戳“阅读原文”,直达PaaS技术创新Lab!


原文标题:【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

文章出处:【微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36190

    浏览量

    262681

原文标题:【AIOps】一种全新的日志异常检测评估框架:LightAD,相关成果已被软工顶会ICSE 2024录用

文章出处:【微信号:华为DevCloud,微信公众号:华为DevCloud】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为携手南开大学在ICSE 2026上发布R-Log研究成果

    第48届国际软件工程大会(ICSE 2026)于2026年4月12日至18日在里约热内卢召开。作为软件工程领域CCF A类ICSE被誉为“软件领域的奥林匹克”,汇聚全球顶尖学者与
    的头像 发表于 04-23 15:04 226次阅读

    传音相关研究成果入选计算机视觉CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)联合开展的“拍照解题”项目研究取得重要进展,相关成果论文已被计算机视觉领域的国际顶级学术会议CV
    的头像 发表于 04-03 17:45 2924次阅读
    传音<b class='flag-5'>相关</b>研究<b class='flag-5'>成果</b>入选计算机视觉<b class='flag-5'>顶</b><b class='flag-5'>会</b>CVPR 2026

    一种可跨不同领域的异常检测通用模型UniOD介绍

    本研究提出了一种可跨不同领域、适用于特征维度各异且特征空间异构的数据集的异常检测通用模型。
    的头像 发表于 03-18 09:09 537次阅读
    <b class='flag-5'>一种</b>可跨不同领域的<b class='flag-5'>异常</b><b class='flag-5'>检测</b>通用模型UniOD介绍

    模组日志功能技术概览

    模组日志功能技术方案以低侵入、高可用为原则,提供统日志API、多级日志分类与条件输出机制。通过集成该技术,开发者可在不干扰业务逻辑的前提下,全面掌握模组的执行状态与
    的头像 发表于 01-14 15:32 238次阅读
    模组<b class='flag-5'>日志</b>功能技术概览

    飞凌嵌入式ElfBoard-连接(符号链接)与硬连接

    Linux系统中,有连接和硬连接两不同的文件链接方式。硬连接是对文件的另个目录项,所有硬连接都指向相同的inode,就好比块存储数据的内存有着多个名字,每增加
    发表于 12-26 08:52

    信道活跃检测(CAD)是一种无线唤醒技术,这个功能般是定时检测么?还是检测

    信道活跃检测(CAD)是一种无线唤醒技术,这个功能般是定时检测么?还是检测
    发表于 12-10 06:53

    摩尔线程新代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新代大语言模型对齐框架——URPO统奖励与策略优化,相关研究论文已被人工智能领域的
    的头像 发表于 11-17 16:03 602次阅读
    摩尔线程新<b class='flag-5'>一</b>代大语言模型对齐<b class='flag-5'>框架</b>URPO入选AAAI 2026

    Nullmax端到端轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能 AAAI 2026 公布论文录用结果,Nullmax 研发团队的端到端轨迹规划论文成功入选。该论文创新提出一种由粗到精的轨迹预测
    的头像 发表于 11-12 10:53 1078次阅读

    如何利用AI算法进行装置数据的异常检测

    - 异常闭环” 的全流程设计,实现精准、高效的异常识别。以下是具体实施框架与关键步骤: 、第步:明确装置数据
    的头像 发表于 09-05 15:27 2250次阅读
    如何利用AI算法进行装置数据的<b class='flag-5'>异常</b><b class='flag-5'>检测</b>?

    一种适用于动态环境的自适应先验场景-对象SLAM框架

    由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,全面
    的头像 发表于 08-19 14:17 996次阅读
    <b class='flag-5'>一种</b>适用于动态环境的自适应先验场景-对象SLAM<b class='flag-5'>框架</b>

    电商API日志分析的实用工具

    、优化用户体验、检测异常活动,并提升整体业务效率。然而,海量日志数据的管理和分析需要高效的工具支持。本文将介绍几种实用的电商API日志分析工具,并逐步解释其应用方法,帮助您快速上手。
    的头像 发表于 07-23 15:50 778次阅读
    电商API<b class='flag-5'>日志</b>分析的实用工具

    通动力2024年度及2025年第季度业绩说明 季度营收同比增长28.65%

    6月27日,通动力信息技术(集团)股份有限公司(301236.SZ)举行2024年度及2025年第季度业绩说明。公司董事长兼总经理刘天文,董事、副总经理兼财务总监张成,独立董事简
    的头像 发表于 06-30 09:37 1929次阅读

    机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

    本文转自:DeepHubIMBA无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测
    的头像 发表于 06-24 11:40 1603次阅读
    机器学习<b class='flag-5'>异常</b><b class='flag-5'>检测</b>实战:用Isolation Forest快速构建无标签<b class='flag-5'>异常</b><b class='flag-5'>检测</b>系统

    DevEcoStudio 中使用模拟器时如何过滤日志

    的使用统计等。这些信息有助于开发者了解模拟器的整体运行状况,判断是否存在资源瓶颈或系统异常。 应用相关日志:当在模拟器中运行应用程序时,记录应用的启动、暂停、恢复、销毁等生命周期事
    发表于 05-23 10:46

    提高IT运维效率,深度解读京东云AIOps落地实践(异常检测篇)

    一种无阈值方法:基于 LSTM 网络的基线(个 LSTM 框架辅助几个优化步骤)和无监督检测(神经网络和多种机器学习算法的组合)协同综合分析时间序列。当时间序列显示出清晰的周期性形
    的头像 发表于 05-22 16:38 1155次阅读
    提高IT运维效率,深度解读京东云<b class='flag-5'>AIOps</b>落地实践(<b class='flag-5'>异常</b><b class='flag-5'>检测</b>篇)