0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么将AI注入到IT运营中比数据本身更多的是数据

倩倩 来源:新经网 2020-07-14 16:44 次阅读

我与之交谈的几乎每个CIO都大胆地宣称他们的企业是“数据驱动的企业”。但是,毕马威会计师事务所(KPMG)最近进行的 全球CEO前景 调查却截然不同:全球67%的CEO(美国的这一数字跃升至78%)表明,他们忽略了由CIO /他们提供的数据驱动的分析和预测模型IT团队,因为这与他们自己的经验相矛盾;他们根据自己的直觉做出了重大的企业决策。

忽略了数据驱动的见解而遵循直觉的CEO

虽然结果有些令人震惊,但可以很容易地解释它。首先,尽管企业生产的数据量足够多,但是数据仍然在业务单元,域,平台和实现(例如云与私有数据中心)之间非常分散。根据Forrester的说法,多达73%的公司数据未用于分析和见解。难怪首席执行官仅使用总数据的27%生成的模型就获得了可怕的结果!其次,大多数当前的预测模型仅使用历史数据,而不使用流(实时)数据。这两个重要因素导致预测的准确性不高。首席执行官如果不信任模型,就无法做出决策,因为他们业务的成败取决于他们做出的决策。

更多数据可以带来更好的预测

尽管是IT运营使其他企业AI计划保持平稳运行,但实施AI以改善其自身的运营速度却很慢。原因之一是上述数据零散。当向AI / ML模型提供部分数据时,您只会获得企业的部分视图。另一个主要原因是因为当前大多数AI / ML实施都是为了创新,并且通常由BU资助。传统上,企业将IT视为成本中心,因此他们不愿意花钱来使用AI来改善运营。但是,随着大量的数据,以及当前的大流行病产生了更多的未连接的远程数据,这种感觉在开始淹没Ops团队时发生了变化。IT运营团队正在达到一个临界点,要处理的数据过多,这是AI的理想方案。这是AI和ML的最佳选择。人工智能在大量数据上蓬勃发展。实际上,向AI算法馈送的数据越多,模型就越好。

传统上,IT运营团队多年来一直监视IT基础结构监视(ITIM)和网络性能监视与诊断(NPMD)层。在过去的十年中,应用程序性能管理(APM)帮助提高了每个应用程序的可见性。但是,即使所有这些系统都表明它们正常工作,客户仍会根据位置,连接类型(移动/互联网),所使用的缓存/ CDN提供程序的类型等而遇到问题。现代应用程序及其组件的复杂性加载到客户视图中会使其变得非常复杂。数字体验监视(DEM)的概念已获得可见性,可以专门监视,分析和优化客户体验。但是,它们更像是监视工具,而不是诊断工具。

AIOps(IT运营中的人工智能)解决方案可以帮助解决此问题。一个好的AIOps解决方案应该能够从多个来源获取数据,消除噪声,关联事件序列并基于历史数据和实时数据的组合产生可行的见解。

数据采集

可以说,这是最重要的一步。不仅需要将历史数据馈送给AI进行模型创建,而且还需要将实时数据馈给AI进行推理和更新模型。仅像过去那样收集日志或SNMP并不能提供企业的全面情况。收集尽可能多的信息,包括事件,日志,时间序列数据,应用程序数据,性能数据,利用率数据等。新的基于事件的范式转移到发布/订阅或基于事件的消息传递。尽管这些消息非常重要,但它们对于收集实时数据以提供企业的完整视图并做出准确的预测绝对至关重要。大多数基于云的系统,无论是基于容器的还是基于虚拟机的,都通过API提供大量信息。

收集结构化,半结构化和非结构化数据。尽管现有的BI和分析系统在处理非结构化数据时遇到困难,但AI还是喜欢它。它可以解析几乎所有内容,包括音频视频,文本文件,图像,配置文件,文档,PDF文件等。

最后,大多数团队忘记将配置记录,变更管理系统,CMBD等作为等式的一部分。这对于每天有时会推动多个发布周期的敏捷团队尤其重要。除非IT运营团队意识到最近的变化,否则他们将浪费大量时间试图找出问题的根本原因。

数据质量和数据摄取

AI存在数据质量问题。创建AI / ML模型时,“垃圾填埋,垃圾填埋”是非常正确的。您的算法有多好或数据科学家有多好都无关紧要。如果您没有提供足够的质量数据,那么您将一无所获。当企业收集大量数据时,它仍然是不完整,不正确和/或不一致的。您还需要收集相邻和相关的数据。您可能会认为它们无关紧要,但是对于AI使用看似无关的数据所能找到的东西,您会感到惊讶。一个例子是,当NASA卫星破裂时,IBM的AI工程师和NASA科学家找到了一种方法,可以利用太阳光以98%的准确度来计算紫外线强度。我最近写了一篇关于此的文章,可以在这里看到。

如果您与数据科学家交谈,他们会告诉您他们花了多少时间准备数据。他们多达80%的时间用于准备数据,而不是分析数据或创建和微调模型。

数据分类和标签

数据需要正确分类,分类和标记,以便AI / ML从中学习。对于监督学习模型尤其如此。在训练,验证和调整模型之前,这是重要的一步。标签的准确性和质量是最重要的两件事。准确性衡量的是标签与真实情况之间的接近程度,或与您的企业事实和/或实际条件匹配的程度。质量与用于模型的整个数据集的标注准确性有关。当您结合使用自动,外包和内部标签工作时,尤其如此。所有组都会在整个数据集中一致地标记吗?

数据清理

如果使用偏差数据训练AI模型,则无疑会产生偏差模型。我写了一篇有关如何避免这种情况并使您的数据失偏的文章。原始数据可能包含隐性偏见信息,例如种族,性别,出身,政治,社会或其他意识形态偏见。消除它们的唯一方法是分析不平等并在创建模型之前对其进行修复。如果不从数据中消除歧视性做法,该模型将倾向于产生有偏见的结果。

仅当数据来自经验证,权威,经过验证和可靠的来源时,才应包括在内。来自不可靠来源的数据应该完全消除,或者在输入模型时应给予较低的置信度。另外,通过控制分类精度,可以以最小的增量成本来大大减少辨别力。这种数据预处理优化应集中在控制区分,限制数据集中的失真和保留实用程序上。

资料储存库

考虑到数据的数量,速度和种类,用于数据存储和数据管理的传统现场解决方案不适用于数字本机解决方案。许多公司已采用数据湖解决方案来解决此问题。尽管单个集中的数据源可以提供帮助,但需要对其进行适当的安全保护,管理和定期更新。它应该能够无缝处理结构化和非结构化数据。

结论

人工智能需要大量数据。正如我最喜欢的《短路》中的角色Johnny V(基于AI的机器人)说:“我需要更多的输入……”。如果您的高管要基于此做出重大的企业决策,请确保为AI提供正确数量和质量的数据。如果没有,他们将忽略您的模型输出/建议并做出自己的决定,从而最大程度地降低您的价值,并最终使您获得数字化和改善业务所需的资金。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264042
  • 数据驱动
    +关注

    关注

    0

    文章

    118

    浏览量

    12248
收藏 人收藏

    评论

    相关推荐

    如何数据传入单片机的模型中去输出?

    怎么数据传入移植单片机中的模型中去并输出
    发表于 03-25 06:26

    数据赋能:构建数据治理与AI的协同闭环

    在数字化浪潮中,数据已成为企业的新型燃料,而AI则是提炼这种燃料的精炼厂。数据治理与AI的协同作用,正在引领企业迈向更智能、更高效的未来。本文将展示企业如何通过将
    的头像 发表于 03-15 10:47 141次阅读

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是数据处理和分析从云端转移到设备
    发表于 03-12 08:09

    数据处理器:DPU编程入门》读书笔记

    ,实现了由传统基础设施现代基于“零信任”环境的转型,可对数据中心的每个用户进行身份认证,保障了企业从云核心数据中心,再到边缘的安全性,同时在效率和性能上有了更大的提升。 卸载
    发表于 12-21 10:47

    语音数据集:为AI注入听觉的力量

    在人工智能的多元领域中,语音技术占据了举足轻重的地位。而语音数据集则为其提供了成长与进步的养料。本文将深入探讨语音数据集的重要性、种类、挑战以及未来趋势。
    的头像 发表于 12-12 10:49 198次阅读

    大模型数据集:揭秘AI背后的魔法世界

    一、引言 在人工智能的奇幻世界中,大模型数据集如同神秘的魔法书,蕴藏着无尽的智慧与力量。它们为AI注入了生命,使其具备了理解和改变世界的能力。今天,就让我们一起揭开大模型数据集的神秘面
    的头像 发表于 12-07 17:33 289次阅读

    如何采集摄像头数据完全传输到PC?

    如何采集摄像头数据完全传输到PC有什么好的方法?
    发表于 10-18 08:31

    labview数据采集之后如何采集的点带上相应的时间戳写入sqlite数据库?

    labview数据采集之后如何采集的点带上相应的时间戳写入sqlite数据库?
    发表于 10-10 16:33

    AI智能呼叫中心

    随着科技的飞速发展,人工智能(AI)已经成为了各行各业的关键技术,其中,AI智能呼叫中心的出现,给传统的呼叫中心带来了巨大的改变与创新,本文探讨AI智能呼叫中心的优势,包括自动化处理
    发表于 09-20 17:53

    Labview如何采集数据处理后输出?

    我是采用NI9215采集电压,采集的电压进行一定的运算后在通过NI9263输出。其中采集以及运算部分已经完成(见图1),但是输出的程序不是很好(见图2)。输出的信号应为两通道信号,且图2 中的数值2 一直显示为0,就代表没有数据
    发表于 09-13 19:57

    生成式AI正在偷走你的数据

    数据,是AI发展的养料。人们在轻而易举获取数据的同时,对数据安全的讨论也此起彼伏。
    发表于 08-16 15:41 357次阅读
    生成式<b class='flag-5'>AI</b>正在偷走你的<b class='flag-5'>数据</b>?

    工业物联网之“设备数据采集与控制+大数据存储分析+APP无代码应用开发”

    网关采集的设备数据用起来? KMM工业智能网关支持网口、WiFi、4G等上网方式,工业智能网关接入工业现场,通过网口、串口实现设备数据采集,采集
    发表于 08-07 20:53

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计2020年代中期,人工智能行业增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行
    发表于 08-04 07:25

    百大案例 | 逆袭数据中心运营困境,华为 AntiDDos助力荷兰 Serverius 打造安全运营样板点

    点击“阅读原文”,了解更多华为数据通信资讯! 原文标题:百大案例 | 逆袭数据中心运营困境,华为 AntiDDos助力荷兰 Serverius 打造安全
    的头像 发表于 07-14 18:55 344次阅读
    百大案例 | 逆袭<b class='flag-5'>数据</b>中心<b class='flag-5'>运营</b>困境,华为 AntiDDos助力荷兰 Serverius 打造安全<b class='flag-5'>运营</b>样板点

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    过去几个月,AI 几乎已经成为全民热议的话题。各式开源大模型、训练框架层出不穷;AI 技术也加速应用在各个领域和行业,例如服务运营优化、解决供应链问题等等;数据库、云计算、大前端等多类
    发表于 05-09 09:49