0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯与清华提出针对UPS电池基于数据驱动的预测性维护方法

牵手一起梦 来源:腾讯科技 作者:佚名 2020-03-27 13:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,腾讯数据中心与清华大学自动化系智网中心团队的贾庆山老师合作论文被第21届IFAC国际自动控制世界大会录取。该大会为自动控制领域三大顶会之一,将于今年7月在德国柏林举办。本届大会将关注可持续资源、绿色能源、数字化和工业4.0等主题,人工智能、控制和计算机科学日益重要的融合也将成为大会关注的焦点。

此次腾讯联合团队投中的论文全称为Predictive Maintenance of VRLA Batteries in UPS towards Reliable Data Centers (中文名称:对可靠数据中心UPS使用的VRLA电池的预测性维护)。

据介绍,论文提出的电池故障检测方法,填补了此前行业针对UPS(Uninterruptible Power System,不间断电源)电池基于数据驱动的预测性维护的研究空白,相比当前基于专家经验和阈值规则等进行判断的检测方式有更高的准确率,同时可以提前预警电池健康状态,有效提升数据中心的智能管理水平,是人工智能技术在数据中心落地应用的生动实例。

据了解,该研究成果也已经整合形成电池AI诊断服务,搭载在腾讯自研的数据中心智能运维平台——腾讯智维上,成功支撑了腾讯深汕数据中心的电池健康管理服务交付工作,目前已覆盖了腾讯自建数据中心的数万只蓄电池。未来,将全面覆盖腾讯数据中心的几十万节电池,并面向广大行业伙伴开放。

通过人工智能对数据中心蓄电池进行预测性维护

UPS供电系统是满足数据中心供电质量的核心部分,而蓄电池又是UPS系统中最重要的组成之一,是整个供电系统的“最后一道屏障”,在UPS系统的故障中,与蓄电池有关的原因占30%以上。如果电池故障引起UPS系统宕机,关键业务中断,将产生很大的经济损失。行业调查机构显示:金融行业的数据中心每宕机一小时的损失为1495134美元,通讯行业的数据中心每宕机一小时的损失为2066245美元。因此通过对蓄电池系统科学的运维管理、监测维护,及时发现故障隐患并及时维护更换,将极大提升数据中心持续运转的可靠性。

不间断电源系统使用的蓄电池

面对数据中心成千上万的蓄电池,通过人工智能自动化的方式进行检测和维护能极大提升效率。但现实中,AI在蓄电池故障预测的落地并不容易。首先,由于日常状态UPS中使用的蓄电池通常在浮充状态下运行,因此监控数据的信息量远不及进行放电测试所收集的数据。第二,没有统一的电池更换标准,现有的维护策略依赖于专家知识。第三,电池故障相关的数据量不足,使寻找高质量模型的任务具有挑战性。

此前行业关于用数据驱动电池寿命预测的研究,也多关注于电动汽车电池这类可循环使用的电池,针对UPS类等常态处于浮充状态电池的健康管理,此前未见已有研究。

针对这些问题,腾讯清华联合团队依托于腾讯智维平台提供的海量数据中心运营数据,研究了一种用于UPS中VRLA电池的预测维护的新型数据驱动技术。据介绍,为了提高数据采集和标注的效率,团队首先对电池自然老化和内部急剧衰退两种情况,提出了一种可以自动标注电池退化时间点的算法,分别以电池内阻和电压离群程度进行自动标注,避免了数据标注过程中的重复和繁重的体力劳动。然后,针对蓄电池监控数据数据量大、数据维度低的问题,应用特征工程技术对数据维度进行扩展。在完成特征工程后,研究人员分别训练了逻辑回归、随机森林、梯度提升决策树和人工神经网络模型,对蓄电池是否发生故障进行预测。实验结果表明,AI模型对故障电池的预测准确率为98%,和现有的基于阈值的判断规则相比,AI模型平均能够提前15天预测电池的故障。

目前上述研究成果已经被研究团队整合形成电池AI诊断服务,并在腾讯自研的数据中心基础设施管理软件平台——腾讯智维平台上发布落地,覆盖了腾讯自建数据中心的数万只蓄电池。该服务能够方便地集成进现有的电池管理服务中,并能够自动对采集到的蓄电池电压、内阻和温度数据进行分析预测。

腾讯与清华提出针对UPS电池基于数据驱动的预测性维护方法

应用数据驱动进行UPS蓄电池健康管理流程图

现场专家工程师对AI故障诊断的效果进行了持续的跟进验证,验证结果表明,相比于原有的电池维护策略,AI诊断服务能够更加准确地对电池的故障状态进行提前预测,同时还可以检测出超出专家知识范围的潜在电池故障,这使得数据中心的运维工程师能够对蓄电池的维护更换进行更加有针对性地规划,有效提高了蓄电池的运维效率,进一步保障数据中心的可靠性。在对腾讯天津数据中心3号楼的6880节电池进行现场实际落地验证发现,电池健康管理服务可以实现96.2%的告警准确率,且告警时间比实际故障提前5——30天,大大优于传统的基于经验规则的分析方案。

目前,腾讯团队正在逐步扩大落地范围,未来将通过智维平台,实现对腾讯几十万节电池的业务覆盖。

据了解,腾讯智维平台由服务腾讯内部的星云平台升级而来,是腾讯将近20年数据中心运营经验与智能化、云化技术相结合,自研的一款数据中心基础设施管理软件平台。通过腾讯智维平台,可以实现数据中心的智能告警、智能巡检、智能容量分析和透明化的客户体验,为全局把控、精细化管理、优化运营成本提供基础,同时也为技术专家实时、异地处理告警和数据中心的无人值守创造可能。它可以帮助客户360°掌握数据中心的运行情况,持续提升运营的质量与效率,降低成本投入,将数据中心的价值极大化。腾讯智维平台就像是数据中心的“大脑”,为腾讯数据中心赋予了精密的感知能力和快速迭代进化的能力。

腾讯智维平台功能简介

目前,腾讯智维平台已在腾讯超过80个大规模数据中心进行部署,覆盖了全球12个国家和地区,运营管理了超过100万台服务器,测点数量超过600万个。同时,腾讯智维也和重庆电信、广东电信等运营商和银行、证券等各行业的客户达成了合作关系。据了解,腾讯智维平台接入部署后,为重庆电信在能耗优化方面提升30%左右,每年节省电费达百万元以上。

腾讯联合高校携手推进技术创新及应用落地

早在2006年,腾讯就围绕人才培养、联合研究和学术交流三条主线启动了腾讯高校合作项 ,并先后与清华大学、哈尔滨工业大学、中科院计算所、北京大学、华中科技大学、中国人民大学、南京大学、西安交通大学等多所知名高校成立联合实验室,且与众多领域专家开展产学研合作。

腾讯数据中心实地勘察研讨交流

2016年,腾讯IDC平台部与清华大学自动化系智网中心团队的赵千川、贾庆山和夏俐老师建立了数据中心自动化运维领域的产学研合作。研究工作以提升数据中心运营质量、降低运营成本和提升运营效率三个目标为出发点,经过双方多年持续耕耘,已累积发表6篇高质量学术论文,输出7项发明专利。

腾讯数据中心和高校专业研究团队的合作研究,不仅集中在电池健康管理的研究上。在数据中心智能告警方面,研究团队提出了告警预警多维分析方案,综合设备状态、设备工艺,采用多传感器融合以及专家知识等方法,通过对数据中心的告警数据的根因分析和关联性分析,对数据中心告警风暴进行收敛,有效减少冗余告警信息,实现了对数据中心设备的准确告警和提前预警,并在海量告警场景中进行告警溯源、定位根因,帮助现场工程师快速定位故障,有效提升现场告警的准确性和响应效率。该方案已应用于腾讯智维平台,在近百个腾讯的数据中心中提供实际支持。

在数据中心节能方面,研究团队采用AI技术,构建了数据中心能效预测模型,实现对数据中心能效的精准预测,并提供数据中心能效影响因子的解释性服务,同时基于能效预测模型进行自动寻优的智能分析,输出节能优化建议。该方案已在腾讯天津数据中心4号楼完成第一阶段的落地验证,实现良好的节能效果,证明AI技术在数据中心节能方面的应用价值和巨大潜力。

随着相关研究的不断深入,腾讯与清华将有更多研究成果在腾讯智维平台上落地发布,推动平台由自动化向智能化发展。

如今,数据中心智能化已成为其主要的发展方向,作为所有互联网业务的基石,数据中心正在人工智能技术的推动下发生着运维管理的大变革。作为世界领先的互联网公司,也是全球IaaS市场增长最快的云计算厂商之一,腾讯全网服务器总量已经超过110万台,是中国首家服务器总量超过百万的公司,也是全球五家服务器数量过百万的公司之一。在此背景下,腾讯数据中心围绕“降本增效”的核心诉求,不断整合自身资源与经验,加速构建基础设施层的自研技术体系。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95008
  • 驱动
    +关注

    关注

    12

    文章

    1990

    浏览量

    88696
  • 电池
    +关注

    关注

    85

    文章

    11609

    浏览量

    144483
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业设备预测维护:从被动响应到主动防御的智能化转型

    随着工业4.0与智能制造的深入推进,设备维护模式正经历从传统的事后维修与预防维护预测维护
    的头像 发表于 04-22 13:26 22次阅读

    机房UPS电源维护全攻略:延长使用寿命的实用方法,优比施工程师经验分享

    对于企业机房运维工程师来说,UPS电源(不间断电源)是保障业务连续的最后一道防线。然而很多机房中的UPS使用三五年后就开始出现电池续航骤降、逆变器故障甚至突然宕机——这不仅影响设备寿
    的头像 发表于 04-21 10:04 41次阅读
    机房<b class='flag-5'>UPS</b>电源<b class='flag-5'>维护</b>全攻略:延长使用寿命的实用<b class='flag-5'>方法</b>,优比施工程师经验分享

    UPS 不间断电源使用方法有哪些?规范操作与日常维护全攻略

    使用寿命,还可能导致负载设备断电、数据丢失、设备损坏等问题。本文将从安装连接、开关机规范、日常使用核心原则、维护保养技巧、应急处理方法五大维度,系统拆解UPS的正确使
    的头像 发表于 04-07 16:25 2341次阅读
    <b class='flag-5'>UPS</b> 不间断电源使用<b class='flag-5'>方法</b>有哪些?规范操作与日常<b class='flag-5'>维护</b>全攻略

    UPS电源铅酸电池全解析:特性、选型与维护要点

    从实际应用出发,对UPS配套的阀控式密封铅酸电池进行综合解析,帮助用户科学选型与维护。一、为什么UPS离不开铅酸电池?铅酸
    的头像 发表于 04-07 08:35 135次阅读
    <b class='flag-5'>UPS</b>电源铅酸<b class='flag-5'>电池</b>全解析:特性、选型与<b class='flag-5'>维护</b>要点

    优比施:UPS铅酸电池专业安装与核心维护指南,建议收藏

    ​不间断电源(UPS)系统的可靠,最终取决于其“能量仓库”——蓄电池组的健康状况。铅酸蓄电池(主要为阀控式密封铅酸蓄电池,VRLA)因其技
    的头像 发表于 03-11 08:33 134次阅读
    优比施:<b class='flag-5'>UPS</b>铅酸<b class='flag-5'>电池</b>专业安装与核心<b class='flag-5'>维护</b>指南,建议收藏

    延长UPS电源寿命的实用方法大全

    UPS电源作为关键场景的应急供电保障设备,其使用寿命直接关系到供电稳定性与使用成本。延长UPS电源寿命需围绕环境管控、电池维护、负载管理、定期检修及规范操作五大核心维度系统推进,其中
    的头像 发表于 01-23 09:45 972次阅读
    延长<b class='flag-5'>UPS</b>电源寿命的实用<b class='flag-5'>方法</b>大全

    UPS不间断电源是什么?企业如何选型与维护?2026年全攻略

    不间断电源(UPS)。本文将为您深入解析UPS,并提供一份贴合当下需求的企业选型与维护全攻略。一、深度解析:UPS不仅仅是“备用电池”不间断
    的头像 发表于 01-16 10:46 1955次阅读
    <b class='flag-5'>UPS</b>不间断电源是什么?企业如何选型与<b class='flag-5'>维护</b>?2026年全攻略

    设备预测维护数据采集解决方案

    一、预测维护数据挑战 实现预测维护面临三大
    的头像 发表于 10-21 09:49 436次阅读

    机房UPS电源:全面解析如何选型及维护保养方式

    在现代信息化社会中,数据中心和机房已成为企业运营的核心命脉。而UPS不间断电源,则是保障这些关键设施稳定运行的"电力卫士"。本文将为您全面解析机房UPS电源的重要、选型要点
    的头像 发表于 09-06 08:46 1047次阅读
    机房<b class='flag-5'>UPS</b>电源:全面解析如何选型及<b class='flag-5'>维护</b>保养方式

    MES系统怎么实现数字化闭环与设备预测维护

    预测维护代表了MES系统从被动应对到主动预防的转变,通过数据驱动方法
    的头像 发表于 08-14 11:35 871次阅读
    MES系统怎么实现数字化闭环与设备<b class='flag-5'>预测</b><b class='flag-5'>性</b><b class='flag-5'>维护</b>?

    如何将设备预测维护与健康管理解决方案应用到实际生产中?

    把设备预测维护与健康管理方案融入生产,是一场持续进化的 “攻坚战”。从试点突破到全流程贯通,从人员适配到数据驱动迭代,每一步都关乎企业运维
    的头像 发表于 08-11 10:38 1023次阅读
    如何将设备<b class='flag-5'>预测</b><b class='flag-5'>性</b><b class='flag-5'>维护</b>与健康管理解决方案应用到实际生产中?

    设备预测维护与健康管理:工业高效运行新引擎

    随着科技的不断进步,设备预测维护与健康管理解决方案将不断完善和发展。一方面,传感器技术将更加先进,能够采集更多维度、更精准的数据;另一方面,人工智能算法将不断优化,提高故障
    的头像 发表于 08-08 14:48 1289次阅读
    设备<b class='flag-5'>预测</b><b class='flag-5'>性</b><b class='flag-5'>维护</b>与健康管理:工业高效运行新引擎

    UPS电源电池有哪些类型

      铅酸蓄电池UPS电源中应用最为广泛的电池类型之一。它以其技术成熟、成本低廉、性能稳定等特点,被广泛应用于各种UPS电源系统中。铅酸蓄电池
    的头像 发表于 07-23 18:14 1578次阅读
    <b class='flag-5'>UPS</b>电源<b class='flag-5'>电池</b>有哪些类型

    艾默生使用Fluke BT500电池分析仪维护UPS系统

    艾默生网络电源是世界领先的信息和通信技术系统的关键基础设施技术和生命周期服务提供商。其电气可靠服务(ERS)业务提供完整的解决方案,以维护变电站、发电厂和工业厂房以及数据中心等关键设施的电气系统可靠
    的头像 发表于 06-11 17:35 1086次阅读

    提早预见问题:预测维护有效降低企业停机风险

    (Predictive Maintenance)。预测维护是整合传感器、物联网(IoT)与人工智能(AI)等技术,即时监测设备运行的状态,收集并分析设备健康数据,在问题发生前的时机进
    的头像 发表于 05-06 16:32 1126次阅读
    提早预见问题:<b class='flag-5'>预测</b><b class='flag-5'>性</b><b class='flag-5'>维护</b>有效降低企业停机风险