0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为了在数据中心成功部署实时监控,IT团队应先解决的六大问题

如意 来源:TechTarget中国 作者:邹铮 2020-10-08 11:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于数据中心运营,可能很难确定哪些数据至关重要,哪些数据是背景噪音。筛选数据的能力至关重要,因为数据中心经理必须迅速确定哪些警报至关重要,哪些警报可以帮助提供有关其基础架构运行情况的信息。

在2020年数据中心世界大会上,在《Real-time Environmental Monitoring for Your Data Center Management Platforms and Getting Common Data Into Your New Hybrid World》的演讲中,Critical Environments Group公司数据中心解决方案主管Andrew Graham和RLE Technologies公司国际和西方国家销售主管Cam Rogers介绍了一个框架,该框架可以帮助企业在混合环境中设置实时监控,以有效管理和扩展基础架构。

为了成功部署实时监控,IT团队应该解决五个问题:谁、什么、何时、何地、为什么以及如何。

1. 弄清楚为什么需要实时监控

在IT团队投资于任何类型的实时监控前,他们应该弄清楚为什么在数据中心内需要实时监控。潜在的原因包括降低成本、提高生产率、简化管理以及减少意外和停机时间。

当企业试图将基础设施扩展到本地数据中心之外,并整合主机托管和边缘作为整个基础结构的一部分时,这些原因尤其引人注目。Graham说,随着混合IT不断发展,那些运营自己数据中心的企业发现,容量管理成为巨大的问题。

实时监控技术最初用于提供数据中心基础设施的快照,因此非常适合帮助IT团队更有效地管理数据中心,并帮助解决日益复杂的设置问题—其中涉及多种技术类型。

RSP Architects的负责人Rajan Battish说:“实时监控已经取得很大的进步;它一直存在。多年来,我们看到的是,它们在机架级别获取信息,并尝试通过基础架构对其进行优化。监控系统开始获取数据中心的运行情况数据,并且它成为自动化和优化的方式。”

2. 确定谁必须参与

当IT团队建立业务用例,他们就必须考虑谁应该参与到新的实时监控设置中。

这包括必须向谁报告问题、该系统应及时将信息提供给谁、谁关注设施状况、哪些人员负责新应用的推出,以及哪些团队关注流程的改进和有效性。

如果企业具有非本地基础架构,则管理员必须说明可能需要报告的任何外部方,例如托管服务提供商、主机托管和云提供商、合作伙伴和供应商。

IT团队必须建立主要的利益相关者,因为这样做会影响报告结构和软件警报。这还可以减少报告的冗余。

Rogers表示:“每个利益相关者都有不同的优先事项,IT经理可能与设施经理有不同的需求。应该由他们决定什么重要,什么不那么重要。”

他补充说,企业可以从本地化警报开始,这些警报不一定关联所有事物。

他说:“除非你的员工24/7全天候工作,否则当你无法看到警报时,问题就会非常迅速地发酵。你需要查看设施并将警报发送给合适的人。”

3. 查看最有用的指标是哪些

企业有很多数据需要跟踪-特别是在基础架构方面。通过实时监视设置,管理人员应确定哪些指标对他们很重要,以及哪些指标可以快速提供信息。

Rogers说:“这实际上取决于你希望管理和汇集哪些资产。”

大多数企业都依赖一些通用指标,例如电源使用效率(PUE)、数据中心基础架构效率(DCIE)、能耗降低和IT设备利用率。但是管理员应谨慎对待这些指标。

PUE是广泛使用的度量标准,但它基于对IT设施功率和总设备功率的总体估计。如果团队进行IT升级,则PUE可能会上升。Graham建议,IT管理员使用PUE作为内部度量,而不是尝试将其与企业外部的其他数据中心进行比较。

Graham和Rogers解释说,管理人员可以使用PUE和DCIE之外的其他指标,例如冷却指标,但是这些指标可能需要更多数据和分析,从而导致部署率较低。

4. 确定何时部署监控或扩大容量

对于何时增加容量或系统应用程序,可能很困难,尤其是随着IT需求的不断变化。你的团队应该考虑你的监视和管理工具是否可以帮助内部开发和改进的规划、进度和性能。

Graham说:“你不能只是考虑你何时需要使设备可用和运行以推出应用程序。你需要从上线日期开始工作,以覆盖部署过程中每一步所需的所有资源。”

实时监控还可以通过针对特定事件的指标来为日常工作提供帮助:事件发生的时间、报告时间和解决的时间。识别这些时间可以帮助企业更加主动地响应事件,特别是如果这些实例显示出随时间变化的模式或以特定间隔定期发生的情况。

5. 了解基础设施的位置

企业还应该考虑他们应该在何处部署监控软件和硬件-无论是在本地数据中心、在边缘节点的异地还是在主机托管地点。从内部角度来看,应该有连续的流程来跟踪容量和连接的设备。

还有云提供商提供的信息,因此IT团队应询问是否可以在云端跟踪和追踪数据,并确定任何合规性需求–文档或专用应用程序等。

通过更准确地了解所有数据和硬件在IT设置中所处的位置,企业可以确定哪种实时监控产品最能满足其需求,并且可以支持所有必需的技术类型。在部署实时监控后,这将确保一致的性能和有效的容量管理。

6. 了解如何监控基础架构

在IT团队、管理人员和利益相关者讨论完何时、何地以及什么后,管理员应调查企业应如何部署实时监控并增加基础架构容量。这涉及了解可能影响基础架构增长的因素,例如热点、地面空间用尽、中断、缺乏冷却资源和水资源等。

Battish说,大多数企业在部署过程中都面临挑战,特别是在使硬件和软件相互通信方面。

这使得汇聚协议非常重要,因为大多数企业通过多家供应商来构建数据中心基础架构。然而,传感器和协议转换器可以帮助收集数据并提高实时监视功能。

Rogers说:“传感器有很多选择,因此请确保做好功课,不要将自己锁定在专有产品,而没有办法支持明天及未来需要的功能。”

行业产品包括用于配电单元和不间断电源的有线和无线传感器,以及一系列软件,企业可购买现成产品或根据内部需求定制产品。传感器和软件的这种组合可以帮助管理员和经历减少日常补救任务的数量。

Graham称:“当人们在不断解决相同的问题时,这对士气不利。我们并不是说每个人都需要单一视图,但他们应该减少冗余,整合并解决正确的问题。监视和管理的转变允许人们要更有效率,并在我们的行业中处于领先地位,并专注于更多的优化工作。”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93993
  • 监控系统
    +关注

    关注

    21

    文章

    4150

    浏览量

    184363
  • 数据中心
    +关注

    关注

    16

    文章

    5521

    浏览量

    74658
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小母线大智慧:安科瑞智能监控解决方案赋能数据中心配电升级

    配电柜+电缆供电方式的替代方案,核心作用是实现数据中心内电【】187力0210的6706灵【】活、高效、安全分配。它的主要作用是为机柜内的设备提供集中、高效和灵活的电力分配。与传统的电缆布线方式相比,它能够实现快速部署在数据中心
    的头像 发表于 11-26 15:28 198次阅读
    小母线大智慧:安科瑞智能<b class='flag-5'>监控</b>解决方案赋能<b class='flag-5'>数据中心</b>配电升级

    安科瑞多回路监控装置在数据中心列头柜的应用

    机柜的任何位置,甚至单独放置。 列头柜在数据中心电力系统中扮演着"指挥官"的角色,掌控着整个数据中心的电力命脉。它能够根据不同设备的功率需求,将总输入电力合理地分配到各个支路,确保每一台设备都能获得稳定、适配的
    的头像 发表于 11-13 16:45 460次阅读
    安科瑞多回路<b class='flag-5'>监控</b>装置<b class='flag-5'>在数据中心</b>列头柜的应用

    动环监控数据中心机房的“智慧守护者”

    在数字化时代,数据中心机房已成为企业运营的核心命脉。动力环境监控系统(简称动环监控)正是保障这一命脉稳定运行的“智慧守护者”,通过7x24小时不间断监测,构建起机房安全的第一道防线。
    的头像 发表于 10-28 15:45 202次阅读

    华为成功举行数据中心基础设施峰会

    行业智能化,共同探讨数智基础设施在绿色低碳的新技术、新实践。华为数字能源还展示了绿色低碳全场景数字能源解决方案及成功案例,与业界携手智赢AI时代,共筑高质量安全可靠数据中心
    的头像 发表于 09-20 10:01 985次阅读

    苏州DCIM数据中心基础设施管理运维系统简介

    数据中心基础设施管理)系统正是在这样的背景下应运而生,为各类规模的数据中心提供智能化管理解决方案。 传统数据中心运维往往面临诸多痛点:设备分散难监控、能耗管理粗放、故障响应滞后等问题
    的头像 发表于 08-01 09:40 704次阅读
    苏州DCIM<b class='flag-5'>数据中心</b>基础设施管理运维系统简介

    PCIe协议分析仪在数据中心中有何作用?

    案例:PCIe分析仪在数据中心中的成功应用 案例1:AI训练集群性能提升 问题:某AI训练集群中,8块GPU通过PCIe交换机互联,训练任务完成时间比预期长20%。 解决: 使用分析仪捕获PCIe流量,发现
    发表于 07-29 15:02

    RISC-V 在数据中心软件生态系统中的机遇与挑战

    RISC-V 作为一种开源指令集架构,凭借其灵活性、可扩展性和开源特性,在数据中心领域的应用正从探索阶段逐步向实际落地推进。目前,RISC-V 在数据中心的应用处于 “能跑通但需优化” 的阶段。从
    发表于 07-18 13:38 5128次阅读

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、低延迟与高可用性。关键设备
    发表于 07-01 16:33

    施耐德电气发布数据中心高密度AI集群部署解决方案

    在人工智能(AI)驱动的产业革命浪潮中,数据中心正迎来深刻变革。面对迅猛增长的人工智能算力需求,部署高密度AI集群已成为数据中心发展的必然选择。
    的头像 发表于 04-19 16:54 1252次阅读
    施耐德电气发布<b class='flag-5'>数据中心</b>高密度AI集群<b class='flag-5'>部署</b>解决方案

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网络技术应运而生
    发表于 03-25 17:35

    数据中心发展与改造

    全球多数数据中心基础设施已超年,能耗高而效率低。随着AI的发展,企业正致力于整合与提升能效的现代化改造。同时数据中心呈现规模化、高密化、绿色化发展趋势。19821800313 一、目前数据中
    的头像 发表于 02-28 16:50 743次阅读
    <b class='flag-5'>数据中心</b>发展与改造

    光通信在数据中心的应用

    在数字化时代,数据中心作为信息处理和存储的核心,承担着海量数据的传输和处理任务。随着云计算、大数据、人工智能等技术的发展,数据中心的规模和复
    的头像 发表于 01-23 09:33 1770次阅读

    光纤连接器在数据中心的应用

    在数据中心的应用变得尤为重要。 1. 光纤连接器的基本原理 光纤连接器是一种用于连接光纤的设备,它允许光纤在不中断的情况下进行连接和断开。光纤连接器的主要优点是它们可以快速、可靠地连接光纤,并且具有很高的插拔次数
    的头像 发表于 12-29 14:55 1314次阅读

    福禄克仪表在数据中心运维中的应用

    在数据中心日常运维中,万用表、绝缘表和热像仪是工程师较常用的工具,它可以帮助技术人员检测和诊断各种电气及设备问题。下面介绍福禄克仪表在数据中心对于电力系统、设备温度及接地系统的检测。
    的头像 发表于 12-25 16:34 833次阅读