0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息ISPIM平台基于AI算法,整个数据中心细粒度管理

发烧说 2021-11-23 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着数字化进程的加快,各企业、组织对大规模计算服务集群的需求与日俱增,运维难度也随之加大。浪潮作为全球领先的算力基础设施供应商,推出了ISPIM平台,可同时实现对数万台不同品牌服务器、存储、网络设备等设施的统一监控、运维和告警管理,保障客户大规模数据中心安全、稳定、可靠运行。

浪潮信息”/

截至目前,中国高校信息化进程已经走过二十余载,从最初的校园信息化建设到如今的智慧校园,数字化转型下的高校教学、科研、管理和服务对算力的需求也在不断攀升。以中南大学算平台为例,基于传统运维模式已无法对计算服务器集群的算力进行管理、调度和科学合理分配计算资源,算力应用处于黑箱模式,类似于盲人摸象,不清楚、不清晰,无法实现对计算集群快速而精准的有效运维,也造成了运维人力资源的沉重负担。

为了解决传统人力运维管理面临的窘境,中南大学选择与浪潮信息合作。通过实地考察、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,浪潮信息研发工程师最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。

浪潮信息ISPIM系统基于AI算法,对采集到的所有设备的能耗、温度、气流、CUPS以及机房环境数据进行实时智能分析,推送能耗管理与优化建议,通过可视化拓扑呈现,3D建模展示数据中心内机柜位置、位置、功耗、温度状态信息,实现对整个数据中心的细粒度管理。

一方面,中南大学智算平台通过部署浪潮信息ISPIM系统,实现了集中自动化管理,大大减轻了运维负担,通过对算力数据的精准获取、调度,使得算力的管控集中化、智能化,另一方面,运维人员通过ISPIM平台可随时随地监控整个平台的运行状态,故障报警能够以秒级的速度精准定位,保障中南大学的智算平台高效有序运转,节约了人力资源,运维效率大幅提升。

在未来,浪潮信息将持续关注大规模计算服务集群的需求,基于ISPIM平台,提供优质的自动化运维解决方案,为千行百业赋能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7348

    浏览量

    95008
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    曦智科技探讨AI数据中心三大扩展策略

    在OFC 2026期间,曦智科技接受了Semiconductor Engineering的专访,探讨了AI数据中心三大扩展策略——纵向扩展(Scale-up)、横向扩展(Scale-out)和跨数据中心扩展(Scale-acro
    的头像 发表于 04-21 16:34 236次阅读
    曦智科技探讨<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>三大扩展策略

    浪潮通信获评2025年度数据中心创新产品

    近日,在第十七届中国数据中心大会上,中国计算机用户协会数据中心分会发布2025年度行业权威评选结果,浪潮通信自主研发的浪潮Cooling-ALC1000系列风液同源产品,凭借突出的创新
    的头像 发表于 04-16 09:38 410次阅读

    跳线架在数据中心的应用与优化策略

    数据中心作为信息时代的核心基础设施,其网络布线的复杂性和重要性不言而喻。跳线架作为数据中心网络布线中的关键组件,其应用和优化策略直接影响到数据中心的运行效率和稳定性。本文将探讨跳线架在
    的头像 发表于 04-02 10:56 175次阅读

    青智ZW3432B1数据中心电源管理系统监控方案

    随着数据中心的迅猛发展,数据中心能耗问题也越来越突出,可靠的数据中心配电系统方案,是提高数据中心电能使用效率,降低设备能耗的有效方式。 数据中心
    的头像 发表于 03-24 17:29 569次阅读
    青智ZW3432B1<b class='flag-5'>数据中心</b>电源<b class='flag-5'>管理</b>系统监控方案

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    NVIDIA软件可选服务支持数据中心集群管理

    这项可选服务将帮助数据中心运营商监测整个 AI GPU 集群运行状况,从而最大限度地延长正常运行时间。
    的头像 发表于 12-13 09:37 1048次阅读
    NVIDIA软件可选服务支持<b class='flag-5'>数据中心</b>集群<b class='flag-5'>管理</b>

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助
    的头像 发表于 10-23 15:08 934次阅读

    AI 芯片浪潮下,职场晋升新契机?

    在科技飞速发展的当下,AI 芯片已然成为众多行业变革的核心驱动力。从互联网巨头的数据中心,到我们日常使用的智能手机、智能家居设备,AI 芯片的身影无处不在,深刻改变着产品形态与服务模式。而对于身处
    发表于 08-19 08:58

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    定义数据中心互联的新范式。 一、技术实力:800G OSFP光模块的卓越性能表现 睿海光电800G OSFP光模块系列采用行业领先的PAM4调制技术,具备以下核心优势: 超高速率 :单模传输速率达
    发表于 08-13 16:38

    苏州DCIM数据中心基础设施管理运维系统简介

    在数字化浪潮席卷各行各业的今天,数据中心的稳定运行成为企业业务连续性的关键支撑。作为长三角地区重要的经济中心城市,苏州近年来在数据中心建设领域发展迅速,对高效可靠的运维
    的头像 发表于 08-01 09:40 1172次阅读
    苏州DCIM<b class='flag-5'>数据中心</b>基础设施<b class='flag-5'>管理</b>运维系统简介

    PCIe协议分析仪在数据中心中有何作用?

    数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景:在AI训练集群中,GPU通过PCIe与CPU交换数据,若带宽利用率低
    发表于 07-29 15:02

    中型数据中心应用平台与差分晶体振荡器参数对照中型数据中心应用平台与差分晶体振荡器参数对照

    针对中型数据中心中网络交换、数据存储与边缘设备的时钟精度、低抖动、高温稳定性与功耗管理需求,FCO系列差分晶体振荡器提供了标准型、低抖动(UJ系列)与低功耗(PG系列)多个版本,支持多种封装、电压
    发表于 07-10 14:11

    中型数据中心中的差分晶体振荡器应用与匹配方案

    对时钟源的稳定性与抖动性能要求显著提升,差分晶体振荡器在其中扮演着核心角色。 中型数据中心典型案例 1. 大型制造企业工业数据中心 应用背景: 服务于制造集团的MES系统、IIoT平台、设备监控与调度
    发表于 07-01 16:33

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 1237次阅读