0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

NVIDIA英伟达 来源:英伟达NVIDIA中国 2020-06-24 16:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA Mellanox UFM Cyber-AI平台检测安全威胁、预测网络故障并指导预测性维护

NVIDIA于今日发布NVIDIA Mellanox UFM Cyber-AI平台,该平台运用AI分析技术检测安全威胁和运行问题并预测网络故障,能够大幅减少InfiniBand数据中心的停机时间。

UFM平台产品系列已管理InfiniBand系统近十年,此次扩展将使用AI通过实时和历史遥测及工作负载数据来学习数据中心的运行节奏和网络工作负载模式。它能根据这一基准追踪系统的运行状况和网络修改并检测性能下降、使用情况和配置文件更改。

该全新平台可发出警报,提示系统和应用异常行为、潜在系统故障以及威胁,并执行纠正措施。它还能在系统遭受黑客攻击,安装恶意应用(例如加密币挖币软件)时发出安全警报。这减少了数据中心的停机时间,而根据ITIC的研究,停机1小时所造成的成本通常在30万美元以上。

NVIDIA Mellanox网络事业部高级营销副总裁Gilad Shainer表示:“ UFM Cyber-AI平台能够确定数据中心的独特生命体征并通过它们识别性能下降、组件故障和异常使用方式。有了它,系统管理员可以快速检测和响应潜在的安全威胁并解决即将发生的故障,从而节省成本,确保客户业务的连续性。”

来自生态系统合作伙伴的支持

长期以来在其数据中心使用UFM平台的企业机构对此最新产品表示了浓厚的兴趣。

澳大利亚国家计算基础设施(NCI Australia)的服务和技术副总监Allan Williams说:“NCI在国家研究领域发挥着关键作用。我们的超级计算基础设施为5000名研究人员提供服务,他们将其用于关键性的国家和国际研究活动。UFM使我们能够有效地管理超级计算机并优化其性能。我们期待利用UFM Cyber-AI的新功能,进一步提高我们的超级计算利用率,提高我们的投资回报。”

俄亥俄州超级计算机中心(Ohio Supercomputer Center)协会理事长Douglas Johnson表示:“多年来,我们的InfiniBand数据中心一直使用UFM平台。UFM和Mellanox网络团队的专业知识已成为我们管理网络和实现稳定性的基础。UFM Cyber-AI平台具有很多出众的优点。”

扩展UFM平台

UFM Cyber-AI平台对UFM Enterprise平台进行了补充。UFM Enterprise平台提供网络监视、管理、性能优化、配置检查和安全电缆管理功能。

NVIDIA今日还发布了UFM系列的第三款产品 —— UFM Telemetry平台。这款工具能够捕获实时网络遥测数据,该数据将被传输到本地或云端数据库,用于监视网络性能和验证网络配置。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110102
  • 数据中心
    +关注

    关注

    18

    文章

    5756

    浏览量

    75195
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534

原文标题:ISC 2020 | NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    意法半导体为超大规模AI数据中心破解供电难题

    AI大模型算力需求呈指数级飙升,兆瓦级AI机柜成为主流,传统54V低压配电系统早已触到物理极限,供电端的多重挑战正成为AI数据中心规模化发展的核心掣肘!意法半导体全新
    的头像 发表于 04-07 15:46 224次阅读
    意法半导体为超大规模<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>破解供电难题

    晶科能源全球发布新一代数据中心AIDC组件

    2026年3月20日,上海,全球领先的光伏企业晶科能源全球发布新一代数据中心AIDC组件,该产品依托成熟的飞虎3组件平台技术,深度聚焦数据中心高负荷、高财产安全、全天长时运行、极端耐候
    的头像 发表于 03-23 11:35 409次阅读

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 501次阅读

    微软Azure数据中心国际版全面对接NVIDIA Rubin平台

    2026年CES大会见证了NVIDIA Rubin问世,而微软Azure数据中心(国际版)凭借前瞻战略已实现全面对接。通过在散热与网络领域的超前布局,Azure(国际版)将系统化方法与Rubin架构
    的头像 发表于 03-03 09:56 507次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    NVIDIA软件可选服务支持数据中心集群管理

    这项可选服务将帮助数据中心运营商监测整个 AI GPU 集群运行状况,从而最大限度地延长正常运行时间
    的头像 发表于 12-13 09:37 1046次阅读
    <b class='flag-5'>NVIDIA</b>软件可选服务支持<b class='flag-5'>数据中心</b>集群管理

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心AI基础设施平台平台集成了电源和冷却产品、计算能力和服务,专为
    的头像 发表于 10-23 15:08 924次阅读

    Cadence 借助 NVIDIA DGX SuperPOD 模型扩展数字孪生平台库,加速 AI 数据中心部署与运营

    [1]  利用搭载 DGX GB200 系统的 NVIDIA DGX SuperPOD[2] 数字孪生系统实现了库的重大扩展 。借助 NVIDIA 高性能加速计算平台的新模型,数据中心
    的头像 发表于 09-15 15:19 1650次阅读

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    合作案例,成为AI数据中心升级的关键推动者。 一、技术实力:AI光模块的研发与量产先锋 睿海光电作为全球AI光模块的领先品牌,专注于为数据中心
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    客户的共同选择 中心应用 :为某国家实验室提供800G OSFP SR8模块,构建E级算互联网络 AI训练集群 :某自动驾驶企业采用我们的解决方案,GPU间通信延迟降低至1.2μ
    发表于 08-13 16:38

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布全新升级的星河
    的头像 发表于 08-11 10:42 2560次阅读

    中型数据中心应用平台与差分晶体振荡器参数对照中型数据中心应用平台与差分晶体振荡器参数对照

    中型数据中心对高频、低抖动、宽温与多电压晶振的需求日益提升,FCO系列差分晶体振荡器凭借丰富封装、输出逻辑选择与优异相位抖动性能,为网络、存储、服务器与边缘系统提供稳定的时钟解决方案。FCO-2L 到 FCO-7L 系列,已成为新一代数据中心关键
    发表于 07-10 14:11

    中型数据中心中的差分晶体振荡器应用与匹配方案

    关键业务平台,需高IO能力、低时延响应与高并发处理,具备容灾与跨区域同步能力。 使用设备: 数据中心级交换机、光模块、RAID控制器、企业级SSD阵列、PCIe HBA/NIC、高精度差分振荡器、时间
    发表于 07-01 16:33

    华为面向亚太地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025亚太站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向亚太地区发布全新升级的星河
    的头像 发表于 06-11 11:11 1578次阅读

    华为面向中东中亚地区发布全新星河AI数据中心网络

    近日,在华为数据通信创新峰会2025中东中亚站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向中东中亚地区发布
    的头像 发表于 05-21 15:49 1036次阅读