0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

NVIDIA英伟达 来源:英伟达NVIDIA中国 2020-06-24 16:02 次阅读

NVIDIA Mellanox UFM Cyber-AI平台检测安全威胁、预测网络故障并指导预测性维护

NVIDIA于今日发布NVIDIA Mellanox UFM Cyber-AI平台,该平台运用AI分析技术检测安全威胁和运行问题并预测网络故障,能够大幅减少InfiniBand数据中心的停机时间。

UFM平台产品系列已管理InfiniBand系统近十年,此次扩展将使用AI通过实时和历史遥测及工作负载数据来学习数据中心的运行节奏和网络工作负载模式。它能根据这一基准追踪系统的运行状况和网络修改并检测性能下降、使用情况和配置文件更改。

该全新平台可发出警报,提示系统和应用异常行为、潜在系统故障以及威胁,并执行纠正措施。它还能在系统遭受黑客攻击,安装恶意应用(例如加密币挖币软件)时发出安全警报。这减少了数据中心的停机时间,而根据ITIC的研究,停机1小时所造成的成本通常在30万美元以上。

NVIDIA Mellanox网络事业部高级营销副总裁Gilad Shainer表示:“ UFM Cyber-AI平台能够确定数据中心的独特生命体征并通过它们识别性能下降、组件故障和异常使用方式。有了它,系统管理员可以快速检测和响应潜在的安全威胁并解决即将发生的故障,从而节省成本,确保客户业务的连续性。”

来自生态系统合作伙伴的支持

长期以来在其数据中心使用UFM平台的企业机构对此最新产品表示了浓厚的兴趣。

澳大利亚国家计算基础设施(NCI Australia)的服务和技术副总监Allan Williams说:“NCI在国家研究领域发挥着关键作用。我们的超级计算基础设施为5000名研究人员提供服务,他们将其用于关键性的国家和国际研究活动。UFM使我们能够有效地管理超级计算机并优化其性能。我们期待利用UFM Cyber-AI的新功能,进一步提高我们的超级计算利用率,提高我们的投资回报。”

俄亥俄州超级计算机中心(Ohio Supercomputer Center)协会理事长Douglas Johnson表示:“多年来,我们的InfiniBand数据中心一直使用UFM平台。UFM和Mellanox网络团队的专业知识已成为我们管理网络和实现稳定性的基础。UFM Cyber-AI平台具有很多出众的优点。”

扩展UFM平台

UFM Cyber-AI平台对UFM Enterprise平台进行了补充。UFM Enterprise平台提供网络监视、管理、性能优化、配置检查和安全电缆管理功能。

NVIDIA今日还发布了UFM系列的第三款产品 —— UFM Telemetry平台。这款工具能够捕获实时网络遥测数据,该数据将被传输到本地或云端数据库,用于监视网络性能和验证网络配置。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101710
  • 数据中心
    +关注

    关注

    15

    文章

    4187

    浏览量

    70007
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264044

原文标题:ISC 2020 | NVIDIA发布AI平台,大幅减少超算数据中心的停机时间

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    #mpo极性 #数据中心mpo

    数据中心MPO
    jf_51241005
    发布于 :2024年04月07日 10:05:13

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA Quantum-X800 InfiniBand 网络,打造性能最强大的 AI 专用基础设施 NVIDIA Spectrum-X800 以太网络,数据中心必备的优化
    发表于 03-19 10:05 115次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>发布</b>全新交换机,全面优化万亿参数级 GPU 计算和 <b class='flag-5'>AI</b> 基础设施

    是德科技推出AI数据中心测试平台

    是德科技近期宣布,针对蓬勃发展的AI和ML基础设施生态系统,隆重推出了全新的AI数据中心测试平台。该平台专为加速
    的头像 发表于 03-08 10:17 249次阅读

    是德科技推出AI数据中心测试平台旨在加速AI/ML网络验证和优化的创新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,针对人工智能(AI)和机器学习(ML)基础设施生态系统,推出了 AI数据中心测试平台,旨在加
    的头像 发表于 02-29 09:32 248次阅读
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>测试<b class='flag-5'>平台</b>旨在加速<b class='flag-5'>AI</b>/ML网络验证和优化的创新

    澜起科技津逮服务器平台数据中心带来卓越的安全与性能

    津逮®服务器平台,一款由澜起科技精心打造的云计算数据中心解决方案,旨在为关键领域提供卓越的数据运算安全性和稳定性。该平台集成了津逮®CPU和混合安全内存模组(HSDIMM®)两大核心组
    的头像 发表于 01-31 11:43 491次阅读

    浅谈云数据中心、智算数据中心、超算数据中心区别,分布式电源是趋势

    数据中心、智算数据中心、超算数据中心三者区别,分布式电源是趋势 大家都在聊云数据中心、智算数据中心、超
    的头像 发表于 11-29 14:20 821次阅读
    浅谈云<b class='flag-5'>数据中心</b>、智<b class='flag-5'>算数据中心</b>、超<b class='flag-5'>算数据中心</b>区别,分布式电源是趋势

    适用于数据中心AI 时代的网络

    十多年来,传统的云数据中心一直是计算基础设施的基石,满足了各种用户和应用程序的需求。然而,近年来,为了跟上技术的进步和对 AI 驱动的计算需求的激增,数据中心进行了发展。 本文探讨了网络在塑造
    的头像 发表于 10-27 20:05 249次阅读
    适用于<b class='flag-5'>数据中心</b>和 <b class='flag-5'>AI</b> 时代的网络

    AI智能呼叫中心

    数据驱动决策以及人力成本节约,旨在深入剖析其核心优势和对企业的重要意义。一、自动化处理AI智能呼叫中心通过引入自然语言处理(NLP)、机器学习和自动化技术,使得呼叫中心的处理过程更加
    发表于 09-20 17:53

    使用 NVIDIA DOCA 2.2 加速数据中心工作负载和 AI 应用程序

    数据中心的创新,实现了应用程序的快速部署。 凭借全面的功能,NVIDIA DOCA 可为基于 BlueField DPU 进行开发的开发人员提供大规模加速数据中心工作负载和人工智能应用程序的一站式
    的头像 发表于 09-05 19:40 376次阅读
    使用 <b class='flag-5'>NVIDIA</b> DOCA 2.2 加速<b class='flag-5'>数据中心</b>工作负载和 <b class='flag-5'>AI</b> 应用程序

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    转自https://m.ithome.com/html/714391.htm 2023 RISC-V 中国峰会8月23日在北京召开,平头哥在会上发布了首个自研 RISC-V AI 平台。 据介绍,该
    发表于 08-26 14:14

    浸没式液冷SSD 建兴储存科技锁定AI算数据中心

    和高耐用度,可以应对高工作负载和大量写入操作,并支持服务器直接液体冷却技术。 随着NVIDIA(英伟达)执行长黄仁勋与AMD(超微)执行长苏姿丰相继来台,AI热度持续升温,数据中心成为全新的运算单位。根据研究报告指出,全球大型
    发表于 08-10 11:21 297次阅读
    浸没式液冷SSD 建兴储存科技锁定<b class='flag-5'>AI</b>运<b class='flag-5'>算数据中心</b>

    SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企业加速采用自定义生成式 AI

    从 PC 和工作站到企业数据中心、公有云和 NVIDIA DGX 云,新推出的开发者套件在 NVIDIA AI 平台上引入了简化的模型优化与
    的头像 发表于 08-09 19:10 284次阅读

    SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

    年 8 月 8 日 —   NVIDIA 宣布推出搭载全新 NVIDIA L40S GPU 的 NVIDIA OVX 服务器。这款功能强大的通用数据中心处理器将通过
    的头像 发表于 08-09 19:10 283次阅读

    Atonarp 质谱分析仪减少设备停机时间

    Aston 原位质谱仪可以进行快速, 化学特异性原位定量气体分析, 以实现准确和快速的腔室吹扫终点检测. 与典型的基于时间的清洗程序相比, 这可以节省大量的设备停机时间
    的头像 发表于 06-21 10:40 201次阅读

    NVIDIA 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 AI 和 5G/6G 的软银下一代数据中心

    宣布,双方正在合作打造一个基于 NVIDIA GH200 Grace Hopper 超级芯片 、面向生成式 AI 和 5G/6G 应用的开创性平台。软银计划在日本各地的全新分布式 AI
    的头像 发表于 05-30 01:40 446次阅读
    <b class='flag-5'>NVIDIA</b> 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 <b class='flag-5'>AI</b> 和 5G/6G 的软银下一代<b class='flag-5'>数据中心</b>