0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Quantum-2 InfiniBand 平台助力杜伦大学创新和改进超算基础设施

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-12-23 16:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 推出 “AI 改变行业未来” 系列文章,邀你一起见证科技力量。本周带来第七期 “AI 改变行业未来” 之高等教育和研究。

高等教育机构处在重大全球挑战的前沿,负责培养 AI、加速计算和数据科学领域的创新者。同时,各大机构需要满足人们对更灵活,更易获取的教育方案的需求。从本地到云,NVIDIA 提供的工具可随时随地推动重要学科的探索发现。

扩展基础设施

借助集中式基础设施和优秀的计算能力,处理大型工作负载、提高效率并降低运营成本。

推动创新

使用加速探索、实验和部署的工具,扫清发现道路上的障碍。研究人员可以借助由 GPU 加速的 AI 和高性能计算 (HPC),运用建模、模拟和实验数据来解决艰难挑战。

强化学习

让学生掌握关键的 AI 和高性能计算技能,促进其职业发展。为教育机构提供培训和基础设施解决方案,促进新一代的研究。

虚拟GPU加速印第安纳州课堂

印第安纳大学(IU)正在建造两台 AI 超级计算机,它们共装有 616 个 A100 GPU。由慧与建造的 Big Red 200 将为印第安纳大学的九个校区提供服务。由戴尔科技建造的 Jetstream-2 将为康奈尔大学,及夏威夷大学等多家合作机构的工作提供支持。

A100 能够将处理器的处理性能分成多个部分,使得 Jetstream-2 能够承载数百名学生同时参加的课程,每名学生都能使用一部分 GPU 性能来学习流行的图像分类等 AI 技能。印第安纳大学的一名研究人员在去年11月提交了一篇论文,描述了对该虚拟 GPU 功能所进行的基准测试。

目前超过 2500 名学生使用印第安纳大学目前的 GPU 加速系统。去年,该大学创纪录的 10 亿美元研究合同和拨款分布在 178 个学院,其中超过 40%的工作由这些系统运行。

印第安纳大学普适技术研究所首席运营官、AI-for-everyone 计划负责人 Winona Snapp-Childs 表示:“资助机构意识到机器学习在 AI,加速计算等学术领域的重要性有助于推动科学发展。我可以想象,在未来的 5 到 10 年内,可能近一半的研究都将用到这些技术,它们将变得无处不在,并成为学术研究中必不可少的技术。”

密西西比州立大学乘上 400G 网速列车

密西西比州立大学将使用 NVIDIA Quantum-2 InfiniBand 平台。它是构建 Orion 新系统的首选网络,Orion 是密西西比州立大学管理的四个集群中最大的一个集群,这四个集群全部使用较早版本的 InfiniBand 网络所构建。

Orion 和新系统均由美国国家海洋和大气管理局 (NOAA) 所资助,由戴尔科技建造。Orion 和新系统将承担 NOAA 的工作任务,以及密西西比州立大学的各项研究课题。Orion 在 2019 年 6 月首次登上 TOP500 榜单,并被列为美国第四大学术超级计算机。

密西西比州立大学高性能计算总监 Trey Breckenridge 表示:“我们在密西西比州立大学的四代超级计算机中都使用了 InfiniBand,所以我们知道它既强大又成熟,可以可靠地运行我们需要的大型工作。”

DPU 助力杜伦大学创新和改进超算基础设施

杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

原文标题:AI 改变行业未来: 加速高等教育和研究领域新发现

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110112
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136062
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302576

原文标题:AI 改变行业未来: 加速高等教育和研究领域新发现

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 力。
    的头像 发表于 03-18 14:44 524次阅读

    中科曙光scaleX万卡集群重塑超大规模基础设施

    在“人工智能+”行动深入推进的当下,基础设施已成为国家战略竞争力的核心,而超大规模集群的运维管控难题却日益凸显。中科曙光scaleX万卡集群打造的智能管理体系,正以“能管住-管得稳-用得好”的进阶逻辑,重塑超大规模
    的头像 发表于 01-30 15:43 966次阅读

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光技术,为 NVIDIA Rubin 平台实现
    的头像 发表于 01-14 09:06 886次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太网硅光技术<b class='flag-5'>助力</b>AI工厂网络<b class='flag-5'>创新</b>

    NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

    NVIDIA 宣布,NVIDIA BlueField®-4 数据处理器作为全栈 NVIDIA BlueField 平台的一部分,为 NVIDIA
    的头像 发表于 01-09 10:33 642次阅读

    擎数智为您深度解析NVIDIA Quantum-X800 InfiniBand平台

    NVIDIA
    专精特新
    发布于 :2026年01月08日 19:47:03

    商汤科技与沙特国王大学合作共建人工智能创新中心

    业人工智能应用场景的探索。同时,商汤沙特也正在当地建设基础设施,将以中国制造芯片为创新中心提供所需计算资源,并助力当地教育、文旅、智慧城市、医疗、能源等等领域技术及生产力发展。
    的头像 发表于 11-14 11:17 1188次阅读

    华为节点互联技术引领AI基础设施新范式

    今日,华为全联接大会2025在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强节点和集群。
    的头像 发表于 09-20 16:15 2274次阅读

    科士达全栈解决方案亮相2025 ODCC,驱动绿色AI智基础设施革新

    2025年开放数据中心大会(ODCC)于9月9日-11日在北京国际会议中心盛大启幕。本届峰会以“拥抱AI变革,点燃网引擎”为主题,聚焦AI爆发背景下基础设施面临的能效、部署与可持续性挑战,汇聚
    的头像 发表于 09-17 15:40 1389次阅读
    科士达全栈解决方案亮相2025 ODCC,驱动绿色AI智<b class='flag-5'>算</b><b class='flag-5'>基础设施</b>革新

    睿海光电领航AI光模块:快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效力底座

    到全场景兼容,从800G量产突破到1.6T前瞻布局,睿海光电始终以客户需求为导向,以技术创新为引擎,为全球AI基础设施建设提供坚实底座。凭借智能制造实力与开放生态策略,睿海光电正携手合作伙伴,共同推动智能时代的力革命! 睿海光
    发表于 08-13 19:03

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    NVIDIA Quantum-2交换机等主流设备。 平滑扩展:与现有400G/100G设备无缝互通,降低数据中心升级成本。 多场景覆盖:从AI训练集群的“大象流”到AI推理的碎片化流量,均可通过智能
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    800Gbps,完美适配大模型训练等高带宽场景 广泛兼容 :通过NVIDIA Quantum-2交换机、Spectrum-4以太网设备的严格兼容性测试 稳定可靠 :平均无故障时间(MTBF)突破300万小时,较
    发表于 08-13 16:38

    Imagination加入龙蜥智基础设施联盟,携手共建AI开源新生态

    、Intel等企业及清华大学、上海交通大学等高校,共同致力于构建面向未来的自主高效智基础设施,推动AI技术的普及与落地。联盟汇聚AI芯片、服务器、操作系统、应用
    的头像 发表于 08-08 20:01 1116次阅读
    Imagination加入龙蜥智<b class='flag-5'>算</b><b class='flag-5'>基础设施</b>联盟,携手共建AI开源新生态

    欧洲联手NVIDIA打造AI基础设施

    NVIDIA 于近日宣布,其正在携手欧洲各国、科技和行业领导者,共同建造 NVIDIA Blackwell AI 基础设施,以强化数字主权、支撑经济增长,并推动欧洲大陆成为 AI 工业革命的领导者。
    的头像 发表于 06-16 14:25 1648次阅读

    维谛加速推进人工智能基础设施演进,助力NVIDIA 800 VDC 电源架构发布

    为适配下一代AI工厂的需求,维谛规划在2026年推出800VDC解决方案,支撑英伟达NVIDIA整机柜计算平台。作为全球领先的关键数字基础设施及连续性解决方案提供商,维谛(Vertiv,NYSE
    的头像 发表于 05-22 14:18 1281次阅读
    维谛加速推进人工智能<b class='flag-5'>基础设施</b>演进,<b class='flag-5'>助力</b><b class='flag-5'>NVIDIA</b> 800 VDC 电源架构发布

    华为云黄瑾:昇腾云CloudMatrix 384节点六大科技创新,定义下一代AI基础设施

    难以支撑 AI 技术的代际跃迁,节点架构的诞生不仅是技术的突破,更是以工程化创新开辟 AI 产业的新路径。华为云 CloudMatrix 384 节点具备 MoE 亲和、以网强
    的头像 发表于 05-17 10:31 5114次阅读