0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Quantum-2 InfiniBand 平台助力杜伦大学创新和改进超算基础设施

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-12-23 16:17 次阅读

NVIDIA 推出 “AI 改变行业未来” 系列文章,邀你一起见证科技力量。本周带来第七期 “AI 改变行业未来” 之高等教育和研究。

高等教育机构处在重大全球挑战的前沿,负责培养 AI、加速计算和数据科学领域的创新者。同时,各大机构需要满足人们对更灵活,更易获取的教育方案的需求。从本地到云,NVIDIA 提供的工具可随时随地推动重要学科的探索发现。

扩展基础设施

借助集中式基础设施和优秀的计算能力,处理大型工作负载、提高效率并降低运营成本。

推动创新

使用加速探索、实验和部署的工具,扫清发现道路上的障碍。研究人员可以借助由 GPU 加速的 AI 和高性能计算 (HPC),运用建模、模拟和实验数据来解决艰难挑战。

强化学习

让学生掌握关键的 AI 和高性能计算技能,促进其职业发展。为教育机构提供培训和基础设施解决方案,促进新一代的研究。

虚拟GPU加速印第安纳州课堂

印第安纳大学(IU)正在建造两台 AI 超级计算机,它们共装有 616 个 A100 GPU。由慧与建造的 Big Red 200 将为印第安纳大学的九个校区提供服务。由戴尔科技建造的 Jetstream-2 将为康奈尔大学,及夏威夷大学等多家合作机构的工作提供支持。

A100 能够将处理器的处理性能分成多个部分,使得 Jetstream-2 能够承载数百名学生同时参加的课程,每名学生都能使用一部分 GPU 性能来学习流行的图像分类等 AI 技能。印第安纳大学的一名研究人员在去年11月提交了一篇论文,描述了对该虚拟 GPU 功能所进行的基准测试。

目前超过 2500 名学生使用印第安纳大学目前的 GPU 加速系统。去年,该大学创纪录的 10 亿美元研究合同和拨款分布在 178 个学院,其中超过 40%的工作由这些系统运行。

印第安纳大学普适技术研究所首席运营官、AI-for-everyone 计划负责人 Winona Snapp-Childs 表示:“资助机构意识到机器学习在 AI,加速计算等学术领域的重要性有助于推动科学发展。我可以想象,在未来的 5 到 10 年内,可能近一半的研究都将用到这些技术,它们将变得无处不在,并成为学术研究中必不可少的技术。”

密西西比州立大学乘上 400G 网速列车

密西西比州立大学将使用 NVIDIA Quantum-2 InfiniBand 平台。它是构建 Orion 新系统的首选网络,Orion 是密西西比州立大学管理的四个集群中最大的一个集群,这四个集群全部使用较早版本的 InfiniBand 网络所构建。

Orion 和新系统均由美国国家海洋和大气管理局 (NOAA) 所资助,由戴尔科技建造。Orion 和新系统将承担 NOAA 的工作任务,以及密西西比州立大学的各项研究课题。Orion 在 2019 年 6 月首次登上 TOP500 榜单,并被列为美国第四大学术超级计算机。

密西西比州立大学高性能计算总监 Trey Breckenridge 表示:“我们在密西西比州立大学的四代超级计算机中都使用了 InfiniBand,所以我们知道它既强大又成熟,可以可靠地运行我们需要的大型工作。”

DPU 助力杜伦大学创新和改进超算基础设施

杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

原文标题:AI 改变行业未来: 加速高等教育和研究领域新发现

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101719
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126705
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264061

原文标题:AI 改变行业未来: 加速高等教育和研究领域新发现

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    DPU技术赋能下一代AI算力基础设施

    4月19日,在以“重构世界 奔赴未来”为主题的2024中国生成式AI大会上,中科驭数作为DPU新型算力基础设施代表,受邀出席了中国智算中心创新论坛,发表了题为《以网络为中心的AI算力底座构建之路》主题演讲,勾勒出在通往AGI之路上,DPU技术赋能下一代AI算力
    的头像 发表于 04-20 11:31 385次阅读

    垂直起降机场:飞行基础设施的未来是绿色的

    电动垂直起降(eVTOL)飞机的日益发展为建立一个新的网络来支持它们提供了理由,这将推动开发绿色基础设施新模式的机会。这些电气化的“短途”客运和货运飞机通常被描述为飞行汽车,是区域飞行和城市出租车
    发表于 03-25 06:59

    NVIDIA发布专为大规模AI量身订制的全新网络交换机-X800系列

    NVIDIA Quantum-X800 InfiniBand 网络和 NVIDIA Spectrum™-X800 以太网络是全球首批高达 800Gb/s 端到端吞吐量的网络
    的头像 发表于 03-20 09:54 228次阅读

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA Quantum-X800 InfiniBand 网络,打造性能最强大的 AI 专用基础设施 NVIDIA Spectrum-X
    发表于 03-19 10:05 115次阅读
    <b class='flag-5'>NVIDIA</b> 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI <b class='flag-5'>基础设施</b>

    高通推出面向5G基础设施的智能计算解决方案

    开放式、虚拟化无线接入网络(开放式vRAN)正迎来商用设计和部署的强劲发展势头,智能计算创新和AI对5G基础设施的重要性也在快速增加。作为通信和AI技术的领军企业,高通技术公司一直处于行业前沿推动现代5G网络的未来发展。
    的头像 发表于 02-21 09:11 262次阅读

    以太网or非以太网?各家AI/ML网络技术盘点

    Nvidia 的 GPU 及其全栈 AI/ML 解决方案使其成为市场中无可争议的上流玩家。 Nvidia DGX Cloud 解决方案将 Quantum-2 (25.6Tbs) InfiniB
    发表于 12-13 14:46 361次阅读
    以太网or非以太网?各家AI/ML网络技术盘点

    充电桩收费运营云平台:充电基础设施的智能化革新

    随着新能源汽车的普及,充电基础设施的建设和管理显得尤为重要。为了满足市场需求,提高充电设施的运营效率和服务质量,公司推出了一款充电桩收费运营云平台,为充电设施的智能化管理提供了解决方案
    的头像 发表于 11-06 14:54 417次阅读
    充电桩收费运营云<b class='flag-5'>平台</b>:充电<b class='flag-5'>基础设施</b>的智能化革新

    NVIDIA 校招 | 基础设施部门正在热招!

    时代带来了新动力 - GPU 在能够感知和理解世界的计算机、机器人和自动驾驶汽车中发挥着大脑的作用。 NVIDIA 成功的一个核心因素是我们拥有 GPU / SoC 开发所需要的先进的基础设施和完整
    的头像 发表于 10-26 09:05 281次阅读
    <b class='flag-5'>NVIDIA</b> 校招 | <b class='flag-5'>基础设施</b>部门正在热招!

    Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

    生成式 AI 和大语言模型(LLM)不断推动突破性创新,训练和推理对算力的需求也随之急剧上升。 这些现代生成式 AI 应用需要全栈加速计算,首先要有能够快速、准确处理大量工作负载的先进基础设施
    的头像 发表于 09-25 20:40 288次阅读
    Oracle 云<b class='flag-5'>基础设施</b>提供新的 <b class='flag-5'>NVIDIA</b> GPU 加速计算实例

    英伟达Quantum-2 Infiniband平台技术

    Quantum-2采用最新一代NVIDIA Mellanox HDR 200Gb/s Infiniband网络适配器,支持高速数据传输和低延迟计算。结合NVIDIA GPU,实现加速计
    的头像 发表于 07-18 16:02 2686次阅读
    英伟达<b class='flag-5'>Quantum-2</b> <b class='flag-5'>Infiniband</b><b class='flag-5'>平台</b>技术

    Acrel-EIoT能源物联网平台助力 电网基础设施智能化改造和智能微电网建设

    部等8部门共同印发《物联网新型基础设施建设三年行动计划(2021-2023年)》。     Acrel-EIoT能源物联网平台加速电网基础设施智能化改造和智能微电网建设,部署区域能源管理、智能计量体系、综合能源服务等典型应用系统
    的头像 发表于 06-05 09:59 684次阅读
    Acrel-EIoT能源物联网<b class='flag-5'>平台</b><b class='flag-5'>助力</b> 电网<b class='flag-5'>基础设施</b>智能化改造和智能微电网建设

    基于云解决方案的基础设施

    我们的团队可以帮助您选择正确的平台,并迁移您的服务器、数据库和应用程序。基于云解决方案的基础设施有助于最大的企业和增长最快的初创企业变得更加敏捷,并降低成本。
    的头像 发表于 05-30 09:13 271次阅读

    算力基础设施关键技术

    。 云原生是在云上构建、运行、管理应用程序的一套技术体系和管理方法,依托微服务架构、敏捷基础设施平台服务和高效研发运维模式,简化云上业务开发管理难度,构建敏捷健 壮的业务系统。云原生技术及理念可促进云的敏捷构
    发表于 05-24 16:38 7次下载
    算力<b class='flag-5'>基础设施</b>关键技术

    华为举办2023创新数据基础设施论坛,加速全球数据生产力跃升

    等,深入探讨数据基础设施建设发展方向。会上,华为全面阐述了拥抱新兴应用生态、高效处理海量非结构化数据、全面提升数据韧性等数据存储产业演进方向,助力企业释放数据价值。 打造“创新数据基础设施
    的头像 发表于 05-24 01:45 447次阅读

    国常会提出“适度超前建设充电基础设施

    5月5日,国常会提出,要聚焦制约新能源汽车下乡的突出瓶颈,适度超前建设充电基础设施创新充电基础设施建设、运营、维护模式。
    的头像 发表于 05-08 15:45 773次阅读
    国常会提出“适度超前建设充电<b class='flag-5'>基础设施</b>”