创作

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

多所大学采用NVIDIA系统和网络拓展研究工作

NVIDIA-Enterprise 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-11-18 09:45 次阅读

美国南方卫理公会大学使用 NVIDIA DGX SuperPOD 推动德克萨斯州北部地区进入 AI 时代;密西西比州立大学和德克萨斯农工大学准备使用 NVIDIA Quantum-2 网络;英国的一所大学则升级了其 InfiniBand 网络。

正如达拉斯/沃斯堡机场已成为全美旅行枢纽一样,南方卫理公会大学(SMU)将助力德克萨斯州北部地区在 AI 行业发展中处于领先地位。

南方卫理公会大学正在安装一台 NVIDIA DGX SuperPOD 超级计算机。该大学希望这台超级计算机为这个拥有 12000 多名学生和 2400 名教职员工的庞大社区推动机器学习项目的发展。

除了该大学之外,美国中南部还有两所大学也宣布计划使用 NVIDIA 技术以推动研究高速发展。

德克萨斯农工大学和密西西比州立大学均计划使用 NVIDIA 的 400 Gbit/s InfiniBand 网络平台,NVIDIA Quantum-2 将作为其最新高性能计算机的主干网。此外,英国的一台超级计算机刚刚升级了其 InfiniBand 网络。

德克萨斯州喜获 SuperPOD

提到今年早期在佛罗里达大学安装的另一个系统时,南方卫理公会大学首席信息官 Michael Hites 表示:“我们是美国第二所获得 DGX SuperPOD 系统的大学,它将助力本社区在使用 AI 技术推动学位课程,以及校企合作方面,均处于领先地位。”

9 月,一篇报导称,达拉斯地区因缺乏主要的 AI 研究而 “步履蹒跚”。巧合的是,报导登上当地报纸之时,也正是南方卫理公会大学敲定其 DGX SuperPOD 计划之日。

南方卫理公会大学在 3 月的一份计划预览报告中表示,AI 是 “数字化转型的核心……没有任何社会部门能够不受该技术的影响。AI 对 K-12 教育行业和劳动力发展具有巨大的改善潜力,这将有助于该地区经济的持续增长。”

一项 15 亿美元的筹款活动 —— SMU Ignite —— 于 9 月正式启动。SMU Ignite 将推动 AI 倡议,帮助南方卫理公会大学迈入全国顶级研究型大学的行列。该大学正在聘请一位首席创新官来协助指导此项工作。

打造一个计算炼金炉

南方卫理公会大学研究者 IT 支持团队主管 Jason Warner 表示,这项工作的核心是人才。因此,他为南方卫理公会大学福特研究与创新中心的一个新中心聘请了一批具有重大影响力的数据科学专家。Warner 将这座新中心称为南方卫理公会大学的 “计算炼金炉”。

这支团队由 Eric Godat 领导,他在南方卫理公会大学使用大型强子对撞机的数据为核结构建模,并因此获得了粒子物理学博士学位。

而今,他正协助南方卫理公会大学的学生了解 DGX SuperPOD 所带来的新机会。第一步,他邀请两名南方卫理公会大学的学生使用 NVIDIA Jetson 模块建造一个 DGX SuperPOD 的微型模型。

Godat 表示:“我们想让大家感受一下未来的工作会是什么样子的,尤其是那些没有做过 AI 方面工作的非技术领域人员。”

这台全尺寸超级计算机由建立在 NVIDIA Quantum InfiniBand 网络上的 20 个 NVIDIA DGX A100 系统组成。凭借其积木式的模块化结构,这台超级计算机最早可以在 1 月启动和运行。它将提供高达 100PFlops 的计算力,足以使其在全球最快超级计算机榜单 TOP500 上位居前列。

德克萨斯农工大学为其 ACES

使用 NVIDIA Quantum-2 InfiniBand 技术

位于南面约 200 英里的德克萨斯农工大学高性能计算中心,将成为首批接入 NVIDIA Quantum-2 InfiniBand 平台的机构之一。其 ACES 超级计算机由戴尔科技建造,将使用 400G InfiniBand 网络为研究者连接来自四家厂商的五个加速器。

NVIDIA Quantum-2 确保 “在 ACES 上单项工作即可以扩展到所有计算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它还具有更低的总拥有成本、更强大的网络计算功能和更高的扩展性 ”,ACES 首席研究员兼项目总监 Honggao Liu 表示。

德克萨斯农工大学已经为研究者提供了四套加速计算系统,这四套系统包含 600 多个 NVIDIA A100 Tensor Core 和上一代 GPU,其中两个系统使用了较早版本的 NVIDIA InfiniBand 技术。

密西西比州立大学乘上 400G 网速列车

密西西比州立大学也将使用 NVIDIA Quantum-2 InfiniBand 平台。它是构建 Orion 新系统的首选网络,Orion 是密西西比州立大学管理的四个集群中最大的一个集群,这四个集群全部使用较早版本的 InfiniBand 网络所构建。

Orion 和新系统均由美国国家海洋和大气管理局 (NOAA) 所资助,由戴尔科技建造。Orion 和新系统将承担 NOAA 的工作任务,以及密西西比州立大学的各项研究课题。

Orion 在 2019 年 6 月首次登上 TOP500 榜单,并被列为美国第四大学术超级计算机。

密西西比州立大学高性能计算总监 Trey Breckenridge 表示:“我们在密西西比州立大学的四代超级计算机中都使用了 InfiniBand,所以我们知道它既强大又成熟,可以可靠地运行我们需要的大型工作。”

他补充道:“我们正在添加一套使用 NVIDIA Quantum-2 的新系统,以保持在高性能计算领域的领先优势。”

Quantum 在英国掀起风潮

在大洋彼岸的英国,莱斯特大学的数据密集型超级计算机 —— DIaL 系统 —— 已经升级到 200G 版本的 NVIDIA Quantum InfiniBand。

莱斯特大学理论天体物理学教授兼高性能计算中心总监 Mark Wilkinson 表示:“ DIaL专为解决复杂的数据密集型问题而设计,我们需要解决这些问题,才能推进对周围宇宙的理解。”

“这些专业应用对带宽和延迟的要求都是前所未有的,只有 InfiniBand 能够满足要求,使研究工作有效开展。”

DIaL 是英国 DiRAC 设施中使用 InfiniBand 的四台超级计算机之一,另外还包括爱丁堡大学的 Tursa 系统。

InfiniBand 在技术评估上表现出色

在一次技术评估中,研究人员发现与使用另一种互连方式的纯 CPU 系统 Tesseract 相比,在由 Quantum 网络和 NVIDIA GPU 加速器构建的 Tursa 系统上运行应用性能可达 5 倍提升。

基准应用测试显示,Tursa 系统上 16 个节点的性能是 Tesseract 系统上 512 个节点性能的两倍。Tursa 系统的每个节点提供 10 TFlops 计算性能,使用 90% 的网络带宽,每千瓦性能相比 Tesseract 有显著的提高。

这也说明了为什么世界上大多数 TOP500 系统都在使用 NVIDIA 的技术。

编辑:jq

原文标题:SC21 | 多所大学采用 NVIDIA 系统和网络拓展研究工作

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    端侧AI增长空间巨大,更易用的芯片平台、移植工具链是加速落地的关键!

    电子发烧友网报道(文/李弯弯)随着端侧AI芯片逐渐成熟,视觉AI应用正在加速向千行百业渗透,包括智能....
    的头像 Carol Li 发表于 05-17 00:04 309次 阅读
    端侧AI增长空间巨大,更易用的芯片平台、移植工具链是加速落地的关键!

    城实验室正在努力研制“鹏城云脑Ⅲ”

    近日 “鹏城云脑Ⅱ”重大科技基础设施项目——“AI集群软硬件系统”的技术验收与成果评价会在深圳举行。....
    的头像 华为计算 发表于 05-16 18:00 235次 阅读

    你对CPU这些隐藏指令怎么看?

    平常我们谈论网络安全问题的时候,大多数时候都是在软件层面。谈应用程序的漏洞、后端服务的漏洞、第三方开....
    的头像 Linux爱好者 发表于 05-16 15:54 248次 阅读

    Zenotech公司使用NVIDIA GPU对风电场进行模拟

    一家英国公司使用 NVIDIA GPU 对风电场进行详细的模拟,为自己、为客户以及未来的净零排放开辟....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-16 15:29 197次 阅读

    贸泽开售用于健身跟踪的Bosch BHI260AP自学习AI智能传感器

    2022年5月16日 – 专注于推动行业创新的知名新品引入 (NPI) 分销商™贸泽电子 (Mous....
    的头像 21克888 发表于 05-16 14:11 360次 阅读
    贸泽开售用于健身跟踪的Bosch BHI260AP自学习AI智能传感器

    派CT最新Dubhewer软件满足医生诊疗需求

    派CT自上线以来,得到行业的广泛关注和赞赏,其搭载的多项全球首创技术备受瞩目,配套的Dubhewer....
    的头像 科技绿洲 发表于 05-16 11:34 199次 阅读

    Snapdragon Ride平台助力打造更安全便捷驾乘体验

    Snapdragon Ride平台基于一系列不同的骁龙汽车SoC和加速器建立,采用了可扩展且模块化的....
    的头像 科技绿洲 发表于 05-16 10:22 254次 阅读

    KubeDL基于Kubernetes的AI工作负载管理框架

    ./oschina_soft/kubedl.zip
    发表于 05-16 10:16 3次 阅读
    KubeDL基于Kubernetes的AI工作负载管理框架

    访问服务器快慢的因素是什么

    我们在租用服务器的过程中,可能在访问速度方面,会受到某些因素影响,如果您要进行此项业务,进行一些简单....
    发表于 05-16 10:08 4次 阅读

    使用Transformers的企业数据挑战解决方案

      NeMo 是用于培训 对话人工智能 模型的框架。在 NeMo 存储库内的 released co....
    的头像 星星科技指导员 发表于 05-16 09:29 91次 阅读
    使用Transformers的企业数据挑战解决方案

    使用NVIDIA A30 GPU加速AI推理工作负载

      A30 旨在通过提供四个视频解码器、一个 JPEG 解码器和一个光流解码器来加速智能视频分析( ....
    的头像 星星科技指导员 发表于 05-16 09:25 126次 阅读
    使用NVIDIA A30 GPU加速AI推理工作负载

    NVIDIA 开源GPU内核模块将集成到未来的驱动程序版本中

      可以通过 GitHub 存储库问题跟踪器 或我们现有的 最终用户支持论坛 报告问题。请通过 Gi....
    的头像 星星科技指导员 发表于 05-16 09:20 104次 阅读
    NVIDIA 开源GPU内核模块将集成到未来的驱动程序版本中

    AI发展的“奇点” 从AI数羊到“相牛” 人工智能应用如何低门槛化?

    近日,热搜上AI数羊的新闻吸引了一大波网友的关注与讨论。新闻中甘肃牧民运用AI技术来数羊,让人倍感惊....
    的头像 脑极体 发表于 05-16 09:13 246次 阅读

    思岚方舱内机器人多机协作提升运营效率

    智能机器人由于“无接触”式服务,不惧怕传染,可24h在线运营等特点,正在成为科技抗疫中不可或缺的重要....
    的头像 科技绿洲 发表于 05-15 17:29 339次 阅读

    如何使用STM32G4 32位MCU系列

      能够使用相同的 MCU 驱动电机并为预测性维护系统运行 AI,同时更具成本效益、鲁棒性和紧凑性。....
    的头像 星星科技指导员 发表于 05-15 17:23 312次 阅读

    深兰神秘新品重磅发布 三款AI清扫机器人齐亮相

    今后,深兰将继续秉承“人工智能,服务民生”发展理念,与全球更多优秀的合作伙伴携手,积极探索优势资源共....
    的头像 科技绿洲 发表于 05-15 14:34 376次 阅读

    爱立信全球公用事业创新中心正式投入使用

    爱立信合作伙伴还可以在这个环境中进行共同创造,而公用事业公司可以复制他们的端到端用例。全球公用事业创....
    的头像 科技绿洲 发表于 05-15 11:26 322次 阅读

    地平线AI开发平台高效助力智能驾驶软件差异化开发与应用

    2022年5月13日,地平线获得一汽红旗全新车型项目应用。一汽红旗将采用多颗征程5芯片打造智能驾驶域....
    的头像 科技绿洲 发表于 05-15 11:23 613次 阅读

    华为联合全产业开发者共同打造行业昇腾AI解决方案

    本届大赛,由全国各昇腾生态创新中心与华为联合AITISA联盟、启智社区共同举办,并提供超1000万的....
    的头像 科技绿洲 发表于 05-15 10:51 391次 阅读

    GROMACS使用英特尔oneAPI跨架构工具进行优化

    GROMACS凭借英特尔oneAPI开放的编程和多架构工具进行加速,并在基于英特尔Xe 架构的GPU....
    的头像 英特尔中国 发表于 05-14 10:56 295次 阅读

    星环科技Sophon AutoCV助力视觉AI工业化生产

    针对传统CV应用业务痛点,星环科技推出一站式模型生产应用平台——Sophon AutoCV。Soph....
    的头像 科技绿洲 发表于 05-13 17:24 303次 阅读

    使用NVIDIA RTX分支优化光线追踪图形

      RTXGI 提供了可扩展的解决方案来计算无限多跳照明和软阴影遮挡,而无需烘焙时间、光泄漏或昂贵的....
    的头像 星星科技指导员 发表于 05-13 17:17 271次 阅读

    NVIDIA TensorRT支持矩阵中的流控制结构层部分

      NVIDIA TensorRT 支持循环结构,这对于循环网络很有用。 TensorRT 循环支持....
    的头像 星星科技指导员 发表于 05-13 16:57 189次 阅读

    TensorRT中的自定义层满足模型的特定需求

    NVIDIA TensorRT 支持多种类型的层,其功能不断扩展;但是,在某些情况下,支持的层不能满....
    的头像 星星科技指导员 发表于 05-13 16:50 226次 阅读
    TensorRT中的自定义层满足模型的特定需求

    TensorRT是如何进行工作的

      TensorRT builder 使用时间来找到最快的内核来实现给定的运算符。时序内核会受到噪声....
    的头像 星星科技指导员 发表于 05-13 16:11 159次 阅读

    CPU的操作系统即调用OB85

    OB85_EV_CLASS BYTE 事件等级和标识符:B#16#35B#1....
    的头像 机器人及PLC自动化应用 发表于 05-13 15:58 516次 阅读

    TensorRT的C++接口解析

    CUDA 上下文会在 TensorRT 第一次调用 CUDA 时自动创建,如果在该点之前不存在。通常....
    的头像 星星科技指导员 发表于 05-13 15:41 100次 阅读

    TensorRT的功能与应用分析

      Polygraphy 是一个工具包,旨在帮助在 TensorRT 和其他框架中运行和调试深度学习....
    的头像 星星科技指导员 发表于 05-13 15:37 91次 阅读

    Cumulus Linux操作系统实现数据中心操作的DevOps方法

      使用 NVIDIA Air 应该足以帮助您测试和验证迁移。但是,我们强烈建议您与 NVIDIA ....
    的头像 星星科技指导员 发表于 05-13 15:30 99次 阅读

    RT-Thread CPU利用率的统计与测试步骤

    1 CPU利用率统计 全速运行:不响应中断,也不去执行其他任务,就单纯让它在一个地方持续运行一段时间,这个值可以体现CPU...
    发表于 05-13 15:27 1361次 阅读
    RT-Thread CPU利用率的统计与测试步骤

    加速逆光刻技术克服逻辑和铸造生产环境挑战

      毫无疑问,曲线 ILT 掩模设计为电路设计师提供了更大的自由度和创造力,以创建性能更好的电路,同....
    的头像 星星科技指导员 发表于 05-13 15:25 75次 阅读
    加速逆光刻技术克服逻辑和铸造生产环境挑战

    NVIDIA DOCA 1.3增强网络和安全基础设施服务

      NVIDIA DOCA 通过提供行业标准的开放 API 和框架,以及对 NVIDIA DOCA ....
    的头像 星星科技指导员 发表于 05-13 15:07 69次 阅读

    联想新款笔记本搭载AMD R7 6800HS型号

      据消息,联想新款笔记本现身Geekbench,搭载了AMD最新的R7 6800HS型号,还是Cr....
    的头像 牵手一起梦 发表于 05-13 11:40 326次 阅读

    NVIDIA Omniverse在动画制作中的应用

    介绍使用 NVIDIA Omniverse 3D 模拟和协作平台推动艺术或设计流程的个人创作者和开发....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 11:28 162次 阅读

    利用NVIDIA GPU解析哈勃天文望远镜的大数据

    太阳系外的行星是什么样的?研究人员使用配备 NVIDIA GPU 的超级计算机,从哈勃望远镜的数据中....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 11:24 176次 阅读

    基于NVIDIA DGX A100 80GB的生物计算引擎

    百图生科(BioMap)是一家生物计算驱动的生命科学平台公司,致力于将先进 AI 技术与前沿生物技术....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 11:17 169次 阅读

    面向临床及科研的医学图像AI开发平台Strix

    上海市磁共振重点实验室(Shanghai Key Laboratory of Magnetic Re....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 11:11 132次 阅读

    物件检测进行模型训练的详细步骤

    TAO 工具提供提供 QAT (Quantize Aware Training) 量化感知的训练模式....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 10:57 74次 阅读

    如何使用NVIDIA Isaac平台和TAO框架解决数据挑战和模型创建挑战

    从制造汽车到帮助外科医生和送披萨,机器人不仅逐渐自动化,而且将完成任务的速度提高了许多倍。随着人工智....
    的头像 NVIDIA英伟达企业解决方案 发表于 05-13 10:48 141次 阅读

    渊亭科技宣布完成亿元人民币B轮融资

    近日,认知决策智能先行者与领导者渊亭科技完成了亿元人民币B轮融资,由达晨财智独家投资。本轮资金将主要....
    的头像 科技绿洲 发表于 05-13 10:48 194次 阅读

    利用NVIDIA Triton推理服务器加速语音识别的速度

    网易互娱 AI Lab 的研发人员,基于 Wenet 语音识别工具进行优化和创新,利用 NVIDIA....
    的头像 NVIDIA英伟达 发表于 05-13 10:40 130次 阅读

    ARMv8的函数调用栈是什么意思?调用栈的内存管理是怎样的

    调用栈解析概念:        任意体系结构的CPU,都设计了一套通用寄存器、状态寄存器及其他控制寄存器,用...
    发表于 05-13 10:36 2657次 阅读

    对话式AI的概念、工作原理及应用领域

    对话式 AI 是一种综合运用多种技术的复杂的人工智能形式,能够使人机间实现类似于真人的交互。复杂系统....
    的头像 NVIDIA英伟达 发表于 05-13 10:31 99次 阅读

    卷积神经网络基础知识科普

    卷积神经网络是一种深度学习网络,主要用于识别图像和对其进行分类,以及识别图像中的对象。
    的头像 NVIDIA英伟达 发表于 05-13 10:26 209次 阅读

    深蓝科技响应号召,复工复产的同时积极开拓海外市场

    作为长三角中心城市,上海正在做好防疫的前提下有序恢复生产,近日,上海经信委发布《上海市工业企业复工复....
    的头像 海阔天空的专栏 发表于 05-12 17:40 337次 阅读

    CPU缓存一致性协议MESI详解

    CPU在摩尔定律的指导下以每18个月翻一番的速度在发展,然而内存和硬盘的发展速度远远不及CPU。这就....
    的头像 Linux内核补给站 发表于 05-12 17:36 285次 阅读
    CPU缓存一致性协议MESI详解

    星环科技推企业级AI能力运营平台Sophon MLOps 助推AI模型落地

    为解决AI落地难的问题,星环科技的AI团队从用户需求端出发,倾力研发了一款基于云原生架构的企业级AI....
    的头像 科技绿洲 发表于 05-12 17:17 268次 阅读

    商汤用AI构筑智慧底座 为一座座城市筑起科技防线

    为更好地服务疫情防控,提升方舱运营和综合管理工作效率,优化病患服务体验。商汤用AI构筑智慧底座,7天....
    的头像 科技绿洲 发表于 05-12 17:01 884次 阅读

    NVIDIA DOCA软件框架为开发人员提供开放生态系统

    NVIDIA DOCA 软件框架提供了一个全面、开放的开发平台,以加速 NVIDIA BlueFie....
    的头像 科技绿洲 发表于 05-12 16:31 292次 阅读

    导致ARM内存屏障的原因究竟有哪些

    程序在执行时的实际内存访问顺序和程序代码编写的访问顺序不一致,会导致内存乱序访问。 编译时,编译器优化导致内存乱序访问;...
    发表于 05-09 09:32 2765次 阅读

    RK3399 Android调试笔记之CPU_B_SLEEP引脚改动设计

    Platform: RK3399 OS: Android 7.1 Kernel: v4.4.83 朋友按照参考设计和firefly的板子做的硬件,无法开机。 一开始只...
    发表于 05-07 15:41 1689次 阅读

    有哪几种方式可以去实现rk3288的CPU定频呢

    平台环境:rk3288、android5.1、kernel3.10.0 1、CPU定频终端手动实现 #cd /sys/devices/system/cpu/cpu0/cpufreq 查看CP...
    发表于 05-06 11:25 2290次 阅读

    AMP裸机使用两个CPU跑不同的应用程序并进行交互

    1,搭建工程(BD) 这里只使用了uart,后面用到了SD卡。因此这里只需要将这两个勾选。设定好DDR3的类型,去掉PL端的时...
    发表于 05-06 10:30 2209次 阅读

    基于cortex-m3的rt-thread系统如何实现线程上下文切换呢

    线程上下文切换等功能,一般采用汇编格式编写,不同cpu架构实现方式肯定不同,为了使rt-thread系统能够在不同的CPU架构上都能...
    发表于 05-05 15:00 1227次 阅读

    RT-Thread SMP介绍与移植资料分享

    1、如何移植 RT-Thread SMP系统上电后,每个 CPU 都会在 ROM 中的代码控制下独自运行,但是只有主处理器(以下简称 ...
    发表于 04-27 14:38 1292次 阅读

    如何完成RT-Thread的内核移植

    1、CPU 架构移植在嵌入式领域有多种不同 CPU 架构,例如 Cortex-M、ARM920T、MIPS32、RISC-V 等等。为了使...
    发表于 04-27 14:23 1272次 阅读

    【rtthread学习笔记系列】第五篇:内存分配的概念

    一、内存分配概念 计算机系统中,变量存放在ram中,只有在使用时才将它调入cpu运行,rtthread提供了两类内存分配方法: 动态内...
    发表于 04-22 14:10 2080次 阅读

    TMS320VC5501 定点数字信号处理器

    TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
    发表于 10-09 14:55 481次 阅读
    TMS320VC5501 定点数字信号处理器