0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA GPU和联想助力学校部署应用基础架构

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-13 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

案例简介

• 江西师范大学数字产业学院,利用搭载了NVIDIA V100和 T4 Tensor Core GPU的联想ThinkSystem SR650和SR670服务器高性能计算集群,帮助学生和教师开展深度学习突破性研究。

• 本案例主要应用到NVIDIA Tesla V100 , NVIDIA T4 Tensor Core GPU ,NVIDIA RIVA平台、NVIDIA NEMO模型训练平台。

客户简介及应用背景

江西师范大学数字产业学院是江西省的第一所数字产业学院,学院于2021年成立,专注于计算机科学与技术、人工智能、大数据、物联网及动画等领域的教学和研究。

作为新成立的机构,江西师范大学数字产业学院计划从零开始构建一套行业顶尖的数字化基础架构,而这需要从设计并建立全新的数据中心开始。

客户挑战

“联想和NVIDIA在人工智能和传统高性能计算领域实力雄厚,在我们的评估中获得了最高的技术评分。”

——江西师范大学数字产业学院副院长

在为新的数据中心选择服务器和存储基础架构时,江西师范大学数字产业学院主要考虑两大需求。

首先,它需要一个强大的平台支持日常运营。该平台将运行学院的学生信息、图书馆、教室和校园系统,而且需要足够的灵活性和可扩展性,在学院不断发展壮大、招生人数增多的情况下实现快速扩展。

其次,它还需要一套强大的高性能计算基础架构,帮助教师和学生开展突破性科研工作。江西师范大学数字产业学院设立了多个和人工智能、深度学习相关的优势学科和科研项目。因此,找到一种不仅能够支持CPU密集型工作负载,同时还能支持GPU密集型工作负载的通用架构为教学和科研的必要的实验环境尤为重要。

由于学院可用于IT管理的资源非常有限,这两个平台都应当非常可靠且易于管理。此外,考虑到随着科研工作的逐步深入,数据量预计将迅速增加,强大的数据存储和数据保护功能必不可少。

应用方案

联想帮助江西师范大学数字产业学院设计并部署了一套基于两大主要解决方案的基础架构,这两套方案协同运行,能够对学院的运营系统和科研项目进行全面管理。“

首先,学院采用联想ThinkAgile AH超融合解决方案作为统一平台,支持日常行政管理、教学和科研管理等企业级应用。超融合的部署意味着学院可以根据需要随时添加计算和存储资源来支持业务增长。联想ThinkAgile AH还是为数不多能够支持异构设备扩容的超融合解决方案,以最大化的资源利用和灵活性充分保护学院的投资。

其次,利用联想ThinkSystem SR650和SR670服务器组成的高性能计算集群,学院搭建了一个可供各学科完成教学和科研工作的IT环境。这些服务器搭载了CPU和NVIDIA V100及T4 Tensor Core GPU。NVIDIA V100 GPU专门设计用于加速人工智能和高性能计算工作负载,可提供比传统CPU高32倍的训练吞吐量。

凭借4颗NVIDIA V100 GPU和18颗NVIDIA T4 Tensor Core GPU,联想高性能计算集群可交付出色的性能,满足深度学习和计算机视觉工作负载的苛刻要求。该系统可支持多种常见的深度学习框架(如Caffe和TensorFlow)以及容器技术。

与此同时,联想的LiCO 平台(Lenovo Intelligent Computing Orchestration)作为集群管理器,提供了一个简单且直观的操作界面,使集群资源对研究人员垂手可得,并帮助非技术用户消除复杂性。同时,联想LiCO平台能够实现细粒度资源监控,和CPU、GPU资源的灵活分配。

最后,学院通过联想ThinkSystem DM3000H和DE6000H存储系统以及DPA24000备份一体机,实现对核心数据的归档、备份和保护。这种并行文件系统还可帮助包括科研人员在内的所有用户进行统一的数据访问。

使用效果及影响

“我们的学生和导师非常期待使用联想和NVIDIA的高性能计算平台开展突破性科学研究。这将有助于我们推动城市的数字产业的发展,实现教育链、创新链、产业链的深度融合。”

——江西师范大学数字产业学院副院长

新平台就绪后,江西师范大学数字产业学院具备了所需的工具帮助教师和学生开展一流的科研工作。

通过轻松访问高性能计算工作负载所需的CPU和GPU资源,学院的学生和科研人员将能够有效地规划、实施和管理项目而不需要额外的技术帮助,进而减轻IT技术人员的负担。利用联想LiCO平台,只需简单点击鼠标就可以分配资源,部署深度学习应用和训练模型。技术和研究人员的时间和精力能够释放出来,帮助学院集中精力于学术工作,而不必被淹没在繁琐的部署、运营或系统维护任务中。

基于NVIDIA GPU的强大处理能力,可以很好的支持人工智能和深度学习研究项目。 用户友好的高性能计算集群管理,使学生和科研人员如虎添翼 。小维护工作量的基础架构,提供自动备份,可轻松扩展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 联想
    +关注

    关注

    3

    文章

    2720

    浏览量

    64454
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109050
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134420
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    Blackwell 架构 GPU 中的中端专业图形卡,高度仅为全高 GPU 的二分之一。如果您需要的是一块半高显卡,能适配小机箱,功耗不高,还要具备 AI 及光线追踪性能的话,那么 RTX PRO 2000 是很好的选择。
    的头像 发表于 11-28 09:39 3526次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理器紧密结合,以构建加速的量子超级计算机。
    的头像 发表于 11-03 14:53 473次阅读

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心将采用 NVIDIA 系统,包含数百万块 NVIDIA
    的头像 发表于 09-23 14:37 1199次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b>宣布达成合作,<b class='flag-5'>部署</b>10吉瓦<b class='flag-5'>NVIDIA</b>系统

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品
    的头像 发表于 08-28 11:02 2853次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 988次阅读

    Arm方案 基于Arm架构的边缘侧设备(树莓派或 NVIDIA Jetson Nano)上部署PyTorch模型

    本文将为你展示如何在树莓派或 NVIDIA Jetson Nano 等基于 Arm 架构的边缘侧设备上部署 PyTorch 模型。
    的头像 发表于 07-28 11:50 2481次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术演变进化,按照出版时间算是囊括了
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 1215次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    NVIDIA携手谷歌云助力企业引入代理式AI

    谷歌 Gemini 模型即将支持本地部署,可通过搭载 NVIDIA Blackwell 架构的基础设施,在 Google 分布式云上运行 NVIDIA 机密计算。
    的头像 发表于 04-11 16:32 900次阅读

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的 NVIDIA
    的头像 发表于 03-28 09:59 1069次阅读

    英伟达GTC2025亮点:NVIDIA认证计划扩展至企业存储领域,加速AI工厂部署

    全新的存储认证和参考架构让企业 IT 部门能更轻松地选择和部署 AI 基础设施,实现最优的性能和能效。 AI 部署的成功依靠速度、数据和规模。因此,NVIDIA 正在扩展
    的头像 发表于 03-21 19:38 1706次阅读

    NVIDIA Blackwell数据手册与NVIDIA Blackwell架构技术解析

    NVIDIA Blackwell数据手册与NVIDIA Blackwell 架构技术解析
    的头像 发表于 03-20 17:19 1686次阅读

    NVIDIA GPU助力科研人员探索外星世界

    NVIDIA GPU 驱动的深度学习在短短几秒内解读出了卡西尼号土星探测器多年来收集的海量数据,为科研人员探索外星世界提供了更加智能的方式。
    的头像 发表于 02-27 10:37 845次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1238次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    和不支持的NVIDIA GPU硬件,如支持的有L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型号被标记为弃用。同时提到GPU计算要求64位计算机架构
    发表于 12-16 14:25