0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

选择GPU服务器需要考虑哪些情况如何才能提升GPU存储性能

Wildesbeast 来源:网络整理 作者:佚名 2021-02-08 17:37 次阅读

GPU是我们常用器件,采用GPU,才使得图形显示成为可能。在上期文章中,小编对GPU的加速原理等知识有所阐述。为增进大家对GPU的认识,本文将基于两点介绍GPU:1.选择GPU服务器需要考虑哪些情况,2.如何提升GPU存储性能。如果你对GPU具有兴趣,不妨继续往下阅读哦。

一、如何选择GPU服务器

当GPU型号选定后,再考虑用什么样GPU的服务器。这时我们需要考虑以下几种情况:

第一、在边缘服务器上需要根据量来选择T4或者P4等相应的服务器,同时也要考虑服务器的使用场景,比如火车站卡口、机场卡口或者公安卡口等;在中心端做Inference时可能需要V100的服务器,需要考虑吞吐量以及使用场景、数量等。

第二、需要考虑客户本身使用人群和IT运维能力,对于BAT这类大公司来说,他们自己的运营能力比较强,这时会选择通用的PCI-e服务器;而对于一些IT运维能力不那么强的客户,他们更关注数字以及数据标注等,我们称这类人为数据科学家,选择GPU服务器的标准也会有所不同。

第三、需要考虑配套软件和服务的价值。

第四、要考虑整体GPU集群系统的成熟程度以及工程效率,比如像DGX这种GPU一体化的超级计算机,它有非常成熟的从底端的操作系统驱动Docker到其他部分都是固定且优化过的,这时效率就比较高。

二、如何提升GPU存储性能

要获得最佳的GPU存储性能,就需要根据业务目标对基础架构进行微调。这里有三种方法可供考虑。

1.大规模调整性能

AI部署的快速增长和ML训练数据集的大小增加了计算基础架构的负担,STFC(The Science and Technology Facilities Council )则是这种典型的代表。尽管STFC已添加了高端GPU服务器以提供更高的计算支持,但STFC缺乏在数百个Researchers 中扩展资源所需的企业级存储功能。

通过在具有RDMA功能的高速网络(例如Infiniband或融合以太网(RoCE)v2上的RDMA)上实现NVMe-over-Fabrics协议,大型AI / ML用户组(例如STFC)可以虚拟化NVMe SSD在各种服务器上未使用的存储资源池,因此它们的性能就像在本地一样。通过这样做,可以在一个小时内完成机器学习培训任务,而以前则需要三到四天。即使具有复杂的模型训练任务,GPU存储也不再是瓶颈。

2.在并行文件系统下使用NVMe池化存储

当AI和ML应用程序涉及从许多GPU服务器访问大量小文件时,作为存储基础架构就必须部署并行分布式文件系统。并行文件系统还使存储更容易实现大多数AI / ML使用所需的高吞吐量和低延迟。在并行文件系统下具有快速、灵活的池化NVMe存储,可以改善对元数据的处理,从而实现更高的读取性能和更低的延迟,从而提高GPU服务器的利用率。

例如,一家超大型技术提供商最近推出了一种AI解决方案,用于预估保险公司使用的车辆碰撞场景。为了开发应用程序背后的AI逻辑,应用程序工作流涉及培训模型,方法是摄取多达2000万个小文件数据集,其中每个文件大小在150-700 KB之间。数据提取通常每8小时以100万个文件的速度或者每个客户端每秒最多35,000个文件进行。

通过在并行分布式文件系统下使用池化NVMe存储方法,该技术提供商消除了它遇到的存储瓶颈,并将存储性能提高了3-4倍。

3.检查特定于GPU的“高速公路”

新的数据中心架构正在以统一的方式提高服务器、网络和存储的性能。一种类似的方法于2019年秋季首次亮相,它将来自多个供应商的基础架构元素与GPU优化的网络和存储进行集成,以在GPU内存和存储之间打开直接的数据通道,从而完全绕开CPU。这使数据能够在GPU、存储和网络设备提供的“开放高速公路”上进行传输,从而实现了对NVMe企业级卓越性能的无障碍访问。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4403

    浏览量

    126569
  • 服务器
    +关注

    关注

    12

    文章

    8088

    浏览量

    82433
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
收藏 人收藏

    评论

    相关推荐

    GPU

    ,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理(CPU)、图形处理(
    发表于 01-16 08:59

    RDSH高清媒体的使用需要GPU吗?

    RDSH VM是否可以使用多个GPU? - 如何计算每个用户所需的内存(以及所需的GPU)? - 每台服务器有多少用户? - 您推荐哪种GPU用于此类用途? -
    发表于 09-27 15:56

    可以在同一台服务器上混合使用不同的NVIDIA GPU

    拥有相同的(Dell R740xd)服务器是否可能(或甚至有意义):1. P40- 用于VMWare Horizo​​n VDI图形2. V100- 用于深度学习/ HPC开发或者是否需要/建议在
    发表于 10-10 16:11

    gpu服务器是干什么的_gpu服务器和普通服务器有什么区别

    从字面上里面,GPU服务器服务器当中的一种,GPU服务器跟其他服务器有什么区别ne?
    发表于 01-06 09:58 4.3w次阅读

    如何为深度学习选择 GPU 服务器?_目前哪里可以租用到GPU服务器?_gpu服务器出租价格

    众所周知,服务器是网络中的重要设备,要接受少至几十人、多至成千上万人的访问,因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。所以说CPU是计算机的“大脑”,是衡量服务器
    发表于 01-06 10:25 1.8w次阅读
    如何为深度学习<b class='flag-5'>选择</b> <b class='flag-5'>GPU</b> <b class='flag-5'>服务器</b>?_目前哪里可以租用到<b class='flag-5'>GPU</b><b class='flag-5'>服务器</b>?_<b class='flag-5'>gpu</b><b class='flag-5'>服务器</b>出租价格

    选择GPU服务器的基本原则有哪些

    在介绍选择GPU服务器的基本原则之前,先来跟大家介绍下常见的GPUGPU服务器
    的头像 发表于 02-24 13:29 2787次阅读

    GPU服务器到底是什么?GPU服务器与普通服务器到底有什么区别

    服务器具备很强的现实意义,我们每天都在无形中跟服务器打交道。针对用途不同,服务器可分为诸多类型。为增加大家对服务器的了解程度,本文将对GPU
    的头像 发表于 11-14 10:04 7098次阅读

    GPU服务器的详细介绍和工作原理说明

    服务器是基于GPU的应用于视频编解码、深度学习、科学计算等多种场景的快速、稳定、弹性的计算服务,我们提供和标准云服务器一致的管理方式。出色的图形处理能力和高
    的头像 发表于 11-28 10:01 6634次阅读

    GPU服务器处理性能和用例的说明

    能力。 一、GPU服务器处理性能和用例: 1、GPU 用例 虽然投资 GPU 服务器的原因过于广
    的头像 发表于 02-22 16:44 1458次阅读

    GPU服务器是什么

    GPU服务器呢,今天我们就一起了解一下。 GPU服务器,简单来说,GPU服务器是基于
    的头像 发表于 02-25 09:31 5233次阅读

    PyTorch教程23.5之选择服务器GPU

    电子发烧友网站提供《PyTorch教程23.5之选择服务器GPU.pdf》资料免费下载
    发表于 06-06 09:17 0次下载
    PyTorch教程23.5之<b class='flag-5'>选择</b><b class='flag-5'>服务器</b>和<b class='flag-5'>GPU</b>

    GPU服务器是什么?

    具体是什么呢?如何选择GPU服务器GPU服务器有什么作用? GPU加快计算能够提供不凡的应用
    的头像 发表于 08-01 18:03 580次阅读

    gpu服务器是干什么的 gpu服务器与cpu服务器的区别

     相比于传统的CPU服务器GPU服务器支持同时计算大量相似的计算操作,可以实现更强的并行计算性能GPU
    的头像 发表于 12-02 17:20 1232次阅读

    超微gpu服务器评测

    随着科技的不断发展和进步,GPU服务器在大数据分析、深度学习、人工智能等领域正变得越来越重要。而超微GPU服务器因其出色的性能和高度定制化的
    的头像 发表于 01-10 10:37 408次阅读

    gpu服务器是干什么的 gpu服务器与cpu服务器的区别有哪些

    gpu服务器是干什么的 gpu服务器与cpu服务器的区别 GPU
    的头像 发表于 01-30 15:31 304次阅读