0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

NVIDIA英伟达 来源:未知 2023-09-25 20:40 次阅读

生成式 AI 和大语言模型(LLM)不断推动突破性创新,训练和推理对算力的需求也随之急剧上升。

这些现代生成式 AI 应用需要全栈加速计算,首先要有能够快速、准确处理大量工作负载的先进基础设施。为了帮助满足这一需求,Oracle 云基础设施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU,同时 NVIDIA L40S GPU 也即将在 OCI Compute 上推出。

wKgaomUo-1mAfOR9AACyoa3iSyI779.png

OCI 上的 NVIDIA

H100 Tensor Core GPU 实例

OCI Compute 裸机实例配备了具有NVIDIA Hopper架构的 NVIDIA H100 GPU,不仅大幅提升了大规模 AI 和高性能计算的性能,也为各种工作负载提供了前所未有的性能、可扩展性和通用性。

相比于NVIDIA A100 Tensor Core GPU,使用 NVIDIA H100 GPU 的企业可提升 30 倍的 AI 推理性能和 4 倍的 AI 训练性能。H100 GPU 专为资源密集型计算任务构建,包括训练 LLM 和在运行 LLM 的同时进行推理等。

BM.GPU.H100.8 OCI Compute 机型配置(Shape)包含 8 颗 NVIDIA H100 GPU,每颗都具有 80GB 的 HBM2 GPU 内存。8 颗 GPU 之间的 3.2TB/s 双向带宽使每颗 GPU 都能通过 NVIDIA NVSwitchNVLink 4.0 技术与其他 7 颗 GPU 直接通信。该配置还包含 16 块容量为 3.84TB 的本地 NVMe 硬盘、112 个内核的第四代英特尔至强 CPU 处理器以及 2TB 系统内存。

简而言之,该机型配置针对企业最具挑战性的工作负载进行了优化。

根据工作负载的时间线和规模,OCI Supercluster 使企业能够通过高性能、超低延迟的网络,将所使用的 NVIDIA H100 GPU 从单个节点扩展到多达数万颗 H100 GPU。

OCI 上的 NVIDIA L40S GPU 实例

NVIDIA L40S GPU 基于 NVIDIA Ada Lovelace 架构构建而成,是一款数据中心的通用 GPU,可以为 LLM 推理和训练、视觉计算以及视频应用提供惊人的多负载加速。搭载 NVIDIA L40S GPU 的 OCI Compute 裸机实将于今年晚些时候推出抢先体验版本,并于 2024 年初全面上市。 这些实例将作为 NVIDIA H100 和 A100 GPU 实例的替代方案,用于处理中小型 AI 工作负载以及图形和视频计算任务。相比于 NVIDIA A100,NVIDIA L40S GPU 可将生成式 AI 工作负载的性能提升 20%,将微调 AI 模型方面的性能提升 70%。 BM.GPU.L40S.4 OCI Compute 机型配置包含 4 颗 NVIDIA L40S GPU,以及多达 112 个核的最新一代英特尔至强 CPU、1TB 系统内存、15.36TB 用于缓存数据的低延迟 NVMe 本地存储和 400GB/s 集群网络带宽。创建该实例的目的是应对从 LLM 训练、微调和推理一直到 NVIDIA Omniverse 工作负载以及工业数字化、3D 图形和渲染、视频转码和 FP32 HPC 等各种用例。

NVIDIA 与 OCI:企业级 AI

OCI 与 NVIDIA 的协作,将为各种规模的企业带来最先进的 NVIDIA H100 和 L40S GPU 加速基础设施,助力企业加入到这场生成式 AI 革命。仅访问 NVIDIA GPU 加速实例可能还不够。若要在 OCI Compute 上释放 NVIDIA GPU 的最大潜能,就必须拥有一个最好的软件层。NVIDIA AI Enterprise 通过专为底层 NVIDIA GPU 基础设施优化的开源容器和框架,简化了企业级加速 AI 软件的开发和部署,所有这一切都离不开支持服务的帮助。

如要了解更多信息,欢迎访问有关 Oracle 云基础设施(OCI)OCI ComputeOracle 如何迈向 AI 以及 NVIDIA AI Platform 网页。

Oracle 云基础设施(OCI):https://www.oracle.com/cloud/

OCI Compute:https://www.oracle.com/cloud/compute/

Oracle 如何迈向 AI:https://www.oracle.com/artificial-intelligence/

NVIDIA AI Platform:https://www.nvidia.cn/ai-data-science/

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息。

wKgaomUo-1qAVDoQAAFtccdApf0800.jpg


原文标题:Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87769

原文标题:Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于
    的头像 发表于 04-20 09:39 160次阅读

    垂直起降机场:飞行基础设施的未来是绿色的

    电动垂直起降(eVTOL)飞机的日益发展为建立一个新的网络来支持它们提供了理由,这将推动开发绿色基础设施新模式的机会。这些电气化的“短途”客运和货运飞机通常被描述为飞行汽车,是区域飞行和城市出租车
    发表于 03-25 06:59

    FPGA在深度学习应用中或将取代GPU

    基础设施,人们仍然没有定论。如果 Mipsology 成功完成了研究实验,许多正受 GPU 折磨的 AI 开发者将从中受益。 GPU 深度学习面临的挑战 三维图形是 GPU 拥有如此
    发表于 03-21 15:19

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    块 Blackwell GPU 连成一个整体,由NVIDIA 系统专家加速即时 AI 基础设施的部署       美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年
    发表于 03-19 10:56 106次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级<b class='flag-5'>计算</b>

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA Quantum-X800 InfiniBand 网络,打造性能最强大的 AI 专用基础设施 NVIDIA Spectrum-X800 以太网络,数据中心必备的优化 AI 网络
    发表于 03-19 10:05 115次阅读
    <b class='flag-5'>NVIDIA</b> 发布全新交换机,全面优化万亿参数级 <b class='flag-5'>GPU</b> <b class='flag-5'>计算</b>和 AI <b class='flag-5'>基础设施</b>

    《数据处理器:DPU编程入门》读书笔记

    、电信和存储等应用,并提升性能。 具备开放性集成功能,未来支持更多功能集成。 提供统一的面向各种应用的编程接口,让用户可以不用关注DPU的底层硬件接口而直接对硬件进行编程。 实现了业务与基础设施的操作分离,大幅降低了业务的长尾延时,对于实现安全的、裸性能的、云原生的下一代
    发表于 12-21 10:47

    亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

    计算机,用于 NVIDIA AI 研发和自定义模型开发。 搭载 NVIDIA GH200、H200、L40S 和 L4 GPU的全新亚马逊 EC2
    的头像 发表于 11-29 21:00 385次阅读
    亚马逊云科技与 <b class='flag-5'>NVIDIA</b> 宣布开展战略合作,为生成式 AI <b class='flag-5'>提供</b>全新超级<b class='flag-5'>计算</b>基础架构、软件和服务

    NVIDIA 为全球领先的 AI 计算平台 Hopper 再添新动力

    Tensor Core GPU 和领先的显存配置,可处理生成式 AI 与高性能计算工作负载的海量数据。   NVIDIA H200 是首款采用 HBM3e 的 GPU,其运行更快、更
    发表于 11-14 14:30 112次阅读
    <b class='flag-5'>NVIDIA</b> 为全球领先的 AI <b class='flag-5'>计算</b>平台 Hopper 再添新动力

    创新企业云福利:腾讯云 × NVIDIA 初创加速计划

    云 x NVIDIA 初创加速计划 助您降低产品使用门槛 高性能计算集 群 HCC 以高性能云服务器为节点,通过 RDMA 互联,大幅提升网络性能,提供高带宽和极低延迟的网络服务,能满
    的头像 发表于 11-13 20:40 381次阅读
    创新企业云福利:腾讯云 × <b class='flag-5'>NVIDIA</b> 初创<b class='flag-5'>加速</b>计划

    177倍加速NVIDIA最新开源 | GPU加速各种SDF建图!

    但最近,NVIDIA和ETHZ就联合提出了nvblox,是一个使用GPU加速SDF建图的库。计算速度非常快,相较CPU计算TSDF甚至快了1
    的头像 发表于 11-09 16:46 555次阅读
    177倍<b class='flag-5'>加速</b>!<b class='flag-5'>NVIDIA</b>最新开源 | <b class='flag-5'>GPU</b><b class='flag-5'>加速</b>各种SDF建图!

    NVIDIA 校招 | 基础设施部门正在热招!

    时代带来了新动力 - GPU 在能够感知和理解世界的计算机、机器人和自动驾驶汽车中发挥着大脑的作用。 NVIDIA 成功的一个核心因素是我们拥有 GPU / SoC 开发所需要的先进的
    的头像 发表于 10-26 09:05 279次阅读
    <b class='flag-5'>NVIDIA</b> 校招 | <b class='flag-5'>基础设施</b>部门正在热招!

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    ® BlueField® 系列 DPU以及搭建 NVIDIA DOCA™ 软件开发环境,并通过深入了解 NVIDIA DOCA™ 应用程序开发实例来掌握如何实现软件定义、硬件加速数据中
    发表于 10-24 15:21

    NVIDIA AI 现已在 Oracle Cloud Marketplace 推出

    云 AI 超级计算平台 和 NVIDIA AI Enterprise 软件现已在 Oracle Cloud Marketplace 推出。Oracle Cloud Infrastru
    的头像 发表于 10-24 10:30 238次阅读
    <b class='flag-5'>NVIDIA</b> AI 现已在 <b class='flag-5'>Oracle</b> Cloud Marketplace 推出

    Gaudi Training系统介绍

    ,这就转化为对训练系统高效扩展的日益增长的需求。 典型的深度学习训练算法包括多种类型的算子,这些算子加起来要进行数十亿次运算。这些大量的操作可以通过使用先进GPU提供的固有并行处理来加速。然而,
    发表于 08-04 06:48

    算力基础设施关键技术

    算力基础设施是算力网络的核心,以构建高效、灵活、敏捷的算力基础设施为目标,积极引入云原生、无服务器计算、异构计算、算力卸载等技术,探索算力原生、存算一体等新方向, 持续增强算力能力,释
    发表于 05-24 16:38 7次下载
    算力<b class='flag-5'>基础设施</b>关键技术