0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

NVIDIA英伟达 来源:未知 2023-09-25 20:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成式 AI 和大语言模型(LLM)不断推动突破性创新,训练和推理对算力的需求也随之急剧上升。

这些现代生成式 AI 应用需要全栈加速计算,首先要有能够快速、准确处理大量工作负载的先进基础设施。为了帮助满足这一需求,Oracle 云基础设施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU,同时 NVIDIA L40S GPU 也即将在 OCI Compute 上推出。

wKgaomUo-1mAfOR9AACyoa3iSyI779.png

OCI 上的 NVIDIA

H100 Tensor Core GPU 实例

OCI Compute 裸机实例配备了具有NVIDIA Hopper架构的 NVIDIA H100 GPU,不仅大幅提升了大规模 AI 和高性能计算的性能,也为各种工作负载提供了前所未有的性能、可扩展性和通用性。

相比于NVIDIA A100 Tensor Core GPU,使用 NVIDIA H100 GPU 的企业可提升 30 倍的 AI 推理性能和 4 倍的 AI 训练性能。H100 GPU 专为资源密集型计算任务构建,包括训练 LLM 和在运行 LLM 的同时进行推理等。

BM.GPU.H100.8 OCI Compute 机型配置(Shape)包含 8 颗 NVIDIA H100 GPU,每颗都具有 80GB 的 HBM2 GPU 内存。8 颗 GPU 之间的 3.2TB/s 双向带宽使每颗 GPU 都能通过 NVIDIA NVSwitchNVLink 4.0 技术与其他 7 颗 GPU 直接通信。该配置还包含 16 块容量为 3.84TB 的本地 NVMe 硬盘、112 个内核的第四代英特尔至强 CPU 处理器以及 2TB 系统内存。

简而言之,该机型配置针对企业最具挑战性的工作负载进行了优化。

根据工作负载的时间线和规模,OCI Supercluster 使企业能够通过高性能、超低延迟的网络,将所使用的 NVIDIA H100 GPU 从单个节点扩展到多达数万颗 H100 GPU。

OCI 上的 NVIDIA L40S GPU 实例

NVIDIA L40S GPU 基于 NVIDIA Ada Lovelace 架构构建而成,是一款数据中心的通用 GPU,可以为 LLM 推理和训练、视觉计算以及视频应用提供惊人的多负载加速。搭载 NVIDIA L40S GPU 的 OCI Compute 裸机实将于今年晚些时候推出抢先体验版本,并于 2024 年初全面上市。 这些实例将作为 NVIDIA H100 和 A100 GPU 实例的替代方案,用于处理中小型 AI 工作负载以及图形和视频计算任务。相比于 NVIDIA A100,NVIDIA L40S GPU 可将生成式 AI 工作负载的性能提升 20%,将微调 AI 模型方面的性能提升 70%。 BM.GPU.L40S.4 OCI Compute 机型配置包含 4 颗 NVIDIA L40S GPU,以及多达 112 个核的最新一代英特尔至强 CPU、1TB 系统内存、15.36TB 用于缓存数据的低延迟 NVMe 本地存储和 400GB/s 集群网络带宽。创建该实例的目的是应对从 LLM 训练、微调和推理一直到 NVIDIA Omniverse 工作负载以及工业数字化、3D 图形和渲染、视频转码和 FP32 HPC 等各种用例。

NVIDIA 与 OCI:企业级 AI

OCI 与 NVIDIA 的协作,将为各种规模的企业带来最先进的 NVIDIA H100 和 L40S GPU 加速基础设施,助力企业加入到这场生成式 AI 革命。仅访问 NVIDIA GPU 加速实例可能还不够。若要在 OCI Compute 上释放 NVIDIA GPU 的最大潜能,就必须拥有一个最好的软件层。NVIDIA AI Enterprise 通过专为底层 NVIDIA GPU 基础设施优化的开源容器和框架,简化了企业级加速 AI 软件的开发和部署,所有这一切都离不开支持服务的帮助。

如要了解更多信息,欢迎访问有关 Oracle 云基础设施(OCI)OCI ComputeOracle 如何迈向 AI 以及 NVIDIA AI Platform 网页。

Oracle 云基础设施(OCI):https://www.oracle.com/cloud/

OCI Compute:https://www.oracle.com/cloud/compute/

Oracle 如何迈向 AI:https://www.oracle.com/artificial-intelligence/

NVIDIA AI Platform:https://www.nvidia.cn/ai-data-science/

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,关注更多会议及活动信息。

wKgaomUo-1qAVDoQAAFtccdApf0800.jpg


原文标题:Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4130

    浏览量

    99837

原文标题:Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    大模型浪潮下,AI 算力正向“本地推理”与“AI 工厂”两极延伸,而传统架构在低延迟与规模化之间往往顾此失彼。RISC-V 的可定制特性,提供了一条新路径——端侧精简高效,侧通过众核与矩阵增强向上
    发表于 05-15 12:15

    OracleNVIDIA合作加速向量搜索和企业数据处理

    OracleNVIDIA 正在与客户合作,将 GPU 加速的向量索引构建应用于实际工作负载。Oracle Private AI Ser
    的头像 发表于 03-23 15:26 567次阅读

    IBM宣布扩大与NVIDIA的合作

    近日, IBM(纽约证券交易所代码: IBM)在 GTC 2026大会上宣布,将扩大与 NVIDIA 的合作,旨在推动 GPU 原生数据分析、智能文档处理、本地及受监管环境的基础设施部署,以及
    的头像 发表于 03-20 16:40 2502次阅读

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、计算及 AI 服务商轻松部署加速
    的头像 发表于 03-18 14:40 361次阅读

    Arm Neoverse计算平台驱动AI基础设施开启全新纪元

    十余年来,计算依托抽象化架构实现规模化扩展。标准化服务器、虚拟化资源与通用型基础设施,让超大规模服务提供商得以在同质化硬件基础上持续叠加
    的头像 发表于 03-03 10:24 668次阅读

    Meta与NVIDIA达成多年战略合作伙伴关系

    NVIDIA 今天宣布与 Meta 达成一项多年期、跨多代产品的战略合作伙伴关系,涵盖本地部署、计算和 AI 基础设施
    的头像 发表于 03-02 14:46 761次阅读

    Omdia:2025年第三季度,中国大陆基础设施市场加速增长24%

    2025 年第三季度,中国大陆基础设施服务市场延续回升态势,同比增长达 24%。随着企业逐步从早期 AI 试验阶段迈向规模化应用,AI 日益成为核心基础设施服务新增需求的主要驱动力
    的头像 发表于 02-14 20:12 1.1w次阅读

    开发者正加速向Arm架构迁移

    人工智能 (AI) 正重塑数字格局,开发者也正面临全新挑战:基础设施不仅要具备强大算力,还需兼具可扩展性、成本效益和高能效等特征。当前,亚马逊科技、谷歌、微软、Oracle Cloud
    的头像 发表于 02-02 15:10 695次阅读

    NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

    NVIDIA 宣布,NVIDIA BlueField®-4 数据处理器作为全栈 NVIDIA BlueField 平台的一部分,为 NVIDIA 推理上下文记忆存储平台
    的头像 发表于 01-09 10:33 737次阅读

    什么是企业服务器-计算

    地扩展和管理其IT基础设施。华纳的企业服务器基于虚拟化技术,在环境中运行多个虚拟服务器实例,为企业
    的头像 发表于 12-29 17:57 1260次阅读

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    Facebook 开放交换系统平台。 Oracle 采用 Spectrum-X 以太网交换机构建十亿瓦级(Giga-Scale)AI 超级计算机。 NVIDIA 宣布 Meta 和 Orac
    的头像 发表于 10-14 10:26 2206次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太网交换机助力 Meta 和 <b class='flag-5'>Oracle</b> <b class='flag-5'>加速</b>网络性能

    Lambda采用Supermicro NVIDIA Blackwell GPU服务器集群构建人工智能工厂

    大批量 Supermicro GPU 优化服务器(包括基于 NVIDIA Blackwell 的系统),以扩展其人工智能基础设施并向客户交付高性能计算系统。此次合作于今年 6 月率先在
    的头像 发表于 08-30 16:55 1011次阅读

    IBM和Oracle深化合作伙伴关系

    近日,IBM 正在与 Oracle 合作,将 IBM 旗舰 AI 产品组合 watsonx 的强大功能引入 Oracle 基础设施 (OCI)。 借助 OCI 的原生人工智能服务,I
    的头像 发表于 06-30 14:15 1332次阅读

    欧洲联手NVIDIA打造AI基础设施

    NVIDIA 于近日宣布,其正在携手欧洲各国、科技和行业领导者,共同建造 NVIDIA Blackwell AI 基础设施,以强化数字主权、支撑经济增长,并推动欧洲大陆成为 AI 工业革命的领导者。
    的头像 发表于 06-16 14:25 1778次阅读

    硅谷GPU服务器是什么意思?使用指南详解

    硅谷GPU服务器本质上是一种IaaS(基础设施即服务)产品,它将物理服务器上的GPU资源通过虚拟化技术分割成可弹性调配的服务。与普通CP
    的头像 发表于 06-16 09:41 810次阅读