0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

NVIDIA英伟达 来源:未知 2023-11-29 21:00 次阅读

  • 亚马逊科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片和亚马逊云科技可扩展性 UltraCluster 的云 AI 超级计算机。

  • 首款采用 NVIDIA GH200 NVL32 的 NVIDIA DGX 云即将登陆亚马逊云科技。

  • 两家公司联合开展“Project Ceiba”合作项目,即全球最快的 GPU 驱动 AI 超级计算机和最新 NVIDIA DGX 云超级计算机,用于 NVIDIA AI 研发和自定义模型开发。

  • 搭载 NVIDIA GH200、H200、L40S 和 L4 GPU的全新亚马逊 EC2 实例为生成式 AI、高性能计算(HPC)、设计和仿真工作负载提供助力

  • 亚马逊云科技提供的 NVIDIA 软件——NeMo LLM 框架NeMo RetrieverBioNeMo 可推动用于自定义模型、语义检索和药物研发的生成式 AI 开发工作。

亚马逊公司旗下的亚马逊云科技(AWS)和 NVIDIA 宣布扩大战略合作,共同提供最先进的基础架构、软件和服务,推进客户的生成式人工智能(AI)创新。

NVIDIA 与亚马逊云科技将集两家公司技术之大成,无论是采用 NVIDIA 最新多节点系统的新一代 GPU、CPU 和 AI 软件,还是 AWS Nitro System 高级虚拟化与安全功能、Elastic Fabric Adapter(EFA)互连接口和可扩展性 UltraCluster,均为训练基础模型和构建生成式 AI 应用的理想选择。

这一扩展合作建立在双方长期合作关系的基础上。两家公司通过为早期的机器学习(ML)先行者提供推进这些技术发展所需的计算性能,进而推动了生成式 AI 时代的发展。

扩展的合作内容之一是为所有行业的生成式 AI 提供强大助力:

  • 亚马逊云科技将成为首家把采用全新多节点NVLink技术的 NVIDIA GH200 Grace Hopper 超级芯片带到云端的云服务提供商。NVIDIA GH200 NVL32 多节点平台将 32 颗采用 NVIDIA NVLink 和NVSwitch技术的 Grace Hopper 超级芯片连接到一个实例中。该平台将在与亚马逊的强大网络(EFA)相连的亚马逊弹性计算云(Amazon EC2)实例上提供,并且得到先进的虚拟化功能(AWS Nitro System)和超大规模集群(Amazon EC2 UltraClusters)的支持,支持双方客户扩展到数千颗 GH200 超级芯片。

  • NVIDIA 和亚马逊云科技将共同提供由亚马逊云科技托管的 NVIDIA AI 训练即服务——NVIDIA DGX 云。这将是首个采用 GH200 NVL32 的 DGX 云,可以为开发者提供最大的单实例共享内存。亚马逊云科技托管的 DGX 云将加快前沿生成式 AI 和大语言模型的训练速度,这些模型的参数可能超过 1 万亿个。

  • NVIDIA 和亚马逊云科技正在合作“Project Ceiba”项目,设计世界上最快的由 GPU 驱动的 AI 超级计算机——一套搭载 GH200 NVL32 和亚马逊 EFA 互连接口的大规模系统,由亚马逊云科技托管,供 NVIDIA 内部研发团队使用。这台独一无二的超级计算机具有 16,384 颗 NVIDIA GH200 超级芯片和 65 EFLOPS 的 AI 处理性能。NVIDIA 将使用其推动下一轮生成式 AI 创新浪潮。

  • 亚马逊云科技还将推出三个全新的亚马逊 EC2 实例:搭载 NVIDIA H200 Tensor Core GPU 的 P5e 实例,适用于大规模和前沿生成式 AI 与 HPC 工作负载;以及分别搭载 NVIDIA L4 GPU 和 NVIDIA L40S GPU 的 G6 和 G6e 实例,适用于 AI 微调、推理、图形和视频工作负载等广泛应用。其中,G6e 实例尤其适用于开发 3D 工作流程、数字孪生以及使用NVIDIA Omniverse(一个用于连接和构建生成式 AI 赋能的 3D 应用的平台)的其他应用。

wKgaomVnNv-AMOq3AACo3yh7X0Y870.png

亚马逊云科技首席执行官 Adam Selipsky 表示:“自全球首个 GPU 云实例开始,亚马逊云科技与 NVIDIA 的合作已经超过 13 年。当下,我们为图形、游戏、高性能计算、机器学习,以及如今的生成式 AI 等工作负载提供最广泛的 NVIDIA GPU 解决方案。我们将继续与 NVIDIA 一起创新,将下一代 NVIDIA Grace Hopper 超级芯片与亚马逊云科技的 EFA 强大网络、EC2 UltraClusters 超大规模集群以及 Nitro 高级虚拟化功能相结合,使亚马逊云科技成为运行 GPU 的最佳平台。”

wKgaomVnNv-AMOq3AACo3yh7X0Y870.png

NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 正在深入改变云工作负载,并将加速计算作为多样化内容生成的基础。NVIDIA 和亚马逊云科技的共同使命是为每一位客户提供经济高效的前沿生成式 AI 技术。在这一使命的驱动下,NVIDIA 和亚马逊云科技正在开展覆盖整个计算堆栈的合作,包括 AI 基础架构、加速库、基础模型以及生成式 AI 服务。”

集 NVIDIA 和亚马逊云科技

最新技术于一身的亚马逊 EC2 实例

亚马逊云科技将成为首家提供采用多节点 NVLink 技术的 NVIDIA GH200 Grace Hopper 超级芯片的云服务提供商。每个 GH200 超级芯片都将基于 Arm 的 Grace CPU 与 NVIDIA Hopper 架构 GPU 整合在一个模块上。仅一个采用 GH200 NVL32 的亚马逊 EC2 实例就可提供高达 20 TB 的共享内存,驱动 TB 级工作负载。

这些实例将充分利用亚马逊云科技的第三代 Elastic Fabric Adapter(EFA)互连接口,为每个超级芯片提供高达 400 Gbps 的低延迟、高带宽网络吞吐量,支持客户能够在 EC2 UltraClusters 中扩展到数千颗 GH200 超级芯片。

采用 GH200 NVL32 的亚马逊云科技实例将支持客户按需访问超级计算机级的性能,这对于大规模 AI/ML 工作负载至关重要。这些工作负载需要分布在多个节点上,以处理复杂的生成式 AI 工作负载,包括 FM、推荐系统和向量数据库等。

搭载 NVIDIA GH200 的 EC2 实例将配备 4.5 TB 的 HBM3e 内存,与前一代搭载 H100 的 EC2 P5d 实例相比增加了 7.2 倍,这使客户能够运行更大规模的模型,并提升训练性能。此外,CPU-GPU 内存互连提供比 PCIe 高 7 倍的带宽,实现了芯片到芯片的通信,进而扩展了应用可用的内存总量。

采用 GH200 NVL32 的亚马逊云科技实例将成为其首个采用液冷技术的 AI 基础架构,这有助于确保密集服务器机架能够以最高性能高效运行。

采用 GH200 NVL32 的 EC2 实例还将受益于下一代 EC2 实例的底层平台——AWS Nitro System。Nitro System 通过将主机 CPU/GPU 的 I/O 功能卸载到专用硬件上,从而提供更加稳定的性能,同时其安全增强措施可在处理过程中保护客户代码和数据的安全。

亚马逊云科技率先托管搭载

Grace Hopper 的 NVIDIA DGX 云

亚马逊云科技将与 NVIDIA 共同托管采用 GH200 NVL32 NVLink 基础架构的 NVIDIA DGX 云。NVIDIA DGX 云是一项 AI 超级计算服务,可帮助企业快速访问多节点超级计算,用以训练最复杂的 LLM 和生成式 AI 模型。同时,还集成了NVIDIA AI Enterprise软件并可直接连线 NVIDIA AI 专家。

大规模 Project Ceiba

超级计算机将为 NVIDIA 的

AI 开发工作提供强大助力

亚马逊云科技和 NVIDIA 正在合作的 Project Ceiba 超级计算机将与亚马逊 Virtual Private Cloud(VPC)加密网络和亚马逊 Elastic Block Store 高性能块存储等服务集成,使 NVIDIA 能够访问亚马逊云科技的全套功能。

NVIDIA 将把这台超级计算机应用于研发,以此推进 AI 在 LLM、图形和仿真、数字生物学、机器人自动驾驶汽车、Earth-2 气候预测等领域的发展。

NVIDIA 和亚马逊云科技

大力推进生成式 AI、

HPC、设计和仿真的发展

为推动最大规模 LLM 的开发、训练和推理,亚马逊云科技 P5e 实例将采用 NVIDIA 最新的 H200 GPU。该 GPU 具有 141 GB 的 HBM3e GPU 内存,较 H100 GPU 内存扩大了 1.8 倍,提速 1.4 倍,加上 AWS Nitro System 支持的高达 3200 Gbps 的 EFA 网络,将支持客户继续在亚马逊云科技平台上构建、训练和部署其前沿模型。

为了提供节能且高性价比的视频、AI 和图形工作负载解决方案,亚马逊云科技发布了搭载 NVIDIA L40S GPU的全新亚马逊 EC2 G6e 实例和搭载 L4 GPU 的 G6 实例。这些新服务有助于满足初创公司、企业和研究人员的 AI 和高保真图形需求。

G6e 实例专为处理生成式 AI 和数字孪生应用等复杂工作负载而构建。借助 NVIDIA Omniverse,可以开发出逼真的 3D 仿真并利用来自 AWS IoT TwinMaker、智能聊天机器人、AI 助手、搜索和摘要等服务所提供的实时数据对其进行情景化和增强。Amazon Robotics 和 Amazon Fulfillment Centers 将能够整合使用 NVIDIA Omniverse 与 AWS IoT TwinMaker 构建的数字孪生系统,从而优化仓库设计和流程,训练更加智能的机器人助手,并提高交付质量。

L40S GPU 可提供高达 1.45 PFLOPS 的 FP8 性能,其光线追踪内核可提供高达 209 TFLOPS 的光追性能。G6 实例中的 L4 GPU 将为部署自然语言处理、语言翻译、AI 视频和图像分析、语音识别以及个性化领域的 AI 模型提供成本更低、能效更高的解决方案。L40S GPU 还能加速图形工作负载,如创建和渲染实时电影级图形与游戏流等。这三个实例都将在明年推出。

亚马逊云科技托管的

NVIDIA 软件助力生成式 AI 开发

此外,NVIDIA 还发布了亚马逊云科技托管、用于推动生成式 AI 开发工作的软件。NVIDIA NeMo Retriever微服务提供的新工具可利用加速语义检索,创建高度准确的聊天机器人和摘要工具。NVIDIA BioNeMo已在 Amazon SageMaker 上提供使用,并将登陆亚马逊云科技托管的 NVIDIA DGX 云。该平台能帮助制药公司利用自己的数据简化并加速模型训练,进而加快药物研发。

亚马逊云科技托管的 NVIDIA 软件正在助力亚马逊为其服务和运营注入创新活力。亚马逊云科技使用 NVIDIA NeMo 框架训练选定的新一代亚马逊 Titan LLM。Amazon Robotics 已开始使用 NVIDIA Omniverse Isaac 构建数字孪生,以便先在虚拟环境中自动化、优化和规划其自主仓库,然后再将其仓库部署到现实世界中。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3329

    浏览量

    87772

原文标题:亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    西门子中国与亚马逊云科技签署战略合作协议 加速生成AI在制造行业创新应用落地

    和服务,并结合西门子在工业领域的深厚积累和经验,联合创新团队将深入探索云计算、人工智能、机器学习、大数据等前沿技术与制造业更进一步融合,并加速生成AI技术在制造业的创新应用落地。西门
    发表于 04-18 11:30 88次阅读
    西门子中国与<b class='flag-5'>亚马逊</b>云科技签署<b class='flag-5'>战略</b><b class='flag-5'>合作</b>协议 加速<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>在制造行业创新应用落地

    NVIDIA和谷歌云宣布开展一项新的合作,加速AI开发

    NVIDIA 和谷歌云宣布开展一项新的合作,以帮助全球初创企业加速创建生成AI 应用
    的头像 发表于 04-11 14:03 162次阅读

    NVIDIA Edify为视觉内容提供商带来3D生成AI全新图像控件

    用于视觉生成AI 的多模态架构 NVIDIA Edify 正在迈入全新维度。
    的头像 发表于 03-26 09:49 319次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数
    发表于 03-19 10:56 106次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell <b class='flag-5'>架构</b> DGX SuperPOD,适用于万亿参数级的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    聚焦亮点:NVIDIA 在 2023 亚马逊云科技 re:Invent 发布回顾

    2023 亚马逊云科技 re:Invent 在拉斯维加斯威尼斯人会展中心举行, 亚马逊云科技(AWS)和 NVIDIA 宣布扩大战略
    的头像 发表于 11-30 19:40 228次阅读
    聚焦亮点:<b class='flag-5'>NVIDIA</b> 在 2023 <b class='flag-5'>亚马逊</b>云科技 re:Invent 发布回顾

    NVIDIA BioNeMo 在亚马逊云科技上线,实现用于药物研发的生成AI

    NVIDIA Clara 软件和服务,以加快医疗研究进程。 这项计划于太平洋时间 11 月 28 日在亚马逊云科技 re:Invent 上公布,让使用 AWS 云资源的医疗和生命科学
    的头像 发表于 11-29 21:10 363次阅读

    拥抱变革:亚马逊云科技与 NVIDIA 共同推进生成AI 和云的创新

    ,并着重介绍了两家公司如何深化合作以赋能客户取得成功。 亚马逊云科技(AWS)和 NVIDIA 将为全球企业带来新一代生成AI 技术。
    的头像 发表于 11-29 21:00 345次阅读
    拥抱变革:<b class='flag-5'>亚马逊</b>云科技与 <b class='flag-5'>NVIDIA</b> 共同推进<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 和云的创新

    德勤中国与亚马逊云科技联合成立生成AI联合实验室

    计算能力、亚马逊云科技海外区域推出的全新托管生成AI服务Amazon Bedrock、和全托管
    的头像 发表于 11-17 09:43 424次阅读

    Infosys 与 NVIDIA 合作,助力全球企业利用生成AI 提高生产力

     日,下一代数字服务和咨询领域的全球领军者 Infosys(NSE、BSE、NYSE:INFY)和 NVIDIA(NASDAQ:NVDA)今日宣布扩大双方战略
    的头像 发表于 09-21 19:35 258次阅读

    Infosys 与 NVIDIA 合作,助力全球企业利用生成AI提高生产力

    两家公司扩大合作,依托跨行业的生成AI应用和解决方案提供提高生产力所需的专业知识与技术;全新卓越中心将为 5万名 Infosys员工
    发表于 09-21 10:21 160次阅读
    Infosys 与 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>合作</b>,助力全球企业利用<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>提高生产力

    谷歌云与 NVIDIA 扩大合作,共同推进 AI 计算软件和服务的发展

    日 — 谷歌云(Google Cloud)与 NVIDIA 于今日宣布推出全新 AI 基础设施和软件,帮助客户构建和部署用于
    的头像 发表于 08-31 13:05 449次阅读
    谷歌云与 <b class='flag-5'>NVIDIA</b> 扩大<b class='flag-5'>合作</b>,共同推进 <b class='flag-5'>AI</b> <b class='flag-5'>计算</b>、<b class='flag-5'>软件</b><b class='flag-5'>和服务</b>的发展

    VMware 与 NVIDIA 为企业开启生成AI 时代

    全新 VMware Private AI Foundation With NVIDIA 帮助企业为生成AI 在业务中的应用做好准备;该平
    的头像 发表于 08-23 19:10 473次阅读
    VMware 与 <b class='flag-5'>NVIDIA</b> 为企业开启<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 时代

    NVIDIA 与 Hugging Face 将连接数百万开发者与生成AI 超级计算

    年 8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成
    发表于 08-09 11:41 108次阅读
    <b class='flag-5'>NVIDIA</b> 与 Hugging Face 将连接数百万开发者与<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b><b class='flag-5'>计算</b>

    亚马逊云科技推出七项生成AI创新

    北京2023年7月27日 /美通社/ -- 亚马逊云科技近日在纽约峰会上宣布,推出七项生成AI创新,包括Amazon Bedrock新增基础模型供应商Cohere和
    的头像 发表于 07-27 16:19 538次阅读
    <b class='flag-5'>亚马逊</b>云科技推出七项<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>创新

    NVIDIA 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成AI 和 5G/6G 的软银下一代数据中心

    宣布,双方正在合作打造一个基于 NVIDIA GH200 Grace Hopper 超级芯片 、面向生成
    的头像 发表于 05-30 01:40 446次阅读
    <b class='flag-5'>NVIDIA</b> 与软银公司<b class='flag-5'>合作</b>,利用 Grace Hopper <b class='flag-5'>超级</b>芯片建设面向<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 和 5G/6G 的软银下一代数据中心