0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta RSC或将成为最大的NVIDIA DGX A100客户系统

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-01-27 17:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能,采用了最先进的NVIDIA系统、InfiniBand网络和软件,实现了数千个GPU集群的系统优化。

Meta Platforms非常认可NVIDIA,为其有望成为有史以来最强大的研究系统选择了NVIDIA的先进技术。

于今日发布的AI研究超级集群(AI Research SuperCluster,缩写RSC)已在训练新模型以推动AI发展。

全面部署后,Meta的RSC预计将成为最大的NVIDIA DGX A100客户系统。

Meta在一篇博客文章中表示:“我们希望RSC帮助我们建立全新的AI系统,例如可以为多个不同语言的团队提供实时语音翻译,使他们可以在研究项目上无缝协作,甚至一起玩AR游戏。”

训练最大的AI模型

当RSC在今年晚些时候完全建成时,Meta将用它来训练具有超过1万亿个参数的AI模型。这将推动自然语言处理等领域的发展,比如实时识别不法内容等工作。

除了实现规模性能之外,Meta还将超高的可靠性、安全性、隐私性以及处理“各类AI模型”的灵活性作为RSC的关键指标。

Meta的AI研究超级集群拥有数百个NVIDIA DGX系统并通过NVIDIA Quantum InfiniBand网络相连接,助力Meta AI研究团队提高工作速率。

性能大揭秘

目前,此全新AI超级计算机已经部署了760个NVIDIA DGX A100系统作为其计算节点。共有6080个NVIDIA A100 GPU,通过NVIDIA Quantum 200Gb/s InfiniBand网络连接,可提供1895(千万亿次)TF32计算性能。

尽管受到新冠疫情的影响,这样一台可运行的AI超级计算机从想法到实现,RSC仅用了18个月!“功臣”之一便是采用NVIDIA DGX A100技术作为基石。

Penguin Computing是NVIDIA合作伙伴网络中负责RSC交付的合作伙伴。除了760个DGX A100系统和InfiniBand网络之外,Penguin还为Meta提供管理服务和AI基础架构优化,包括一个46PB高速缓存的Altus系统。

性能提升20倍

这是Meta第二次选择NVIDIA技术作为其研究平台的基础。2017年,Meta打造了第一代AI研究基础架构,配备了22000个NVIDIA V100 Tensor Core GPU,每日可处理35000项AI训练工作。

Meta的早期基准测试显示,RSC训练大型NLP模型的速度比之前的系统快3倍,运行计算机视觉工作的速度比之前的系统快20倍。

在今年晚些时候的第二阶段,RSC将扩展至16000个GPU。Meta认为届时RSC将提供高达5百亿亿次级混合精度AI计算性能,并且Meta希望通过扩展RSC的存储系统,以每秒16TB的速度提供高达1EB的数据。

可扩展架构

NVIDIA AI技术适用于任何规模的企业应用。

NVIDIA DGX包含一个完整的NVIDIA AI软件栈,可以轻松地从单个系统扩展至完整的DGX SuperPOD,可以在本地或主机托管商处运行。客户亦可以通过NVIDIA DGX Foundry租用DGX系统。

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109084
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92678
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296529

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA DGX Spark系统恢复过程与步骤

    在使用 NVIDIA DGX Spark 的过程中,可能会出现配置故障,而导致开发中断的问题,本篇教程将带大家了解如何一步步完成系统恢复。
    的头像 发表于 11-28 09:46 3562次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark<b class='flag-5'>系统</b>恢复过程与步骤

    NVIDIA DGX Spark助力构建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 项目,并于 3 月 18 日更名为 NVIDIA DGX Spark,进一步公布了产品细节。DGX
    的头像 发表于 11-21 09:25 533次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark助力构建自己的AI模型

    NVIDIA DGX Spark平台上对NVIDIA ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark 平台上对 NVIDIA ConnectX-7 200G 网卡进行配置时,会遇到“4 个逻辑端口”现象。理解背后的真相是后续所有配置的基础。本文将从此现象入手,逐步解析其原理,并提供从基础配置
    的头像 发表于 11-21 09:19 4420次阅读
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark平台上对<b class='flag-5'>NVIDIA</b> ConnectX-7 200G网卡配置教程

    NVIDIA DGX Spark快速入门指南

    NVIDIA DGX Spark 已正式向 AI 开发者交付,对于刚入手的全新 DGX Spark,该如何进行初始化设置?本篇文章将引导您完成 DGX Spark 首次设置。在初始设置
    的头像 发表于 11-17 14:11 4139次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark快速入门指南

    新手小白必看!关于A100云主机租用,你想知道的一切都在这!

    “我想租一台A100云主机来跑我的模型,但完全不知道从何下手。”——这是我们听到最多的来自AI新手的声音。A100,这个听起来就“高大上”的名词,背后其实是一套清晰、可操作的流程。今天,我们就用
    的头像 发表于 10-31 19:24 1045次阅读
    新手小白必看!关于<b class='flag-5'>A100</b>云主机租用,你想知道的一切都在这!

    NVIDIA黄仁勋向SpaceX马斯克交付DGX Spark

    革新于星舰基地开始。NVIDIA 创始人兼首席执行官黄仁勋亲手将全球迄今为止最小的 AI 超级计算机 NVIDIA DGX Spark 交付给埃隆·马斯克,拉开了该产品上市的序幕。
    的头像 发表于 10-21 11:12 606次阅读

    NVIDIA DGX Spark新一代AI超级计算机正式交付

    NVIDIA 创始人兼首席执行官黄仁勋在 SpaceX 向埃隆·马斯克交付 DGX Spark。
    的头像 发表于 10-21 10:41 620次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站式解决方案,助力轻松部署桌面 AI 计算机。
    的头像 发表于 09-23 17:20 919次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> Spark桌面AI计算机开启预订

    Cadence 借助 NVIDIA DGX SuperPOD 模型扩展数字孪生平台库,加速 AI 数据中心部署与运营

    [1]  利用搭载 DGX GB200 系统NVIDIA DGX SuperPOD[2] 数字孪生系统实现了库的重大扩展 。借助
    的头像 发表于 09-15 15:19 1239次阅读

    借助美光9550高性能SSD提升AI工作负载

    推理将成为数据中心最常见的工作负载,这一点毋庸置疑。随着数据中日益广泛采用NVIDIA H100,以及非NVL72系统开始部署NVIDIA
    的头像 发表于 07-14 15:58 1483次阅读
    借助美光9550高性能SSD提升AI工作负载

    NVIDIA发布AI优先DGX个人计算系统

    NVIDIA 宣布,多家行业领先系统制造商将打造 NVIDIA DGX Spark。
    的头像 发表于 05-22 09:39 809次阅读

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    开发者、研究人员、数据科学家和学生,在台式电脑上对大模型进行原型设计、微调和推理。用户可以在本地运行这些模型,将其部署在 NVIDIA DGX Cloud 任何其他加速云
    的头像 发表于 03-20 18:59 1271次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 <b class='flag-5'>DGX</b> Spark个人AI计算机

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    发表于 03-19 09:59 504次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 <b class='flag-5'>DGX</b> Spark 个人 AI 计算机

    Meta启动史上最大海底电缆项目

    近日,Meta宣布了一项雄心勃勃的计划——启动全球史上最大的海底电缆项目Waterworth。该项目预计于今年正式动工,初步估算成本高达100亿美元。
    的头像 发表于 02-18 15:12 1039次阅读

    英伟达A100和H100比较

    英伟达A100和H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差异。以下是对这两款GPU的比较: 1. 架构与核心规格: A100: 架构: 基于Ampere架构
    的头像 发表于 02-10 17:05 1.1w次阅读
    英伟达<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比较