0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta发布采用NVIDIA系统的AI研究超级集群

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-02-07 10:40 次阅读

Meta的AI超级计算机是迄今为止最大的NVIDIA DGX A100客户系统。该系统将为Meta的AI研究人员提供5百亿亿次级AI计算性能,采用了最先进的NVIDIA系统、InfiniBand网络和软件,实现了数千个GPU集群的系统优化。

Meta Platforms非常认可NVIDIA,为其有望成为有史以来最强大的研究系统选择了NVIDIA的先进技术。

于今日发布的AI研究超级集群(AI Research SuperCluster,缩写RSC)已在训练新模型以推动AI发展。

全面部署后,Meta的RSC预计将成为最大的NVIDIA DGX A100客户系统。

Meta在一篇博客文章中表示:“我们希望RSC帮助我们建立全新的AI系统,例如可以为多个不同语言的团队提供实时语音翻译,使他们可以在研究项目上无缝协作,甚至一起玩AR游戏。”

训练最大的AI模型

当RSC在今年晚些时候完全建成时,Meta将用它来训练具有超过1万亿个参数的AI模型。这将推动自然语言处理等领域的发展,比如实时识别不法内容等工作。

除了实现规模性能之外,Meta还将超高的可靠性、安全性、隐私性以及处理“各类AI模型”的灵活性作为RSC的关键指标。

Meta的AI研究超级集群拥有数百个NVIDIA DGX系统并通过NVIDIA Quantum InfiniBand网络相连接,助力Meta AI研究团队提高工作速率。

性能大揭秘

目前,此全新AI超级计算机已经部署了760个NVIDIA DGX A100系统作为其计算节点。共有6080个NVIDIA A100 GPU,通过NVIDIA Quantum 200Gb/s InfiniBand网络连接,可提供1895(千万亿次)TF32计算性能。

尽管受到新冠疫情的影响,这样一台可运行的AI超级计算机从想法到实现,RSC仅用了18个月!“功臣”之一便是采用NVIDIA DGX A100技术作为基石。

Penguin Computing是NVIDIA合作伙伴网络中负责RSC交付的合作伙伴。除了760个DGX A100系统和InfiniBand网络之外,Penguin还为Meta提供管理服务和AI基础架构优化,包括一个46PB高速缓存的Altus系统。

性能提升20倍

这是Meta第二次选择NVIDIA技术作为其研究平台的基础。2017年,Meta打造了第一代AI研究基础架构,配备了22000个NVIDIA V100 Tensor Core GPU,每日可处理35000项AI训练工作。

Meta的早期基准测试显示,RSC训练大型NLP模型的速度比之前的系统快3倍,运行计算机视觉工作的速度比之前的系统快20倍。

在今年晚些时候的第二阶段,RSC将扩展至16000个GPU。Meta认为届时RSC将提供高达5百亿亿次级混合精度AI计算性能,并且Meta希望通过扩展RSC的存储系统,以每秒16TB的速度提供高达1EB的数据。

可扩展架构

NVIDIA AI技术适用于任何规模的企业应用。

NVIDIA DGX包含一个完整的NVIDIA AI软件栈,可以轻松地从单个系统扩展至完整的DGX SuperPOD,可以在本地或主机托管商处运行。客户亦可以通过NVIDIA DGX Foundry租用DGX系统。

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4597

    浏览量

    101750
  • 计算机
    +关注

    关注

    19

    文章

    6652

    浏览量

    84565
  • AI
    AI
    +关注

    关注

    87

    文章

    26464

    浏览量

    264090

原文标题:Meta与NVIDIA联合打造大型AI研究超级计算机

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新开源大语言模型采用 NVIDIA 技术构建,其经过优化后可在云、数据中心、边缘和 PC 的 NVIDIA GPU 上运行。
    的头像 发表于 04-23 09:52 124次阅读

    NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

    NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwel
    的头像 发表于 03-21 09:49 334次阅读

    NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算

    基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数
    发表于 03-19 10:56 106次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算

    Meta欲打造巨型AI覆盖视频推荐生态系统

    Meta正计划打造一款巨型AI系统,以全面覆盖其视频推荐生态系统,为旗下产品提供统一的视频推荐引擎。
    的头像 发表于 03-11 11:14 271次阅读

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIAAI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日Tesla计划
    的头像 发表于 02-19 12:45 312次阅读
    Tesla 计划斥资 5 亿美元建造一台由 <b class='flag-5'>NVIDIA</b> 的 <b class='flag-5'>AI</b> GPU 提供支持的 Dojo <b class='flag-5'>超级</b>计算机

    亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务

    亚马逊云科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片 和亚马逊云科技可扩展性 UltraCluster 的云  AI 超级计算机。 首款
    的头像 发表于 11-29 21:00 387次阅读
    亚马逊云科技与 <b class='flag-5'>NVIDIA</b> 宣布开展战略合作,为生成式 <b class='flag-5'>AI</b> 提供全新<b class='flag-5'>超级</b>计算基础架构、软件和服务

    SC23 | 新型加速节能 AI 系统开创超级计算的新时代

    世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式
    的头像 发表于 11-15 18:45 335次阅读
    SC23 | 新型加速节能 <b class='flag-5'>AI</b> <b class='flag-5'>系统</b>开创<b class='flag-5'>超级</b>计算的新时代

    全球领先系统制造商推出 NVIDIA AI 就绪型服务器,为企业大幅提升生成式 AI 性能

    with NVIDIA 拉斯维加斯 — VMware Explore — 太平洋时间 2023 年 8 月 22 日 — NVIDIA 宣布,全球领先的系统制造商将推出 AI 就绪型
    的头像 发表于 08-23 19:10 382次阅读

    NVIDIA CPU+GPU超级芯片大升级!

    NVIDIA官方宣布了新一代GH200 Grace Hopper超级芯片平台,全球首发采用HBM3e高带宽内存,可满足世界上最复杂的生成式AI负载需求。
    的头像 发表于 08-10 09:37 956次阅读
    <b class='flag-5'>NVIDIA</b> CPU+GPU<b class='flag-5'>超级</b>芯片大升级!

    SIGGRAPH主题演讲:NVIDIA首席执行官带来生成式AI多项创新

    黄仁勋发布最新GH200 Grace Hopper 超级芯片和NVIDIA AI Workbench,并宣布更新NVIDIA Omniver
    的头像 发表于 08-09 14:20 724次阅读
    SIGGRAPH主题演讲:<b class='flag-5'>NVIDIA</b>首席执行官带来生成式<b class='flag-5'>AI</b>多项创新

    NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

    年 8 月 8 日 — NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮助他们构建大语言模型(LLM)和其他高级 AI
    发表于 08-09 11:41 108次阅读
    <b class='flag-5'>NVIDIA</b> 与 Hugging Face 将连接数百万开发者与生成式 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    进行开创性的药物研究、探索替代能源还是寻找预防金融欺诈的新方法,访问先进的 AI 计算资源都是推动创新的关键。这种新的计算模式可以解决生成式 AI 所带来的挑战,并推动下一轮创新。 Cambridge-1 是
    的头像 发表于 06-19 19:05 300次阅读

    NVIDIA为加速生成式AI而设计的超级芯片全面投产

    5 月29 日,英伟达在 2023 台北电脑展大会推出了DGX GH200 AI超级计算机,这是配备256颗Grace Hopper超级芯片和NVIDIA NVLink交换机
    的头像 发表于 06-01 15:59 403次阅读
    <b class='flag-5'>NVIDIA</b>为加速生成式<b class='flag-5'>AI</b>而设计的<b class='flag-5'>超级</b>芯片全面投产

    NVIDIA推出DGX GH200 AI超级计算机

    驱动的NVIDIA DGX™超级计算机,旨在助力开发面向生成式AI语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。   NVIDIA
    发表于 05-30 14:15 450次阅读
    <b class='flag-5'>NVIDIA</b>推出DGX GH200 <b class='flag-5'>AI</b><b class='flag-5'>超级</b>计算机

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

    Switch System 驱动的 NVIDIA DGX 超级计算机 ,旨在助力开发面向生成式 AI 语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。
    的头像 发表于 05-30 01:40 1517次阅读
    COMPUTEX2023 | <b class='flag-5'>NVIDIA</b> 推出 DGX GH200 <b class='flag-5'>AI</b> <b class='flag-5'>超级</b>计算机