0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达发布超强AI加速卡,性能大幅提升,可支持1.8万亿参数模的训练

微云疏影 来源:综合整理 作者:综合整理 2024-03-19 12:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月19日消息,NVIDIA宣布成功研发AI加速卡——Blackwell GB200,预计年内开始交付。这是NVIDIA在GTC开发者大会上所公布的最新成果。

GB200创新性的运用了NVIDIA独创的新一代AI图形处理器架构Blackwell。NVIDIA CEO黄仁勋明确指出:“尽管Hopper已然优秀,但我们需要更强的GPU推动发展。”

得益于NVIDIA每两年进行一次GPU架构升级以提高性能的策略,全新的基于Blackwell的加速卡比之前的H100更为强大,尤其适用于AI相关任务。

Blackwell GPU卓越表现使得AI性能达到惊人的20PetaFLOPS。相比之下,基于Hoper架构的H100仅为4PetaFLOPS。NVIDIA强调,这种额外的处理能力将极大地便利人工智能厂商顺利培训复杂且大规模的模型。

Blackwell GPU大大刷新了人们的认知,其庞大身形由台积电4纳米(4NP)工艺制成,包含两个独立制造的裸晶(Die),共有2080亿个晶体管。为了方便捆绑芯片,它采用NVLink 5.0技术。两枚Blackwell芯片在同一封装中,相较以往的GPU而言,整体性能显著提升达2.5倍,若处理FP4八精度浮点运算,则性能甚至可飙升至5倍之多。校园秘

关于GB200,NVIDIA宣称,其合成物包括两个B200 Blackwell GPU以及一个基于Arm的Grace CPU。很多人惊讶地发现 NvTech的首批量产计算机将其性能获得了提升超过30倍,同时降低成本和能耗。根据NVIDIA的数据分析,他们现有的硬件只用2000个Blackwell GPU就够再去完成诸如1.8万亿个参数模型这样的运算任务,且只消耗4兆瓦的电力。在参数为1,750亿的GPT-3 LLM基准测试中,Nvidia的GB200的性能甚至超越了H100 7倍。规律纪律意识

对于致力于拥有庞大需求企业的成品服务,NVIDA推出了包含36个CPU及72个Blackwell GPU的NVL72服务器,并附赠一体式水冷散热解决方案,产能可实现高达720 PetaFLOPS的AI训练性能,或者达到惊人的1,440 PetaFlops。另外,还有144个壁搏立帆、576个GPU以及240TB的内存。单据一份官方报道显示,早先以至于要运行一带有1.8万亿个参数模型的堆栈,原先需要8000个 Hopper GPU,外加15兆瓦的电力。

英伟达透露,同类机型已被亚马逊、谷歌、微软和甲骨文计划纳入他们的云服务产品之中,由于对具体采购量的保密,外界暂无确切消息。但据Nvidia表示,已经接到了Amazon AWS对于采用2万片 Blackwell芯片建成的服务器集群的购买计划。通过Node-to-Node NVLink 5.0,每个机架将被18块GB200芯片和9块交换机装满。而不同于此,英伟达的 Skeeter InfiniBand可连接多达144个节点,Quantum-X800 InfiniBand则最高可支持64个节点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109110
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134478
  • AI
    AI
    +关注

    关注

    89

    文章

    38171

    浏览量

    296888
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟5万亿市值背后,是一场赌上未来的烧钱竞赛

    需求下,各大云计算厂商不断加大对AI算力基建的投资,大量购买算力。在10月29日的GTC大会上,英伟CEO黄仁勋表示,公司新一代AI芯片
    的头像 发表于 11-02 11:18 8795次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>5<b class='flag-5'>万亿</b>市值背后,是一场赌上未来的烧钱竞赛

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    的关键技术瓶颈。   在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技
    的头像 发表于 11-14 08:21 9529次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b><b class='flag-5'>发布</b>,一<b class='flag-5'>卡</b>双芯重构<b class='flag-5'>AI</b>推理标杆

    虚拟电厂加速卡不是噱头!万点规模VPP的性能分水岭

    。   此时仅靠边缘MPU/CPU的通用算力,可能无法及时处理数据清洗、异常检测、指令下发校验等任务,而加速卡(如 GPU、FPGA 加速卡)的并行计算能力快速消化数据洪流,避免“小包风暴”导致的系统
    的头像 发表于 10-10 08:59 2139次阅读

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI
    的头像 发表于 06-05 13:39 1299次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    410 基于 XCVU9P+ C6678 的 100G 光纤的加速卡

    基于 XCVU9P+ C6678 的 100G 光纤的加速卡
    的头像 发表于 05-08 08:32 553次阅读
    410 基于 XCVU9P+ C6678 的 100G 光纤的<b class='flag-5'>加速卡</b>

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标准PCIe
    的头像 发表于 04-24 17:57 4087次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    推理任务,需额外部署GPU加速卡,导致成本与功耗飙升。 扩展性受限:老旧接口(如USB 2.0、百兆网口)无法支持5G模组、高速存储等现代外设,升级困难。 开发周期长:BSP适配不完善,跨平台AI
    发表于 04-15 10:48

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    的端侧部署,Token产生速度提升了40%,让端侧大模型拥有更高的计算效率和推理性能,使端侧AI交互响应更及时,用户体验更贴心。 联发科还与vivo和全民K歌携手,借助天玑AI人声萃
    发表于 04-13 19:52

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    宣布在英伟 Grace Blackwell 平台上实现高达 30 倍的预期性能提升加速下一代半导体的电路仿真   摘要: 在今年GTC主
    发表于 03-19 17:59 437次阅读

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出一套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 951次阅读
    边缘<b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    英伟市值一夜蒸发近2万亿 英伟股价下跌超8%

    财年第四财季和全财年业绩数据上看,2025财年第四财季及全年的营收和利润都实现了大幅增长,大家特别关注的数据中心业务也是业绩增长的核心动力,展现出英伟AI领域的强大实力。而且
    的头像 发表于 03-04 10:19 996次阅读

    Gupshup加速企业AI应用进程

    推出其AI代理库(AI Agent Library),这是一套由15个预构建和定制的AI代理组成的开创性套件,具备深厚的行业专业知识,
    的头像 发表于 02-14 16:04 546次阅读

    英伟发布Nemotron-CC大型AI训练数据库

    ,Nemotron-CC数据库总计包含了惊人的6.3万亿个Token,其中1.9万亿为精心合成的数据。这一庞大的数据量不仅为AI模型的训练提供了丰富的素材,更为学术界和企业界在探索大语
    的头像 发表于 01-14 14:14 795次阅读

    英伟收购AI初创公司Run:ai

    :ai作为一家专注于AI云计算软件平台开发的初创公司,其产品以高效利用高性能GPU资源为核心,致力于为用户提供更快速、更便捷的机器学习加速方案。通过此次收购,
    的头像 发表于 12-31 10:46 867次阅读