0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达推出性能10倍领先ARM架构CPU

旺材芯片 来源:物联网智库 作者:物联网智库 2021-04-19 14:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

还是熟悉的厨房、熟悉的皮衣,前几日凌晨,NVIDIA GTC2021如约而至。NVIDIA创始人黄仁勋的主题演讲作为GTC的重头戏,果然没有让人失望,其在演讲中重磅发布了多款产品,其中三款基于Arm IP打造的处理器尤为引人关注:

NVIDIA Grace:专为大规模人工智能和高性能计算应用而设计

BlueField-3 DPU:首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU

NVIDIA DRIVE Atlan:新一代AI自动驾驶汽车处理器,算力将达到1000TOPS

英伟达CPU问世

GTC大会期间,黄仁勋在接受集微网电话采访时表示,英伟达收购Arm正在稳妥有序进行。尽管收购尚未尘埃落定,但英伟达已经开始了基于Arm IP的研发,打造了一款专为大规模人工智能和高性能计算应用而设计的CPU——NVIDIA Grace。

目前,绝大多数的数据中心仍将继续使用现有的CPU,而Grace主要将用于计算领域的细分市场。黄仁勋介绍道,“结合 GPU 和 DPU,Grace 为我们提供了第三种基础计算能力,并具备重新定义数据中心架构,推进 AI 前进的能力。”

图源:机器之心

Grace 的名字来自于计算机科学家、世界最早一批的程序员,也是最早的女性程序员之一的格蕾丝 · 赫柏(Grace Hopper)。她创造了现代第一个编译器 A-0 系统,以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」(调试)便是她在受到从电脑中驱除蛾子的启发而开始使用的,于是她也被冠以「Debug 之母」的称号。

Grace CPU是NVIDIA首次使用下一代 Arm Neoverse 内核的设计,采用了更为先进的 5nm 制程,在内部通信能力上,它使用了英伟达第四代 NVIDIA NVLink,在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽,相比之前的产品提升了八倍。整个SoC是由多个芯片组合构成,它主要有三个部分,分别是CPU、GPU和内存/IO子系统。

Grace是一款高度专业化的处理器,主要解决工作负载问题,例如训练拥有超过1万亿个参数的下一代NLP模型。当与英伟达GPU紧密结合时,基于Grace CPU的系统将比当今最先进的基于英伟达DGX的系统(运行在x86 CPU上)的性能还要快10倍。

此外,Grace 还是第一个通过错误校正代码(ECC)等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU,同时提供 2 倍的内存带宽和高达 10 倍的能源效率。

对Grace的性能,黄仁勋如此总结道:“Grace能充分彰显出Arm的强大。”

虽然是首次出现在大众视野中,但目前Grace已经找到了至少两个客户——瑞士国家超级计算中心(CSCS)将采用Grace,构建一台名为Alps的超级计算机,其算力可达20Exaflops;美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)即将推出的超级计算机也将采用Grace。

三类芯片,逐年飞跃

在黄仁勋看来,CPU和GPU以及负责在数据中心传输和处理数据的数据处理单元(DPU),将共同组成“未来计算的三大支柱”。

GTC2021上,除了推出首款CPU“炸圈”外,英伟达的DPU同样值得关注。“我们每年都会发布激动人心的新品。三类芯片,逐年飞跃,一个架构。”黄仁勋说,数据中心路线图包括CPU、GPU和DPU这三类芯片,而Grace和BlueField是其中必不可少的关键组成部分。

图源:智东西

英伟达全新推出的BlueField-3 DPU包含220亿个晶体管,采用16个Arm A78 CPU核心、18M IOPs弹性块存储,加密速度是上一代的4倍,并完全向下兼容BlueField-2。

据悉,BlueField-2能够卸载相当于30个CPU核的工作负载,而BlueField-3实现了10倍的加速计算性能提升,能够替代300个CPU核,以400Gbps的速率对网络流量进行保护、卸载和加速。该处理器也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。

此外,黄仁勋还发布了英伟达新一代AI自动驾驶汽车处理器——NVIDIA DRIVE Atlan,其算力将达到1000TOPS,约是上一代Orin处理器的4倍,超过了绝大多数L5无人驾驶出租车的总计算能力。

黄仁勋提出,“对于汽车而言,更高的算力意味着更加智能化,开发者们也能让产品更快迭代。TOPS就是新的马力。”

图源:智东西

该SoC采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习计算机视觉加速器,并内置为先进的网络、存储和安全服务的BlueField DPU,网络速度可达400Gbps。同时,这也是DRIVE平台首次集成DPU,通过Arm核为自动驾驶汽车带来数据中心级的网络。

除了NVIDIA Grace、BlueField-3 DPU、NVIDIA DRIVE Atlan这三款基于Arm IP打造的处理器外,黄仁勋还提到了AI-on-5G计算平台,这是一款专为边缘设计、将5G和AI相结合的新型计算平台,将采用NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100,将GPU和CPU组合成“有史以来最先进的PCIE卡。”目前,富士通、谷歌云、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。

布局Arm生态

在完成Arm收购后,英伟达将打造完整的数据中心芯片产品线,虽然收购案悬而未决,但在本次GTC大会上,NVIDIA仍宣布了一系列与Arm处理器设计商的合作进展,包括将为亚马逊AWS Graviton2 CPU提供GPU加速、为科学和AI应用开发提供支持的全新HPC开发者套件、提升边缘视频分析和安全功能、打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC等。

从自研三类芯片到GPU合作伙伴,从云、高性能计算、边缘计算到PC,不难看出英伟达对于Arm生态的重视程度。

为亚马逊AWS Graviton2 CPU提供GPU加速

2021年下半年,基于AWS Graviton2的Amazon EC2实例将与NVIDIA GPU相结合,在云端部署,可实现降低成本、支持更丰富的游戏串流体验、优化云上安卓游戏和人工智能推理、以更低成本提供更高的AI推理性能等优势。

为科学和AI应用开发提供支持的全新HPC开发者套件

NVIDIA全新HPC开发者套件为超级计算机提供了一个高性能、高能效的平台,该平台结合了1个Ampere Altra CPU(包含80个Arm Neoverse核,运行频率高达3.3GHz)、双NVIDIA A100 GPU(每个GPU可提供312TFLOPS的FP16深度学习性能)、两个用于加速网络、存储和安全的NVIDIA BlueField-2 DPU。

提升边缘视频分析和安全功能

NVIDIA正扩大与Marvell的合作,将基于Arm的OCTEON DPU与GPU相结合,加速AI工作负载,实现网络优化和安全。

打造新一类基于Arm并搭载NVIDIA RTX GPU的新款PC

NVIDIA将与联发科合作,共同打造一个采用Arm核与NVIDIA显卡、支持Chromium、Linux和NVIDIA SDK的参考平台,将GPU的性能及先进的AI、光线追踪图形等技术带入Arm PC平台。

写在最后

黄仁勋在NVIDIA GTC2021上公布了多项最新成果与研发进展,首款数据中心CPU的发布,也宣告着英伟达数据中心产品线正式集齐了“未来计算的三大支柱”——CPU、GPU、DPU,从英伟达在Arm身上“下的功夫”便不难看出其在CPU领域的野心。

英伟达每年在GTC大会上发布的新品已经成为了行业发展的重要指向,而正如黄仁勋所说,“新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。”不知今天过后,芯片圈的风向要怎么变呢?

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54411

    浏览量

    469150
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9588

    浏览量

    393556
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5270

    浏览量

    136059
  • PC
    PC
    +关注

    关注

    9

    文章

    2168

    浏览量

    159741

原文标题:动向 | 英伟达推出ARM架构CPU,性能10倍领先

文章出处:【微信号:wc_ysj,微信公众号:旺材芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    豪言自家芯片比英伟GPU强10,这家AI公司再获融资

    的 “复仇者联盟” 正在硅谷悄然集结,他们创立的 MatX 公司刚刚完成 5 亿美元 B 轮融资,豪言要打造性能 10 倍于英伟 GPU 的专用 AI 芯片,试图在通用芯片与专用芯片
    的头像 发表于 03-01 06:41 1.2w次阅读

    RV生态又一里程碑:英伟达官宣CUDA将兼容RISC-V架构

    时间里,RISC-V生态也在不断壮大,RISC-V CPU产品性能持续提高,开始往高性能的服务器CPU发展,形成向Arm服务器
    的头像 发表于 07-19 00:04 6810次阅读
    RV生态又一里程碑:<b class='flag-5'>英伟</b>达官宣CUDA将兼容RISC-V<b class='flag-5'>架构</b>!

    英伟+联发科,打入游戏本市场?

    合作,通过更低的功耗,实现RTX 4070同级的性能,并搭载在更轻薄的机身内。   APU(Accelerated Processing Unit,加速处理单元)是AMD推出的一种处理器架构概念,主要理念是将
    的头像 发表于 06-05 09:08 5600次阅读

    Arm首款自研AGI CPU尽显Arm能效之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

    最近,Arm 发布首款自研的数据中心 CPUArm AGI CPU,专为代理式 AI 基础设施打造,可实现单机架性能达到 x86 平台的两
    的头像 发表于 03-27 09:12 246次阅读
    <b class='flag-5'>Arm</b>首款自研AGI <b class='flag-5'>CPU</b>尽显<b class='flag-5'>Arm</b>能效之优!单线程释放强大<b class='flag-5'>性能</b>,同等机架塞更多<b class='flag-5'>CPU</b>功耗还更低

    Arm亲自下场!自研首款数据中心AGI CPU发布!

    Arm今日发布首款由 Arm 设计的数据中心 CPU——Arm AGI CPU,专为代理式 AI 基础设施打造,可实现单机架
    的头像 发表于 03-25 08:39 2988次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心AGI <b class='flag-5'>CPU</b>发布!

    NVIDIA新闻:英伟10亿美元入股诺基亚 英伟推出全新量子设备

    给大家分享一些NVIDIA新闻: 英伟10亿美元入股诺基亚 在当地时间10月28日,英伟正式
    的头像 发表于 10-29 17:12 2388次阅读

    英伟发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    英伟发布 NVQLink 开放系统架构 在华盛顿特区举行的英伟全球技术大会上,英伟
    发表于 10-29 10:33 1324次阅读

    纳微半导体助力英伟打造800 VDC电源架构

    纳微半导体正式发布专为英伟800 VDC AI工厂电源架构打造的全新100V氮化镓,650V氮化镓和高压碳化硅功率器件,以实现突破性效率、功率密度与性能表现。
    的头像 发表于 10-15 15:54 3148次阅读
    纳微半导体助力<b class='flag-5'>英伟</b><b class='flag-5'>达</b>打造800 VDC电源<b class='flag-5'>架构</b>

    今日看点:苹果认证中国快充品牌遭美调查;英伟拟向OpenAI投资最高1000亿美元

    系统建设并部署至少10吉瓦的人工智能(AI)数据中心,用于训练和运行下一代模型。这一耗电量相当于800万户美国家庭的用电量。 英伟CEO黄仁勋曾表示,10吉瓦相当于400万至500万
    发表于 09-23 10:09 502次阅读

    2天40%涨停!深圳传感器公司豪恩汽电 与英伟合作

    的飞跃。与上一代Jetson Orin相比,Jetson Thor 的 AI 计算性能提升多达 7.5 ,能效提升多达3.5 CPU性能
    的头像 发表于 08-28 19:20 3805次阅读
    2天40%涨停!深圳传感器公司豪恩汽电 与<b class='flag-5'>英伟</b><b class='flag-5'>达</b>合作

    英伟最新B30A芯片曝光:算力角逐中的新变数

    在全球AI芯片市场风云变幻之际,英伟再次成为焦点。据路透社8月19日报道,两位知情人士透露,英伟正在为中国市场开发一款基于其最新Blackwell
    的头像 发表于 08-22 16:41 1749次阅读

    英伟自研HBM基础裸片

    "后的下一代AI GPU "Feynman"。   有分析指出,英伟此举或是将部分GPU功能集成到基础裸片中,旨在提高HBM和GPU的整体性能英伟
    的头像 发表于 08-21 08:16 3018次阅读

    英伟:CUDA 已经开始移植到 RISC-V 架构

    ,着重介绍了将 CUDA 移植到 RISC-V 架构的相关工作和计划,展现了对 RISC-V 架构的高度重视与积极布局。   Frans Sijstermanns 首先回顾了英伟
    发表于 07-17 16:30 4005次阅读

    英伟拟再推中国特供GPU,今年6月量产!

    。                                                     最新消息显示,英伟拟新推出一款专门面向中国市场的人工智能芯片,且最早将于今年6月开始量产。这款芯片属于
    发表于 05-27 00:03 4894次阅读