创作

完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>

3天内不再提示

NVIDIA Grace CPU超级芯片大幅加速现代化工作负载

NVIDIA_China 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-05-25 11:02 次阅读

华硕、富士康工业互联网、技嘉科技、云达科技、超微、纬颖等公司将提供用于数字孪生、 AI、高性能计算、云图形和游戏的全新数据中心系统

NVIDIA 于今日宣布,多家领先的计算机制造商将发布首批基于 NVIDIA Grace CPU 超级芯片和 Grace Hopper 超级芯片的系统,这些系统将用于数字孪生、 AI、HPC、云图形和游戏等各类工作负载。

预计从 2023 年上半年开始,华硕、富士康工业互联网、技嘉科技、云达科技、超微和纬颖将陆续推出几十款服务器。基于 Grace 的系统将与 x86 和其他基于 Arm 的服务器一同为客户提供广泛的选择空间,助力其数据中心实现高性能和高效率。

NVIDIA 超大规模和 HPC 副总裁 Ian Buck 表示:“现在有一种新型数据中心正在兴起,即通过处理和挖掘海量数据来实现智能的´ AI 工厂´。NVIDIA 正在与合作伙伴联手打造助推这一转变的系统。基于 NVIDIA Grace 超级芯片的新系统将为全球新市场和行业注入加速计算的力量。”

即将推出的服务器基于采用 Grace CPU 超级芯片和 Grace Hopper 超级芯片的四类全新系统设计。Grace CPU 超级芯片和 Grace Hopper 超级芯片是 NVIDIA 在最近两场 GTC 大会上发布的。2U 外形设计为原始设计制造商和原始设备制造商提供了蓝图和服务器底板,助力其将适用于 NVIDIA CGX 云游戏、 NVIDIA OVX 数字孪生、 NVIDIA HGX AI 和 HPC 平台的系统快速推向市场。

大幅加速现代化工作负载

上述两种 NVIDIA Grace 超级芯片技术支持多种系统架构中的各类计算密集型工作负载。

Grace CPU 超级芯片搭载两块通过 NVLink-C2C 互连技术连接的 CPU 芯片,内置多达 144 个高性能 Arm V9 核心,并且带有可伸缩矢量扩展和每秒 1 TB 的内存子系统。这一开创性的设计可实现最高的性能,并且内存带宽和能效两倍于当今领先的服务器处理器,可满足要求最为严苛的 HPC、数据分析、数字孪生、云游戏和超大规模计算应用。

Grace Hopper 超级芯片在一个集成模块中,通过 NVLink-C2C 将 NVIDIA Hopper GPU 与 Grace CPU 互联,可满足 HPC 和超大规模 AI 应用的需求。借助 NVLink-C2C 互连技术, Grace CPU 向 Hopper GPU 的数据传输速度比传统 CPU 提升 15 倍。

广泛的 Grace 服务器产品组合适用于 AI、 HPC、数字孪生和云游戏

Grace CPU 超级芯片和 Grace Hopper 超级芯片服务器设计组合包括单路、双路和四路配置的单底板系统,服务器制造商可根据客户需求,为这些系统自定义四种专用于特定工作负载的设计:

NVIDIA HGX Grace Hopper 系统:用于 AI 训练、推理和 HPC,搭载 Grace Hopper 超级芯片和 NVIDIA BlueField-3 DPU。

NVIDIA HGX Grace 系统:用于 HPC 和超级计算,采用纯 CPU 设计,搭载 Grace CPU 超级芯片和 BlueField-3。

NVIDIA OVX 系统:用于数字孪生和协作式工作负载,搭载 Grace CPU 超级芯片、 BlueField-3 和 NVIDIA GPU。

NVIDIA CGX 系统:用于云图形和游戏,搭载 Grace CPU 超级芯片、 BlueField-3 和 NVIDIA A16 GPU。

NVIDIA 正在扩展 NVIDIA 认证系统计划,以涵盖采用 NVIDIA Grace CPU 超级芯片和 Grace Hopper 超级芯片的服务器以及 X86 CPU。预计首批 OEM 服务器认证将在合作伙伴系统出货后不久完成。

软件支持

Grace 服务器产品组合针对 NVIDIA 丰富的计算软件堆栈进行了优化,包括 NVIDIA HPC、 NVIDIA AI、 Omniverse 和 NVIDIA RTX。

原文标题:多家领先厂商采用全球首批基于 NVIDIA Grace CPU 的系统设计

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红
  • cpu
    cpu
    +关注

    关注

    68

    文章

    6779

    浏览量

    193049
  • NVIDIA
    +关注

    关注

    14

    文章

    2563

    浏览量

    94723
  • 服务器
    +关注

    关注

    10

    文章

    4389

    浏览量

    75758

原文标题:多家领先厂商采用全球首批基于 NVIDIA Grace CPU 的系统设计

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    从SmartNIC走向DPU,专用加速器的崛起

    在计算架构和负载变得愈发复杂和多样的情况下,处理器厂商纷纷开始了自己的造词之路。要想体现产品定位,又....
    的头像 E4Life 发表于 06-25 01:17 672次 阅读
    从SmartNIC走向DPU,专用加速器的崛起

    龙芯中科首次公开发行股票并在科创板上市

    2022年6月24日,龙芯中科技术股份有限公司首次公开发行股票并在科创板上市(股票代码688047)....
    的头像 科技绿洲 发表于 06-24 17:08 356次 阅读

    IEEE标准推进工业4.0的五种方式

      毫无疑问,TSN 标准是承诺工业 4.0 及其将改变的许多应用的关键基础构件——引领下一代技术彻....
    的头像 星星科技指导员 发表于 06-24 16:00 337次 阅读

    NVIDIA Riva 2.0的功能亮点有哪些

    NVIDIA Riva 可提供经过全面优化的流程,用于部署实时 AI 语音应用(例如转录和虚拟助理)....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-24 15:33 114次 阅读

    艺术家使用NVIDIA Omniverse创造出照明效果逼真的3D模型

    创意人员使用 Autodesk、Adobe Substance 3D 应用和 NVIDIA Omni....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-24 15:27 70次 阅读

    使用AI技术推动精准医疗的发展

    来自英国的 NVIDIA 初创加速计划成员 PrecisionLife 使用 AI 主导的数据分析确....
    的头像 NVIDIA英伟达 发表于 06-24 15:21 283次 阅读

    NLP的工作原理是什么 有哪些用例

    自然语言处理是一项利用计算机和软件获取人类语言(书面或口语)含义的技术。
    的头像 NVIDIA英伟达 发表于 06-24 15:19 59次 阅读

    NVIDIA DOCA数据处理器软件正式开放

    NVIDIA 联合发起 Linux 基金会项目,致力于实现数据中心创新的大众化;进一步向软件提供商、....
    的头像 NVIDIA英伟达 发表于 06-24 15:00 73次 阅读

    TYAN在1U封装中包含大量性能

    这是一个 1U 服务器,采用单插槽 Intel Xeon E-2200 微处理器设计。作为基于边缘的....
    的头像 星星科技指导员 发表于 06-24 14:57 79次 阅读

    5G移动网络边缘部署应用服务器

      MEC是5G网络拓扑皇冠上的皇冠上的明珠。激励措施是真实的,新的商业模式和收入流是一个巨大的驱动....
    的头像 星星科技指导员 发表于 06-24 14:33 123次 阅读

    曙光StackCube-K超融合云平台助力用户打造特色政务服务

    滚滚湘江水,悠悠进取心。左脚根植于井冈山革命根据地,右脚立足在数字化发展的潮头,湖南省某县自然资源局....
    的头像 科技绿洲 发表于 06-24 14:23 109次 阅读

    如何将物联网领域的许多技术组合在一起

      远程控制锁需要一个马达来移动锁舌。此任务通常使用 BLDC 电机和相关的控制电路来完成。电机控制....
    的头像 星星科技指导员 发表于 06-24 14:23 126次 阅读

    龙芯中科首次公开发行股票并在科创板上市

    2022年6月24日,龙芯中科技术股份有限公司首次公开发行股票并在科创板上市(股票代码688047)....
    的头像 龙芯中科 发表于 06-24 11:36 195次 阅读

    Linux内存背后的那些事儿

    当要学习一个新知识点时,比较好的过程是先理解出现这个技术点的背景原因,同期其他解决方案,新技术点解决....
    的头像 一口Linux 发表于 06-24 11:35 161次 阅读

    WeTest-Assistant手机端辅助测试工具

    ./oschina_soft/WeTest-Assistant.zip
    发表于 06-24 11:28 7次 阅读
    WeTest-Assistant手机端辅助测试工具

    低功耗蓝牙在低功耗设计中的应用

      随着4.0版本支持的低功耗蓝牙(BLE)的出现,由于消费市场对低能耗和低功耗的需求(BLE由Bl....
    的头像 星星科技指导员 发表于 06-24 11:26 122次 阅读
    低功耗蓝牙在低功耗设计中的应用

    NVIDIA DRIVE助力小马智行控制器大规模量产

    6 月 22 日,领先自动驾驶企业小马智行宣布正式对客户交付基于 NVIDIA DRIVE Hype....
    的头像 科技绿洲 发表于 06-24 10:50 678次 阅读

    NVIDIA DOCA库API已向开发者公开提供

    本周,NVIDIA 成为 Linux 基金会开放可编程基础设施(OPI – Open Program....
    的头像 科技绿洲 发表于 06-24 10:38 239次 阅读

    FXDanmaku高性能弹幕库

    ./oschina_soft/FXDanmaku.zip
    发表于 06-24 10:17 6次 阅读
    FXDanmaku高性能弹幕库

    边缘的超低功耗关键短语检测

      BNN 可以检测多达十个 1 秒的关键短语,非常适合通过语音进行 HMI。为了提高检测精度,仅在....
    的头像 星星科技指导员 发表于 06-24 10:09 262次 阅读
    边缘的超低功耗关键短语检测

    为什么有些CPU的主频更低,但运算效率却更高呢?

    汽车装配需要冲压、焊接、涂装和总装四个工人,最简单的方法是一辆汽车依次经过上述四个步骤装配完成之后,....
    的头像 strongerHuang 发表于 06-24 09:41 87次 阅读

    网络时钟安装及调试的详细说明

    针对于各大医院里的医疗设备及医生办公设备的时间需要统一,在医院内提供一套可靠、经济和有效,能够提供一....
    的头像 syn029 发表于 06-24 09:11 126次 阅读

    免费vps试用7天和免费vps试用30天有何区别

    我们在租用vps的时候,经常会发现很多主机商比如恒讯科技会提供3-30天不等的免费vps试用机会,其....
    的头像 深圳市恒讯科技有限公司 发表于 06-23 16:06 41次 阅读

    Robox安卓容器的构建编译过程和使用方法

    随着云计算相关产业蓬勃发展,用户对移动设备的弹性需求推动出云手机、云游戏等概念,云手机和云游戏就是将....
    的头像 安芯教育科技 发表于 06-23 15:51 147次 阅读

    使用嵌入式802.11ax将Wi-Fi扩展到物联网

      该紧凑型解决方案可针对单芯片交钥匙 Wi-Fi 接口,如果您需要这种灵活性,您可以在本地或主机处....
    的头像 星星科技指导员 发表于 06-23 15:41 92次 阅读

    MIPS LTE/5G调制解调器解决方案

      LTE 和 5G 定义了丰富的功能集和各种需要低延迟、高可靠性和安全功能的独特组合的应用。安全性....
    的头像 星星科技指导员 发表于 06-23 15:29 175次 阅读

    Linux用电功耗调优的笔记分享

    整理一些Linux用电功耗调优的笔记,分享给小伙伴,关于用电调优个人觉得
    的头像 一口Linux 发表于 06-23 15:19 242次 阅读

    NVIDIA RTX GPU产品能够支持4K大屏渲染和扩展内容渲染

    此前,七维科技帮助河南广播电视台完成了演播室改造项目,打造了 XR 沉浸式 4K 超高清演播室。这一....
    的头像 科技绿洲 发表于 06-23 15:11 195次 阅读

    NVIDIA正在建造一台AI超级计算机来驱动地球的数字孪生

    元宇宙是互联网向 3D 网络进化过程中的下一个重要阶段,将为娱乐、汽车、制造业、机器人等各个行业带来....
    的头像 科技绿洲 发表于 06-23 15:06 215次 阅读

    NVIDIA 3D MoMa技术可为虚拟爵士乐队调校乐器

    爵士乐的精髓在于即兴演奏, NVIDIA 正在通过 AI 研究向这一流派致敬。也许有一天,图形创作者....
    的头像 科技绿洲 发表于 06-23 14:53 172次 阅读

    麒麟软件与openEuler社区合作打造行业应用标杆案例

    首届“华为伙伴暨开发者大会”于6月在线召开,华为公司副总裁、计算产品线总裁邓泰华发表“共建计算产业,....
    的头像 科技绿洲 发表于 06-23 14:37 206次 阅读

    NVIDIA RTX A6000助力实现高效渲染输出高质量画面

    电视演播室作为电视节目制作的重要场所,承担了除外拍节目外的大部分节目录制和制作任务,随着设备技术突飞....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-23 12:06 162次 阅读

    NVIDIA在自动驾驶领域取得的新突破

    此前,NVIDIA 中国区软件解决方案总监卓睿代表 NVIDIA 参加了视频采访,针对 NVIDIA....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-23 12:03 552次 阅读

    液冷散热的方式有哪些 液体冷却的优点与误区

    随着计算能力和性能需求的提高,AI人工智能、物联网和机器学习等技术进步,数据中心基础设施和IT设备的....
    的头像 GPU视觉识别 发表于 06-23 11:58 201次 阅读

    基于S7-300400 CPU集成PN接口的Modbus TCP在TIA Portal的使用入门

    Modbus数据在TCP/IP以太网上传输,支持Ethernet II和802.3两种帧格式,Mod....
    的头像 机器人及PLC自动化应用 发表于 06-23 11:14 163次 阅读

    NVIDIA如何以最好的方式来构建元宇宙

    元宇宙是互联网向 3D 网络进化过程中的下一个重要阶段,将为娱乐、汽车、制造业、机器人等各个行业带来....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-23 11:13 157次 阅读

    视频质量网络测试改善用户体验

      VQ 测试工具与来自人类视觉 VQ 调查等测试场景的最终用户反馈相结合,可以帮助企业提高视频会议....
    的头像 星星科技指导员 发表于 06-23 11:06 149次 阅读
    视频质量网络测试改善用户体验

    NVIDIA 3D MoMa:基于2D图像创建3D物体

    可逆渲染流程 NVIDIA 3D MoMa 将于本周在新奥尔良举行的计算机视觉和模式识别会议 CVP....
    的头像 NVIDIA英伟达企业解决方案 发表于 06-23 11:00 165次 阅读

    网络和x86处理器在嵌入式网络应用中协同工作

      许多网络和安全产品都非常适合这种异构多核设计,它提供一流的 x86 处理和新的状态流处理。流和活....
    的头像 星星科技指导员 发表于 06-23 10:34 123次 阅读
    网络和x86处理器在嵌入式网络应用中协同工作

    如何在腾讯云上创建SR1云实例

    腾讯 CVM 标准型 SR1 是腾讯云推出的首款搭载 ARM 架构处理器的新一代 CVM 标准型计算....
    的头像 安晟培半导体 发表于 06-23 10:31 134次 阅读

    ArrayFire图形处理器通用加速库

    ./oschina_soft/arrayfire.zip
    发表于 06-23 10:28 5次 阅读
    ArrayFire图形处理器通用加速库

    基于云的M2M管理的竞争优势

      端到端 M2M 管理服务为具有 M2M 部署的公司提供了一种可行的、经过验证的解决方案,该解决方....
    的头像 星星科技指导员 发表于 06-23 10:25 100次 阅读
    基于云的M2M管理的竞争优势

    设计人员在实施M2M功能时面临的挑战

      虽然 M2M 开发人员可以轻松编写自己的服务例程并通过简单的系统调用从程序中访问它们,但 And....
    的头像 星星科技指导员 发表于 06-23 10:22 97次 阅读
    设计人员在实施M2M功能时面临的挑战

    mongols C++服务器基础设施

    ./oschina_soft/mongols.zip
    发表于 06-23 10:15 4次 阅读
    mongols C++服务器基础设施

    基于Cocos2d-X 3.17与cocostudio V3.10开发的单机麻将游戏

    ./oschina_soft/gitee-cocostudio-mahjong.zip
    发表于 06-23 10:06 4次 阅读
    基于Cocos2d-X 3.17与cocostudio V3.10开发的单机麻将游戏

    嵌入式虚拟化解决多操作系统的确定性问题

      嵌入式虚拟化技术已经在实时应用程序中使用了十多年,但是随着包括越来越多 CPU 内核的处理器的出....
    的头像 星星科技指导员 发表于 06-22 17:22 243次 阅读
    嵌入式虚拟化解决多操作系统的确定性问题

    直播视频流服务器解决方案简介

    由于全球流媒体规模,到2025年,全球视频流媒体行业预计将达到每年 1245.7 亿美元。平均消费者....
    的头像 深圳市恒讯科技有限公司 发表于 06-22 16:39 158次 阅读

    具有固定优先级调度程序RTOS的优先级倒置

      优先级继承并不能真正治愈优先级倒置,它只是在某些情况下将其影响最小化。硬实时应用程序仍应仔细设计....
    的头像 星星科技指导员 发表于 06-22 15:45 154次 阅读
    具有固定优先级调度程序RTOS的优先级倒置

    小马智行自研自动驾驶域控制器ADC已开始向用户交付样品

    小马智行将成为首批基于NVIDIA DRIVE Hyperion 计算架构及DRIVE Orin 系....
    的头像 Pony.ai小马智行 发表于 06-22 15:22 131次 阅读

    物理机服务器有什么用?

    首先我们先了解物理机是由什么部分组成:主板、内存、硬盘、阵列卡、电源、网卡、风扇。tg@CDNJSFY 另外物理机服务器有几...
    发表于 06-22 10:16 833次 阅读
    物理机服务器有什么用?

    基于RK3399 CPU上电后加载程序的流程介绍

    1、CPU上电后加载程序的流程 芯片上电解复位之后执行的第一段程序,在芯片中称之为Bootrom loader。这部分程序在芯片制造过...
    发表于 06-21 15:28 2136次 阅读

    哪些进程会占用我们过多的内存和CPU信息呢?如何查看呢

    在中,当服务的内存占用过多或者在使用时,会经常伴随着 cpu 的处理测试慢变或者无响应,这个时候我们排在服务器进程中占用的启动...
    发表于 06-20 18:12 1754次 阅读

    【资料分享】PISTORM for COMMODORE AMIGA(68000 CPU 替代品)

    描述 PISTORM for COMMODORE AMIGA(68000 CPU 替代品) 4层PCB 项目信息: PiStorm ...
    发表于 06-17 09:41 136次 阅读

    介绍在ARM64架构下启动多核的两种方式

    1、ARM64的多核启动流程分析工作中遇到的多核 ARM CPU 越来越多,总结分享一些多核启动的知识,希望能帮助更多小伙伴。...
    发表于 06-13 18:23 1486次 阅读

    AHB总线传输的时序图分析

    1、AHB传输的时序图分析 正文1: AHB章节最后再复习一遍多主机的概念: 总线是被总线上所有的部件所共享的一组通路(连...
    发表于 06-09 17:45 2097次 阅读

    详解CPU boot的过程

    上次我们聊到将C code 通过工具链编译成机器码,今天这篇和大家介绍CPU boot的过程。对此我们先看下一个哈弗结构的CPU的框...
    发表于 06-08 17:51 804次 阅读

    多核处理器启动的基本原理是什么?如何实现呢

    在早些年前,一个中央处理器(CPU)里面只有一个处理器核(Core)。那时候CPU的性能提升主要靠的是提升处理器工作主频。定...
    发表于 06-07 16:41 2014次 阅读

    在AMD CPU的Windows电脑下,启动模拟器失败无法安装GVM怎么解决?

    在AMD CPU的Windows电脑下,启动模拟器失败,提示“Unable to install GVM.”,无法安装GVM。 ...
    发表于 06-07 10:13 426次 阅读

    ARM64 SMP多核启动相关资料推荐(上)

    1、cpu启动的一些概念1)cpu启动的含义:cpu可以从内存中取指、译码、执行,当然内存可以是soc片内的sram,也可以是ddr。2)我们要...
    发表于 06-06 17:05 3289次 阅读

    TMS320VC5501 定点数字信号处理器

    TMS320VC5501(5501)定点数字信号处理器(DSP)基于TMS320C55x™DSP生成CPU处理器内核。 C55x™DSP架构通过增加并行性和全面关注降低功耗来实现高性能和低功耗。 CPU支持内部总线结构,该结构由一个程序总线,三个数据读总线,两个数据写总线以及专用于外设和DMA活动的附加总线组成。这些总线能够在一个周期内执行最多三次数据读取和两次数据写入。并行,DMA控制器可以独立于CPU活动执行数据传输。 C55x™CPU提供两个乘法累加(MAC)单元,每个单元能够进行17位×17位乘法运算。单循环。额外的16位ALU支持中央40位算术/逻辑单元(ALU)。 ALU的使用受指令集控制,提供优化并行活动和功耗的能力。这些资源在C55x CPU的地址单元(AU)和数据单元(DU)中进行管理。 C55x DSP代支持可变字节宽度指令集,以提高代码密度。指令单元(IU)从内部或外部存储器执行32位程序提取,并为程序单元(PU)排队指令。程序单元解码指令,将任务指向AU和DU资源,并管理完全受保护的管道。预测分支功能可避免执行条件指令时的管道刷新。 5501外设...
    发表于 10-09 14:55 499次 阅读
    TMS320VC5501 定点数字信号处理器