首页
技术

可编程逻辑

MEMS/传感技术

嵌入式技术

模拟技术

控制/MCU

处理器/DSP

存储技术

EMC/EMI设计

电源/新能源

测量仪表

制造/封装

RF/无线

接口/总线/驱动

EDA/IC设计

光电显示

连接器

PCB设计

LEDs

汽车电子

医疗电子

人工智能

可穿戴设备

军用/航空电子

工业控制

触控感测

智能电网

音视频及家电

通信网络

机器人

vr|ar|虚拟现实

安全设备/系统

移动通信

便携设备

物联网

区块链

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充电桩

氮化镓

BLDC

逆变器

5G

电机控制
资源

技术文库

新品速递

电路图

元器件知识

电子百科

最新技术文章

元器件搜索引擎
下载

在线工具

常用软件

电子书

datasheet
专栏

电子说

专栏
社区

论坛

问答

小组

技术专栏

社区之星

试用中心

HarmonyOS技术社区

2023电子工程师大会
研究院
活动

设计大赛

硬创大赛

社区活动

线下会议

在线研讨会

小测验
学院

直播

课程
视频
企业号
工具

datasheet查询

免费评测试用

技术子站

搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

英伟达 A100 GPU 全面上市，推理性能比 CPU 快 237 倍

根据英伟达官方的消息，在 AWS 运行 NVIDIA GPU 十周年之际，AWS 发布了采用全新 A100 的 Amazon EC2 P4d 实例。

IT之家了解到，现在已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU。A100 计算卡采用了 7nm 工艺的 GA100 GPU，这款 GPU 拥有 6912 CUDA 核心和 432 张量核心。GPU 封装尺寸为 826mm2，集成了 540 亿个晶体管。

英伟达表示，全新的 P4d 实例，为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比，全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍，将 TF32 机器学习模型的训练的时间减少多达 6 倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘，实现了比 CPU 快 237 倍的性能。

每个 P4d 实例均内置八个 NVIDIA A100 GPU，通过 AWS UltraClusters，客户可以利用 AWS 的 Elastic Fabric Adapter（EFA）和 Amazon FSx 提供的可扩展高性能存储，按需、可扩展地同时访问多达 4，000 多个 GPU。P4d 提供 400Gbps 网络，通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术，进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据，无需通过 CPU 和系统内存，从而确保网络的低延迟。

责任编辑：PSY

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cpu

cpu

+关注

关注
68

文章
11320

浏览量
225834
gpu

gpu

+关注

关注
28

文章
5260

浏览量
136039
机器学习

机器学习

+关注

关注
67

文章
8561

浏览量
137208
英伟达

英伟达

+关注

关注
23

文章
4112

浏览量
99597
A100

A100

+关注

关注
0

文章
28

浏览量
8156

评论

精选推荐
更多

文章

资料

帖子

芯自主・板可靠：视美泰国产化主板，ARM 架构 + 瑞芯微芯片+国产操作系统领跑信创落地

视美泰
17小时前

1279 阅读

精准触控+压感“芯”体验！汇顶发布全新Newton Touchpad压力触控板方案

章鹰观察
16小时前

2710 阅读

瑞芯微(EASY EAI)RV1126B 应用依赖库安装

广州灵眸科技有限公司
18小时前

1043 阅读

MPS MP9566芯片式固态继电器与机械继电器的技术比较

MPS芯源系统
18小时前

1140 阅读

瑞萨RA系列FSP库开发实战指南之使用GPT基本定时功能实验

瑞萨嵌入式小百科
18小时前

1144 阅读

T7024,pdf (Bluetooth/ISM 2.4-G

人走了
433

10积分

169下载

RePlugin灵活稳定的插件化方案

吴凡
7.70 MB

免费

0下载

aliyunDDns定时更新域名IP

龙献益
0.88 MB

免费

0下载

Skyperious Skype数据库查看和合并工具

一刀两断
8.23 MB

2积分

5下载

基于CD4047的DC到AC逆变器 PCB设计板

刘刚
0.02 MB

3积分

20下载

【RA-Eco-RA4M2开发板评测】+ 导航键模块及其性能测试

jinglixixi
1天前

3 阅读

《电子发烧友电子设计周报》聚焦硬科技领域核心价值 26年第7期：2026.3.30--2025.4.15

电子人steve
4天前

670 阅读

从零开始学硬件 <3>demo源码1.OceanOS-CM0-B1解读

jf_28912132
6天前

1910 阅读

从零开始学硬件 <4>demo源码2.OceanOS-CM0-B2解读

jf_28912132
6天前

1897 阅读

【飞凌嵌入式T153开发板+初体验】

jf_12220034
7天前

2487 阅读

推荐专栏
更多

企业产品

资料

方案
更多

电子发烧友

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

电子发烧友

关于我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

张迎辉：mikezhang@elecfans.com

关注我们的微信

下载发烧友APP

机器人发烧友

版权所有 © 长沙勒克斯教育咨询有限公司

湖南省长沙市开福区月湖街道匍园路20号聚恒科技园1栋2301-1房
电子发烧友 （电路图） 电信与信息服务业务经营许可证：湘B2-20260003 湘ICP备2023036445号-105-1