根据英伟达官方的消息,在 AWS 运行 NVIDIA GPU 十周年之际,AWS 发布了采用全新 A100 的 Amazon EC2 P4d 实例。
IT之家了解到,现在已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU。A100 计算卡采用了 7nm 工艺的 GA100 GPU,这款 GPU 拥有 6912 CUDA 核心和 432 张量核心。GPU 封装尺寸为 826mm2,集成了 540 亿个晶体管。
英伟达表示,全新的 P4d 实例,为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比,全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍,将 TF32 机器学习模型的训练的时间减少多达 6 倍。
这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘,实现了比 CPU 快 237 倍的性能。
每个 P4d 实例均内置八个 NVIDIA A100 GPU,通过 AWS UltraClusters,客户可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可扩展高性能存储,按需、可扩展地同时访问多达 4,000 多个 GPU。P4d 提供 400Gbps 网络,通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术,进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据,无需通过 CPU 和系统内存,从而确保网络的低延迟。
责任编辑:PSY
-
cpu
+关注
关注
68文章
11320浏览量
225834 -
gpu
+关注
关注
28文章
5260浏览量
136039 -
机器学习
+关注
关注
67文章
8561浏览量
137208 -
英伟达
+关注
关注
23文章
4112浏览量
99597 -
A100
+关注
关注
0文章
28浏览量
8156
发布评论请先 登录
豪言自家芯片比英伟达GPU强10倍,这家AI公司再获融资
英伟达失守中国区!推理需求爆发,国产GPU抢滩上市
堪称史上最强推理芯片!英伟达发布 Rubin CPX,实现50倍ROI
GPU不是AI的唯一解:英伟达用Groq LPU证明,推理赛道需要“另一条腿”
从英伟达电话会看Agentic AI推理与FPGA价值
每块GPU对应16TB SSD,英伟达KV缓存虹吸高性能TLC SSD
今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3
又一国产GPU企业上市
英伟达重磅出手!AI 推理存储全面觉醒
NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市
英伟达 Q3 狂揽 308 亿
通过NVIDIA Jetson AGX Thor实现7倍生成式AI性能
传英伟达自研HBM基础裸片
英伟达Q3将发布新一代人工智能系统
GPU 维修干货 | 英伟达 GPU H100 常见故障有哪些?
英伟达 A100 GPU 全面上市,推理性能比 CPU 快 237 倍
评论