0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达 A100 GPU 全面上市,推理性能比 CPU 快 237 倍

工程师邓生 来源:IT之家 作者:孤城 2020-11-04 15:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据英伟达官方的消息,在 AWS 运行 NVIDIA GPU 十周年之际,AWS 发布了采用全新 A100 的 Amazon EC2 P4d 实例。

IT之家了解到,现在已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU。A100 计算卡采用了 7nm 工艺的 GA100 GPU,这款 GPU 拥有 6912 CUDA 核心和 432 张量核心。GPU 封装尺寸为 826mm2,集成了 540 亿个晶体管

英伟达表示,全新的 P4d 实例,为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比,全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍,将 TF32 机器学习模型的训练的时间减少多达 6 倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘,实现了比 CPU 快 237 倍的性能。

每个 P4d 实例均内置八个 NVIDIA A100 GPU,通过 AWS UltraClusters,客户可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可扩展高性能存储,按需、可扩展地同时访问多达 4,000 多个 GPU。P4d 提供 400Gbps 网络,通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术,进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据,无需通过 CPU 和系统内存,从而确保网络的低延迟。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11219

    浏览量

    222978
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134477
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97692
  • A100
    +关注

    关注

    0

    文章

    28

    浏览量

    8107
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伟失守中国区!推理需求爆发,国产GPU抢滩上市

    电子发烧友网报道(文/莫婷婷)近日,上海证券交易所公告显示,沐曦集成电路(上海)股份有限公司(简称“沐曦”)将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐,估值已达210
    的头像 发表于 10-22 09:09 7443次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>失守中国区!<b class='flag-5'>推理</b>需求爆发,国产<b class='flag-5'>GPU</b>抢滩<b class='flag-5'>上市</b>

    堪称史上最强推理芯片!英伟发布 Rubin CPX,实现50ROI

    电子发烧友网报道(文/梁浩斌)近日,英伟在AI infra峰会上发布了专为大规模上下文推理设计的全新GPU系列Rubin CPX,性能堪称
    的头像 发表于 09-11 08:25 9679次阅读
    堪称史上最强<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>发布 Rubin CPX,实现50<b class='flag-5'>倍</b>ROI

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200
    的头像 发表于 11-20 18:11 1070次阅读

    通过NVIDIA Jetson AGX Thor实现7生成式AI性能

    Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为在边缘端加速生成式 AI 工作负载提供了新的途径。
    的头像 发表于 10-29 16:53 1060次阅读

    今日看点:苹果认证中国充品牌遭美调查;英伟拟向OpenAI投资最高1000亿美元

    系统建设并部署至少10吉瓦的人工智能(AI)数据中心,用于训练和运行下一代模型。这一耗电量相当于800万户美国家庭的用电量。 英伟CEO黄仁勋曾表示,10吉瓦相当于400万至500万块图形处理器(GPU),约等于
    发表于 09-23 10:09 298次阅读

    英伟自研HBM基础裸片

    "后的下一代AI GPU "Feynman"。   有分析指出,英伟此举或是将部分GPU功能集成到基础裸片中,旨在提高HBM和GPU的整体
    的头像 发表于 08-21 08:16 2531次阅读

    英伟Q3将发布新一代人工智能系统

    的电气机械,但是确是全面升级的一代,GB300 升级到了 Grace Blackwell Ultra 架构,而且推理性能、HBM 内存容量、网络性能都有大幅提升。
    的头像 发表于 05-19 18:02 528次阅读

    GPU 维修干货 | 英伟 GPU H100 常见故障有哪些?

    上涨,英伟H100GPU凭借其强大的算力,成为AI训练、高性能计算领域的核心硬件。然而,随着使用场景的复杂化,H100服务器故障率也逐渐攀
    的头像 发表于 05-05 09:03 2468次阅读
    <b class='flag-5'>GPU</b> 维修干货 | <b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>GPU</b> H<b class='flag-5'>100</b> 常见故障有哪些?

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代

    英伟GTC25亮点:NVIDIA Blackwell Ultra 开启 AI 推理新时代
    的头像 发表于 03-20 15:35 1225次阅读

    英伟GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理优化将
    的头像 发表于 03-20 15:03 1077次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    宣布在英伟 Grace Blackwell 平台上实现高达 30 的预期性能提升,加速下一代半导体的电路仿真   摘要: 在今年GTC主题演讲中,新思科技作为生态系统的一部分,展示
    发表于 03-19 17:59 437次阅读

    从零复现,全面开源:360 Light-R1-14B/7B带来端侧AI平权时刻

    14B开源飓风,360掀起端侧推理性能革命
    的头像 发表于 03-16 10:47 902次阅读
    从零复现,<b class='flag-5'>全面</b>开源:360 Light-R1-14B/7B带来端侧AI平权时刻

    英特尔至强6助力HPE Gen12,AI推理性能提升3

    在这个AI人工智能、HPC高性能计算飞速发展的时代,人们对于算力的渴望是空前的,无论是CPU处理器、GPU/NPU加速器,尤其是生成式AI的火爆,GPU/NPU被抬上了空前的超高地位。
    的头像 发表于 02-18 14:18 538次阅读
    英特尔至强6助力HPE Gen12,AI<b class='flag-5'>推理性能</b>提升3<b class='flag-5'>倍</b>!

    英伟A100和H100比较

    英伟A100和H100都是针对高性能计算和人工智能任务设计的GPU,但在
    的头像 发表于 02-10 17:05 1.1w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比较

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 1334次阅读
    使用NVIDIA<b class='flag-5'>推理</b>平台提高AI<b class='flag-5'>推理性能</b>