0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达 A100 GPU 全面上市,推理性能比 CPU 快 237 倍

工程师邓生 来源:IT之家 作者:孤城 2020-11-04 15:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据英伟达官方的消息,在 AWS 运行 NVIDIA GPU 十周年之际,AWS 发布了采用全新 A100 的 Amazon EC2 P4d 实例。

IT之家了解到,现在已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU。A100 计算卡采用了 7nm 工艺的 GA100 GPU,这款 GPU 拥有 6912 CUDA 核心和 432 张量核心。GPU 封装尺寸为 826mm2,集成了 540 亿个晶体管

英伟达表示,全新的 P4d 实例,为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比,全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍,将 TF32 机器学习模型的训练的时间减少多达 6 倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘,实现了比 CPU 快 237 倍的性能。

每个 P4d 实例均内置八个 NVIDIA A100 GPU,通过 AWS UltraClusters,客户可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可扩展高性能存储,按需、可扩展地同时访问多达 4,000 多个 GPU。P4d 提供 400Gbps 网络,通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术,进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据,无需通过 CPU 和系统内存,从而确保网络的低延迟。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11320

    浏览量

    225834
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5260

    浏览量

    136039
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • 英伟达
    +关注

    关注

    23

    文章

    4112

    浏览量

    99597
  • A100
    +关注

    关注

    0

    文章

    28

    浏览量

    8156
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    豪言自家芯片英伟GPU强10,这家AI公司再获融资

    的 “复仇者联盟” 正在硅谷悄然集结,他们创立的 MatX 公司刚刚完成 5 亿美元 B 轮融资,豪言要打造性能 10 倍于英伟 GPU 的专用 AI 芯片,试图在通用芯片与专用芯片
    的头像 发表于 03-01 06:41 1.2w次阅读

    英伟失守中国区!推理需求爆发,国产GPU抢滩上市

    电子发烧友网报道(文/莫婷婷)近日,上海证券交易所公告显示,沐曦集成电路(上海)股份有限公司(简称“沐曦”)将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐,估值已达210
    的头像 发表于 10-22 09:09 8536次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>失守中国区!<b class='flag-5'>推理</b>需求爆发,国产<b class='flag-5'>GPU</b>抢滩<b class='flag-5'>上市</b>

    堪称史上最强推理芯片!英伟发布 Rubin CPX,实现50ROI

    电子发烧友网报道(文/梁浩斌)近日,英伟在AI infra峰会上发布了专为大规模上下文推理设计的全新GPU系列Rubin CPX,性能堪称
    的头像 发表于 09-11 08:25 1.1w次阅读
    堪称史上最强<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>发布 Rubin CPX,实现50<b class='flag-5'>倍</b>ROI

    GPU不是AI的唯一解:英伟用Groq LPU证明,推理赛道需要“另一条腿”

    大会上,英伟CEO黄仁勋正式发布了Vera Rubin AI超级计算机平台。这一平台的问世,不仅标志着英伟战略从单一的GPU主导转向涵盖
    的头像 发表于 03-24 11:27 5991次阅读
    <b class='flag-5'>GPU</b>不是AI的唯一解:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>用Groq LPU证明,<b class='flag-5'>推理</b>赛道需要“另一条腿”

    英伟电话会看Agentic AI推理与FPGA价值

    2026年2月,英伟发布2026财年Q4财报:营收681亿美元,同比增长73%,数据中心业务增长75%——预期中的超预期。更值得关注的,是电话会中反复出现的几个关键词:Agentic AI、推理
    的头像 发表于 03-04 17:07 1252次阅读
    从<b class='flag-5'>英伟</b><b class='flag-5'>达</b>电话会看Agentic AI<b class='flag-5'>推理</b>与FPGA价值

    每块GPU对应16TB SSD,英伟KV缓存虹吸高性能TLC SSD

    作者:黄晶晶   不久前,英伟宣布其Vera Rubin平台将采用搭载BlueField-4芯片的ICMS架构,通过卸载KV Cache突破内存瓶颈、提升AI推理性能。该架构单台服务器每个G
    的头像 发表于 02-10 11:12 1.4w次阅读

    今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3

    推理深度定制的GPGPU芯片。其单芯片推理性能提升5,支持从FP16到FP8、FP6、FP4等多精度灵活切换,释放低精度推理效率,这种设计更贴合当前MoE和长上下文模型在
    发表于 01-28 11:09 1301次阅读

    又一国产GPU企业上市

    GPU企业、国内首家实现“训练+推理”通用GPU双量产的企业,天数智芯的上市标志着国产高端芯片产业迈入资本驱动与技术突破并行的关键阶段。   从技术深耕到资本进阶   天数智芯成立于2
    的头像 发表于 01-08 18:09 7041次阅读

    英伟重磅出手!AI 推理存储全面觉醒

    许可合作,将采用Groq的推理技术。   随后,Groq公司宣布已与英伟就其推理技术达成非独家许可协议。根据协议条款,Groq创始人乔纳森·罗斯(Jonathan Ross)、总裁桑
    的头像 发表于 12-26 08:44 1.2w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>重磅出手!AI <b class='flag-5'>推理</b>存储<b class='flag-5'>全面</b>觉醒

    NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 现已全面上市,将基于 NVIDIA Blackwell 架构的强大代理式与生成式 AI 能力带到更多桌面和专业用户手中。
    的头像 发表于 12-24 10:32 1080次阅读
    NVIDIA RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>现已<b class='flag-5'>全面上市</b>

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200
    的头像 发表于 11-20 18:11 1357次阅读

    通过NVIDIA Jetson AGX Thor实现7生成式AI性能

    Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为在边缘端加速生成式 AI 工作负载提供了新的途径。
    的头像 发表于 10-29 16:53 1615次阅读

    英伟自研HBM基础裸片

    "后的下一代AI GPU "Feynman"。   有分析指出,英伟此举或是将部分GPU功能集成到基础裸片中,旨在提高HBM和GPU的整体
    的头像 发表于 08-21 08:16 3004次阅读

    英伟Q3将发布新一代人工智能系统

    的电气机械,但是确是全面升级的一代,GB300 升级到了 Grace Blackwell Ultra 架构,而且推理性能、HBM 内存容量、网络性能都有大幅提升。
    的头像 发表于 05-19 18:02 748次阅读

    GPU 维修干货 | 英伟 GPU H100 常见故障有哪些?

    上涨,英伟H100GPU凭借其强大的算力,成为AI训练、高性能计算领域的核心硬件。然而,随着使用场景的复杂化,H100服务器故障率也逐渐攀
    的头像 发表于 05-05 09:03 3340次阅读
    <b class='flag-5'>GPU</b> 维修干货 | <b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>GPU</b> H<b class='flag-5'>100</b> 常见故障有哪些?