0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达 A100 GPU 全面上市,推理性能比 CPU 快 237 倍

工程师邓生 来源:IT之家 作者:孤城 2020-11-04 15:34 次阅读

根据英伟达官方的消息,在 AWS 运行 NVIDIA GPU 十周年之际,AWS 发布了采用全新 A100 的 Amazon EC2 P4d 实例。

IT之家了解到,现在已全面上市的全新 AWS P4d 实例采用最新 NVIDIA A100 Tensor Core GPU。A100 计算卡采用了 7nm 工艺的 GA100 GPU,这款 GPU 拥有 6912 CUDA 核心和 432 张量核心。GPU 封装尺寸为 826mm2,集成了 540 亿个晶体管

英伟达表示,全新的 P4d 实例,为机器学习训练和高性能计算应用提供 AWS 上性能与成本效益最高的 GPU 平台。与默认的 FP32 精度相比,全新实例将 FP16 机器学习模型的训练时间减少多达 3 倍,将 TF32 机器学习模型的训练的时间减少多达 6 倍。

这些实例还提供出色的推理性能。NVIDIA A100 GPU 在最近的 MLPerf Inference 基准测试中一骑绝尘,实现了比 CPU 快 237 倍的性能。

每个 P4d 实例均内置八个 NVIDIA A100 GPU,通过 AWS UltraClusters,客户可以利用 AWS 的 Elastic Fabric Adapter(EFA)和 Amazon FSx 提供的可扩展高性能存储,按需、可扩展地同时访问多达 4,000 多个 GPU。P4d 提供 400Gbps 网络,通过使用 NVLink、NVSwitch、NCCL 和 GPUDirect RDMA 等 NVIDIA 技术,进一步加速深度学习训练的工作负载。EFA 上的 NVIDIA GPUDirect RDMA 在服务器之间可通过 GPU 传输数据,无需通过 CPU 和系统内存,从而确保网络的低延迟。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206546
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126683
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130556
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87764
  • A100
    +关注

    关注

    0

    文章

    27

    浏览量

    7592
收藏 人收藏

    评论

    相关推荐

    Nvidia 通过开源库提升 LLM 推理性能

    加利福尼亚州圣克拉拉——Nvidia通过一个名为TensorRT LLM的新开源软件库,将其H100A100和L4 GPU的大型语言模型(LLM)推理性能提高了一倍。 正如对相同硬件
    的头像 发表于 10-23 16:10 324次阅读

    求助,为什么将不同的权重应用于模型会影响推理性能

    生成两个 IR文件(相同的 .xml 文件,但不同的 .bin 文件) 具有不同重量的类似模型,以不同的 fps (27fps 和 6fps) 运行 更多样化的权重是否会影响 Myriad X 上的推理性能
    发表于 08-15 07:00

    如何提高YOLOv4模型的推理性能

    使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。 将 权重转换为 ONNX 文件,然后转换为中间表示 (IR)。 无法确定如何获得更好的推理性能
    发表于 08-15 06:58

    英伟a100和h100哪个强?英伟A100和H100的区别

    基于Ampere架构的GPU计算加速器,专为高性能计算、人工智能和机器学习等领域而设计。它拥有高达6912个CUDA核心(在32GB版本中),是目前最强大的数据中心GPU之一。A100
    的头像 发表于 08-09 17:31 3.6w次阅读

    英伟A100的算力是多少?

    ,但 A100 的算力是前者的 20 倍。 A100英伟达推出的一款强大的数据中心GPU,采用全新的Ampere架构。它拥有高达6,912个CUDA核心和40GB的高速HBM2显存。
    的头像 发表于 08-08 15:28 2.4w次阅读

    英伟A100的优势分析

    HBM2显存。 英伟A100是一款高性能GPU,其主要优势如下: 1. 支持高效的AI计算:A100采用了新一代的Tensor Core
    的头像 发表于 08-08 15:25 2659次阅读

    英伟A100的简介

    A100英伟达公司推出的一款面向高性能计算(HPC)和人工智能(AI)的加速计算卡。它采用了全球首个基于7nm工艺的数据中心GPU架构Ampere,拥有6912个CUDA核心和43
    的头像 发表于 08-08 15:17 7606次阅读

    英伟A100是什么系列?

    被暴抢。 英伟A100英伟达推出的一款数据中心GPU系列,采用了全新的Ampere架构。它是一款专为深度学习、科学计算、超级计算等工作负载设计的高
    的头像 发表于 08-08 15:13 2229次阅读

    英伟A100和A40的对比

    TFLOPS的FP32浮点性能和156 TFLOPS的深度学习性能英伟A100和A40是英伟达公司推出的两个数据中心加速器。它们都是
    的头像 发表于 08-08 15:08 1.3w次阅读

    英伟A100和4090的区别

    英伟A100和4090的区别 英伟A100和4090都是英伟达的高性能计算卡型号。它们之间的
    的头像 发表于 08-08 11:59 2.5w次阅读

    英伟A100和V100参数对比

    英伟A100这个AI芯片怎么样?英伟A100是一款基于英伟达Ampere架构的高性能计算卡,
    的头像 发表于 08-08 11:54 9295次阅读
    <b class='flag-5'>英伟</b>达<b class='flag-5'>A100</b>和V<b class='flag-5'>100</b>参数对比

    英伟A100和3090的区别

    英伟A100和3090的区别 英伟A100是一款面向数据中心的计算加速器,其主要优势是支持数据中心最新的AI、机器学习和高性能计算工作负
    的头像 发表于 08-07 18:54 2868次阅读

    英伟A100和H100的区别

    英伟A100和H100的区别 英伟A100和H100是两种不同的产品。
    的头像 发表于 08-07 18:06 2.4w次阅读

    英伟a100和a800的区别

    英伟a100和a800的区别 英伟A100和A800是两种不同的产品, 主要区别如下: 1. 架构不同:A100使用Ampere架构,A
    的头像 发表于 08-07 17:57 3.2w次阅读

    英伟a100和h100哪个强?

    版本制程(4N)打造,单块芯片包含 800 亿晶体管。 A100都是非常强大的GPUA100配备高达6,912个CUDA核心,A100英伟
    的头像 发表于 08-07 17:32 1.1w次阅读