540亿个晶体管、单节点5 PFlops AI算力、第三代Tensor Core核心 技术、全新TF32精度、AI训练和推理性能提高20倍!
NVIDIA于上周携20多项重磅消息带来了GTC 2020主题演讲, 并发布了首款基于NVIDIA Ampere架构的GPU ——NVIDIA A100 GPU。它采用了NVIDIA Ampere架构的突破性设计,该设计为NVIDIA第八代GPU提供了迄今为止最大的性能升级,集AI训练和推理于一身,并且其性能相比于前代产品提升了高达20倍,将HPC性能提升到上一代的2.5倍。
同时,也发布了全球最先进的AI系统——NVIDIA DGX A100系统,单节点AI算力达到创纪录的5 PFLOPS,5个DGX A100系统组成的一个机架,算力可媲美一个AI数据中心。以及发布了全球超强大的AI和HPC服务器平台HGX A100,最大可组成AI算力达10 PFLOPS的超大型服务器。
以及众多技术更新,如多实例GPU (MIG)、结构化稀疏、第三代NVLink和NVSwitch、TF32精度,还有能帮助HPC开发人员调试和优化A100代码的NVIDIA HPC SDK等,众多创新技术都受到了广泛关注。可以说Ampere 架构和A100 GPU是面向HPC和AI领域划时代的升级。
-
NVIDIA
+关注
关注
14文章
5725浏览量
110284 -
数据中心
+关注
关注
18文章
5842浏览量
75251 -
AI
+关注
关注
91文章
41964浏览量
303059
原文标题:NVIDIA全新Ampere GPU架构公开课 | 深度解析面向HPC和AI迄今最大的性能飞跃
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
NVIDIA与Google Cloud携手推进代理式与物理AI发展
NVIDIA向Kubernetes社区捐赠动态资源分配GPU驱动程序
借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程
NVIDIA RTX PRO 5000 Blackwell GPU的深度评测
NVIDIA RTX PRO 4000 Blackwell GPU性能测试
NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市
在Python中借助NVIDIA CUDA Tile简化GPU编程
NVIDIA RTX PRO 2000 Blackwell GPU性能测试
NVIDIA推出NVQLink高速互连架构
NVIDIA Isaac Lab多GPU多节点训练指南
NVIDIA RTX PRO 4500 Blackwell GPU测试分析
NVIDIA发布了首款基于NVIDIA Ampere架构的GPU ——NVIDIA A100 GPU
评论