0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA安培大核心GPU已集合多个国内厂商技术

如意 来源:快科技 作者:上方文Q 2020-12-16 10:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA今天在GTC大会上宣布,多家中国顶级云服务提供商、系统制造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技术,为各种AI应用提速。

今年5月,NVIDIA推出了首款基于安培架构的A100 GPU,台积电7nm工艺制造,集成多达542亿个晶体管,核心面积达826平方毫米,内置6912个FP32 CUDA核心,最高加速频率1.4GHz,搭配512-bit 40GB HBM2显存,带宽达1.6TB/s。

相比上代伏特架构的V100核心,它的INT8推理、FP32训练性能提升20倍,FP64计算性能提升2.5倍,是历史上进步最大的一次。

A100 GPU还配备了精度更高的第三代Tensor Core张量核心、GPU间传输率高达600GB/s的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO软件SDK,可实现成千上万个GPU集群的高效扩展。

部署A100的中国云服务商有:

- 阿里云

已发布gn7 GPU系列云服务器,内置8块A100,主要面向AI训练和高性能计算应用,可提供新一代GPU计算实例,相比上一代平台AI性能提升最高20倍,高性能计算提升2.5倍。

- 百度智能云

即将推出lgn3 GPU系列云服务器、vGPU云服务器、百度太行裸金属服务器。

最多搭载8块A100 GPU、8TB NVMe SSD、数百G带宽,主要面向AI训练/推理、高性能计算应用、科学计算等场景,计算能力20倍于上代V100。

- 滴滴云

A100裸金属服务器,配置8块A100 GPU、2颗AMD EPYC 7302处理器、1024GB内存、2个240GB SATA SSD、2个2TB NVME SSD,适用于AI、数据分析、高性能计算等多种应用场景。

- 腾讯云

已推出云服务器GT4,搭配AMD第二代霄龙平台,最高180核心vGPU,适用于深度学习训练、推理、高性能计算、数据分析、视频分析等领域。

部署A100的中国OEM厂商有:

- 新华三

已推出搭载8颗A100 GPU的全互联6U服务器H3C UniServer R5500 G5,同时全线GPU服务器机型已同步适配升级,包括H3C UniServer R4900 G3(2U 3GPU)、R5300 G3(4U 8GPU)、R4950 G5(2U 4GPU),部分机型已完成NVQUAL认证,全面覆盖集群建设、大规模AI模型训练、高性能计算、AI项目部署等应用场景。

- 浪潮

已发布发布多款支持A100 40G的AI服务器,可配置8-16颗,包括NF5488M5-D、NF5488A5、 NF5688M6、NF5888M6,还推出了三款支持A100 PCIe版本的服务器NF5468M6、NF5468A5、NF5280M6。

配备最新A100 80GB GPU的AI服务器NF5488M5-D、NF5488A5也已全球量产供货。

- 联想

推出了配备A100 GPU的HG680X,4U 8GPU规格,可满足单机多卡需求,支持两种拓扑形式,存储支持最多8个NVMe SSD加16个2.5英寸SAS/SSD,或者24个2.5英寸SAS/SSD。

适用于大型深度学习模型训练场景、大量数据的推理场景,适应不同深度学习算法与改进,可满足互联网、金融、制造等不同行业客户的多样化需求。

- 宁畅

X640 G30 GPU服务器完成8卡A100的适配,并通过了NVIDIA NVQUAL的官方认证,可针对不同场景进行GPU互联拓扑调整、升级算力。现已在客户处完成批量部署,应用于海量数据训练、深度学习、语音识别、图像识别等领域。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110112
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136065
  • 晶体管
    +关注

    关注

    78

    文章

    10439

    浏览量

    148587
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    精密合金电阻核心厂商技术解析与市场应用分析

    本次聚焦“精密合金电阻”核心品类,以“阻值精度控制、温度系数稳定性、场景适配深度、技术自主度”为四大核心分析维度,对国内外具备核心竞争力的
    的头像 发表于 04-22 14:55 91次阅读

    NVIDIA推出cuEST量子化学加速库

    本周,NVIDIA 发布了 NVIDIA cuEST。这是一款全新的 NVIDIA CUDA-X 库,可将电子结构计算迁移到 GPU 上执行。应用材料公司、三星、新思科技和 TSMC
    的头像 发表于 03-23 15:11 479次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 519次阅读

    2025国内GPU市场格局:华为 英伟达并列第一,国产厂商紧随

    在人工智能算力需求爆发的背景下,GPU(图形处理单元)已经从“游戏显卡”演变为数据中心的核心加速器。近日,海外投行BernsteinResearch(伯恩斯坦)公布了
    的头像 发表于 01-07 16:16 1627次阅读
    2025<b class='flag-5'>国内</b><b class='flag-5'>GPU</b>市场格局:华为 英伟达并列第一,国产<b class='flag-5'>厂商</b>紧随

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的
    的头像 发表于 01-06 09:51 4008次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    作为 NVIDIA 专业显卡产品线中单槽性能的巅峰之作,NVIDIA RTX PRO 4000 Blackwell 在各项核心指标上均实现对前代 NVIDIA RTX 4000 Ada
    的头像 发表于 12-29 15:30 1832次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能测试

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GP
    的头像 发表于 12-13 10:12 1421次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 6983次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GPU 驱动的物理仿真,缩小仿真与现实世
    的头像 发表于 09-23 17:15 2623次阅读
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多节点训练指南

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4353次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1639次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    。。) 原理学习 在「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中,作者详解了从帕斯卡架构到40系的Hopper架构的技术演变进化,按照出版时间算是囊括了NVIDIA最新产品的顶尖
    发表于 06-18 19:31

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPUNVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDI
    的头像 发表于 05-27 13:59 1273次阅读

    如何破解GPU集群集合通信路径的“黑盒”难题?

    集合通信库(如NCCL、HCCL)的运行细节用户完全无感知,形成“黑盒”状态。EPS通过实时解析集合通信库的底层运行状态,将隐蔽的通信路径、GPU与网卡状态等信息可视化,并提供智能路由推荐,帮助用户快速优化集群性能。
    的头像 发表于 05-22 10:13 1049次阅读
    如何破解<b class='flag-5'>GPU</b>集群<b class='flag-5'>集合</b>通信路径的“黑盒”难题?