0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia发布世界最大GPU

mK5P_AItists 来源:未知 作者:邓佳佳 2018-03-31 09:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,英伟达GTC 2018(GPU Technology Conference 2018,以下简称GTC)在美国圣何塞举行。英伟达再一次在提升计算力的路上越走越远。GPU产品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都进行了更新。

新产品—全世界最大的GPU只要399

全新Tesla V100显存将从原来的16GB提升至32GB。2017年5月11日,英伟达正式发布了全新Volta架构GPU——NVIDIA Tesla V100,它拥有超过210亿个晶体管,是上代TeslaP100的1.37倍。它的单精度浮点性能高达15 TFLOPS,双精度浮点7.5 TFLOPS。

基于此前的NVIDIA NVLink架构,英伟达还推出了全新的NVSwitch架构。这一互联架构的带宽比PCle交换机高5倍,足以支持更大规模和复杂的数据集运算,让开发者和科学家可以构建更高级的系统。

基于Tesla V100的升级和全新的NVSwitch架构,英伟达将DGX 2的性能较前一代产品有大幅度提升。

在2016年的GTC上英伟达正式发布DGX 1,它拥有8颗帕斯卡架构GP100核心的Tesla P100 GPU,以及7TB的SSD,由两颗16核心的Xeon E5-2698v3以及512GB的DDR4内存驱动。售价为129000美元。2017年9月份,英伟达推出了一款基于Volta架构的DGX 1V,拥有8块Tesla V100。

而DGX 2应用了最新的NVSwitch架构,通过12个NVSwitch支持16块全新的Tesla V100共享同一的内存空间,总计512 GB HBM2存储,能实现每秒高达2千万次的浮点运算。此外,基于NVSwitch架构的应用,16块GPU可以实现2.4TB/秒的数据传输能力。

DGX 2内含16颗Tesla V100芯片

“这是全球最大的GPU。”黄仁勋表示,他还用“美丽、性感”等词语来形容这一款最新的DGX系列产品。

DGX 2的售价,黄仁勋首先给出的是150万美元,最后直接减价为39.9万美元,将在今年的第三季度正式开放购买。

面向艺术及设计领域,英伟达还推出了搭载了NVIDIA RTX(实时光线追踪)技术的NVIDIA Quadro GV100 GPU。单块GPU拥有32GB内存,可以基于NVLink技术将两块GV100 GPU并联,从而将内存提升至64GB。在前一周的游戏开发者大会上,英伟达正式推出了NVIDIA RTX技术。

GV100 GPU基于最新的Volta架构,可以提供每秒7.4万亿次浮点运算的双精度性能,每秒14.8万亿次浮点运算的单精度性能,以及每秒118.5万亿次浮点运算的深度学习性能。

黄仁勋手中的GV100 GPU

这款产品主要针对传媒娱乐从业者、产品设计师、建筑设计师等专业设计与流媒体专业人员。其中,NVIDIA RTX内置的NVIDIA OpitX AI-denoiser可以实现实时的AI降噪去噪。

硬件之外,英伟达还发布了针对软件的更新——TensorRT 4软件。这一软件可用于优化、验证和部署在超大规模数据中心嵌入式与汽车GPU平台中经过训练的神经网络

为了笼络更多的开发者,英伟达与谷歌的工程师将TensorRT集成至谷歌的TensorFlow 1.7中。

自动驾驶—暂停自动驾驶研发

自动驾驶仍在本次GTC的讨论之列

英伟达的自动驾驶平台可以统称为Drive PX系列。但是其实,Drive PX只是NVIDIA车载AI平台的系列名称。而这个系列目前主要包括两代产品:已经量产的Drive PX 2平台,以及在2018年初展示的新一代平台Xavier。

不过黄仁勋却在GTC 2018上宣布英伟达将暂停自动驾驶的研发工作,虽然没有说明何时能再推进这一进程,但是他也表示“不会太久。”

在2018年2月9日对外发布的2018财年第四季度及全年财报中,英伟达曾经提到过与Uber、Aurora合作打造自动驾驶汽车,采用的就是开源的NVIDIA Drive人工智能自动驾驶平台。

美国当地时间3月18日晚上,亚利桑那州一名女子被Uber自动驾驶汽车撞伤,之后不幸身亡。这是全球首例自动驾驶车辆致人死亡的事故,随后Uber宣布将暂停其在美国和加拿大的自动驾驶项目。随后在26日,亚利桑那州州长宣布暂禁Uber在亚利桑那州公路测试自驾车。

黄仁勋在回答媒体关于该案件的提问时表示,英伟达对于这个意外感到悲伤,但是自动驾驶的研究本身是没有错的,应该从这个案件中吸取经验,提升自动驾驶的安全性。作为Uber在自动驾驶领域的合作方之一,英伟达暂停自动驾驶的研发可能和Uber的自动驾驶汽车撞人致死案有关,但其并没有完全放弃自动驾驶项目。

英伟达的DRIVE Constellation仿真系统

英伟达在GTC上推出了针对自动驾驶汽车测试的仿真系统——DRIVE Constellation。

DRIVE Constellation仿真系统是一套使用照片级真实感模拟,基于云的自动驾驶汽车测试系统。它基于两个不同的服务器,第一台服务器运行的是DRIVE Sim软件,可以模拟自动驾驶汽车的传感器,比如摄像头、激光雷达和雷达等。

DRIVE Sim软件可以通过生成照片级的数据流,从而创建不同的测试环境,比如晴天、暴雨、暴雪等不同的天气状况、日间和夜间等不同的光线状况、急转弯或陡坡等不同的路面状况。并且在模拟过程中设置各种危险和突发状况,比如行人突然穿越马路等,以测试自动驾驶汽车的反应能力,以确定其不会对人带来安全威胁。

第二台服务器搭载的是NVIDIA DRIVE Pegasus AI汽车计算平台,运行完整的自动驾驶汽车软件堆栈,并能够处理传感器搜集模拟数据。经过处理的数据会被反馈给传感器,一直进行数据的循环。

从时间来看,英伟达推出的这个仿真系统和Uber的自动驾驶汽车撞人致死案并无太大关联,不过在长远的未来,它将能有效帮助提升自动驾驶汽车测试的安全性。

新合作—与ARM合作布局IoT

英伟达还宣布与ARM达成了合作,共同为全球数十亿台IoT设备提供深度学习的能力。双方将开源的英伟达深度学习加速器整合到ARM的Project Trillium机器学习平台上。

2018年2月23日,ARM推出了Project Trillium项目,这是一套包括新的高度可扩展处理器的ARM IP组合,这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场,将让全新的搭载机器学习功能的设备具有先进的计算能力,包括先进的目标检测功能。

在将英伟达深度学习加速器整合到Project Trillium之后,全球数十亿台的消费电子设备上的IoT芯片将具备机器学习能力。

GTC之外—计算力提升从创新驱动变为需求驱动

提到英伟达和黄仁勋,就不得不提到CPU。在2017年的GTC上,黄仁勋曾声称摩尔定律已经终结,设计人员无法再创造出可以实现更高指令集并行的GPU架构,晶体管数量每年增长50%,但CPU的性能每年仅增长10%。

在演讲中,黄仁勋没有放过任何一次揶揄CPU的机会。不管是更新后的Tesla V100、DGX 2,还是最新发布的GV100 GPU,黄仁勋声称“在提供相同的计算力下,它们都比CPU组成的集群要更节能、高效,占用更少的空间。”

“买得越多,省得越多。”已经成了他的口头禅。然而回归到英伟达本身,其本身的高速增长很大一部分是依赖于市场对图形芯片的巨大需求。

在英伟达公布的2018财年第四季度财报中,虽然数据中心业务同比实现了一倍多的增长达到6.06亿美元。但游戏图形芯片业务的营收达17.4亿美元,同比增长29%,占该季度总营收的一半以上。

“加密货币市场的强劲需求超出了我们的预期。” 英伟达首席财务官科莱特·克雷斯表示,“尽管加密货币对我们业务的总体贡献仍难以量化,但我们认为,其在营收中所比例高于上一季度。”

从产品本身来说, GPU目前只能是不断叠加性能,带来的惊喜越来越少。以DGX系列为例,内含的GPU芯片从4颗变成了8颗,今年从8颗增长到了16颗,改变的只不过是互联的架构。单颗芯片的算力提升越来越难,英伟达的“横向发展”只是另辟蹊径。

不过,英特尔的Nervana芯片,谷歌的TPU(目前只在谷歌内部使用)对于英伟达来说是潜在的竞争对手。有竞争在,更大的惊喜才有可能会到来。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110112
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136062
  • 人工智能
    +关注

    关注

    1820

    文章

    50317

    浏览量

    266896

原文标题:Nvidia黄仁勋发布了全球最大GPU

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA向Kubernetes社区捐赠动态资源分配GPU驱动程序

    此外,NVIDIA 在 KubeCon Europe 大会上宣布推出适用于 GPU 加速工作负载的机密容器解决方案、NVIDIA KAI Scheduler 更新,以及用于实现大规模 AI 工作负载的全新开源项目。
    的头像 发表于 04-01 09:10 710次阅读

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    旨在支持 NVIDIA GPUNVIDIA cuVS 开源库,用于向量搜索和索引生成。本公告基于在 Oracle AI World 2025 大会上推出的 Oracle AI Database 26ai 和 Oracle
    的头像 发表于 03-23 15:26 425次阅读

    NVIDIA推出cuEST量子化学加速库

    本周,NVIDIA 发布NVIDIA cuEST。这是一款全新的 NVIDIA CUDA-X 库,可将电子结构计算迁移到 GPU 上执行
    的头像 发表于 03-23 15:11 479次阅读

    NVIDIA发布Vera Rubin DSX AI Factory参考设计

    NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 参考设计,这是一份用于构建协同设计的 AI 基础设施的指南。同时正式发布完全兼容 NVIDIA
    的头像 发表于 03-18 14:42 637次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 517次阅读

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    NVIDIA RTX PRO 5000 Blackwell 是 NVIDIA RTX 5000 Ada Generation 的升级迭代产品,其各项核心指标均针对 GPU 加速工作流的高性能
    的头像 发表于 01-06 09:51 3995次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    Generation 的全面超越。那么,这款划时代的专业 GPU 在真实应用场景中的表现究竟如何?今天,我们将通过深度实测,为您揭晓 NVIDIA RTX PRO 4000 Blackwell 相较于前代产品的性能跃迁。
    的头像 发表于 12-29 15:30 1832次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA RTX PRO 5000 72GB Blackwell GPU现已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 现已全面上市,将基于 NVIDIA Blackwell 架构的强大代理式与生成式 AI 能力带到更多桌面和专业用户手中。
    的头像 发表于 12-24 10:32 1092次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB Blackwell <b class='flag-5'>GPU</b>现已全面上市

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用
    的头像 发表于 12-13 10:12 1418次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile简化<b class='flag-5'>GPU</b>编程

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVID
    的头像 发表于 12-01 09:25 1425次阅读

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 6983次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GPU 驱动的物理仿真,缩小仿真与现实
    的头像 发表于 09-23 17:15 2622次阅读
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多节点训练指南

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 4351次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 1638次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    的应用层面的工作,对于芯片底层基本原理兴趣缺缺,本帖结合自己实际生活与工作中对GPU新品的应用实例和书中内容分享下相关见解。 NVlink的初应用 **NVlink(SLI)**是NVIDIA公司针对
    发表于 06-18 19:31