0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Nvidia发布世界最大GPU

mK5P_AItists 来源:未知 作者:邓佳佳 2018-03-31 09:12 次阅读

日前,英伟达GTC 2018(GPU Technology Conference 2018,以下简称GTC)在美国圣何塞举行。英伟达再一次在提升计算力的路上越走越远。GPU产品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都进行了更新。

新产品—全世界最大的GPU只要399

全新Tesla V100显存将从原来的16GB提升至32GB。2017年5月11日,英伟达正式发布了全新Volta架构GPU——NVIDIA Tesla V100,它拥有超过210亿个晶体管,是上代TeslaP100的1.37倍。它的单精度浮点性能高达15 TFLOPS,双精度浮点7.5 TFLOPS。

基于此前的NVIDIA NVLink架构,英伟达还推出了全新的NVSwitch架构。这一互联架构的带宽比PCle交换机高5倍,足以支持更大规模和复杂的数据集运算,让开发者和科学家可以构建更高级的系统。

基于Tesla V100的升级和全新的NVSwitch架构,英伟达将DGX 2的性能较前一代产品有大幅度提升。

在2016年的GTC上英伟达正式发布DGX 1,它拥有8颗帕斯卡架构GP100核心的Tesla P100 GPU,以及7TB的SSD,由两颗16核心的Xeon E5-2698v3以及512GB的DDR4内存驱动。售价为129000美元。2017年9月份,英伟达推出了一款基于Volta架构的DGX 1V,拥有8块Tesla V100。

而DGX 2应用了最新的NVSwitch架构,通过12个NVSwitch支持16块全新的Tesla V100共享同一的内存空间,总计512 GB HBM2存储,能实现每秒高达2千万次的浮点运算。此外,基于NVSwitch架构的应用,16块GPU可以实现2.4TB/秒的数据传输能力。

DGX 2内含16颗Tesla V100芯片

“这是全球最大的GPU。”黄仁勋表示,他还用“美丽、性感”等词语来形容这一款最新的DGX系列产品。

DGX 2的售价,黄仁勋首先给出的是150万美元,最后直接减价为39.9万美元,将在今年的第三季度正式开放购买。

面向艺术及设计领域,英伟达还推出了搭载了NVIDIA RTX(实时光线追踪)技术的NVIDIA Quadro GV100 GPU。单块GPU拥有32GB内存,可以基于NVLink技术将两块GV100 GPU并联,从而将内存提升至64GB。在前一周的游戏开发者大会上,英伟达正式推出了NVIDIA RTX技术。

GV100 GPU基于最新的Volta架构,可以提供每秒7.4万亿次浮点运算的双精度性能,每秒14.8万亿次浮点运算的单精度性能,以及每秒118.5万亿次浮点运算的深度学习性能。

黄仁勋手中的GV100 GPU

这款产品主要针对传媒娱乐从业者、产品设计师、建筑设计师等专业设计与流媒体专业人员。其中,NVIDIA RTX内置的NVIDIA OpitX AI-denoiser可以实现实时的AI降噪去噪。

硬件之外,英伟达还发布了针对软件的更新——TensorRT 4软件。这一软件可用于优化、验证和部署在超大规模数据中心嵌入式与汽车GPU平台中经过训练的神经网络

为了笼络更多的开发者,英伟达与谷歌的工程师将TensorRT集成至谷歌的TensorFlow 1.7中。

自动驾驶—暂停自动驾驶研发

自动驾驶仍在本次GTC的讨论之列

英伟达的自动驾驶平台可以统称为Drive PX系列。但是其实,Drive PX只是NVIDIA车载AI平台的系列名称。而这个系列目前主要包括两代产品:已经量产的Drive PX 2平台,以及在2018年初展示的新一代平台Xavier。

不过黄仁勋却在GTC 2018上宣布英伟达将暂停自动驾驶的研发工作,虽然没有说明何时能再推进这一进程,但是他也表示“不会太久。”

在2018年2月9日对外发布的2018财年第四季度及全年财报中,英伟达曾经提到过与Uber、Aurora合作打造自动驾驶汽车,采用的就是开源的NVIDIA Drive人工智能自动驾驶平台。

美国当地时间3月18日晚上,亚利桑那州一名女子被Uber自动驾驶汽车撞伤,之后不幸身亡。这是全球首例自动驾驶车辆致人死亡的事故,随后Uber宣布将暂停其在美国和加拿大的自动驾驶项目。随后在26日,亚利桑那州州长宣布暂禁Uber在亚利桑那州公路测试自驾车。

黄仁勋在回答媒体关于该案件的提问时表示,英伟达对于这个意外感到悲伤,但是自动驾驶的研究本身是没有错的,应该从这个案件中吸取经验,提升自动驾驶的安全性。作为Uber在自动驾驶领域的合作方之一,英伟达暂停自动驾驶的研发可能和Uber的自动驾驶汽车撞人致死案有关,但其并没有完全放弃自动驾驶项目。

英伟达的DRIVE Constellation仿真系统

英伟达在GTC上推出了针对自动驾驶汽车测试的仿真系统——DRIVE Constellation。

DRIVE Constellation仿真系统是一套使用照片级真实感模拟,基于云的自动驾驶汽车测试系统。它基于两个不同的服务器,第一台服务器运行的是DRIVE Sim软件,可以模拟自动驾驶汽车的传感器,比如摄像头、激光雷达和雷达等。

DRIVE Sim软件可以通过生成照片级的数据流,从而创建不同的测试环境,比如晴天、暴雨、暴雪等不同的天气状况、日间和夜间等不同的光线状况、急转弯或陡坡等不同的路面状况。并且在模拟过程中设置各种危险和突发状况,比如行人突然穿越马路等,以测试自动驾驶汽车的反应能力,以确定其不会对人带来安全威胁。

第二台服务器搭载的是NVIDIA DRIVE Pegasus AI汽车计算平台,运行完整的自动驾驶汽车软件堆栈,并能够处理传感器搜集模拟数据。经过处理的数据会被反馈给传感器,一直进行数据的循环。

从时间来看,英伟达推出的这个仿真系统和Uber的自动驾驶汽车撞人致死案并无太大关联,不过在长远的未来,它将能有效帮助提升自动驾驶汽车测试的安全性。

新合作—与ARM合作布局IoT

英伟达还宣布与ARM达成了合作,共同为全球数十亿台IoT设备提供深度学习的能力。双方将开源的英伟达深度学习加速器整合到ARM的Project Trillium机器学习平台上。

2018年2月23日,ARM推出了Project Trillium项目,这是一套包括新的高度可扩展处理器的ARM IP组合,这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场,将让全新的搭载机器学习功能的设备具有先进的计算能力,包括先进的目标检测功能。

在将英伟达深度学习加速器整合到Project Trillium之后,全球数十亿台的消费电子设备上的IoT芯片将具备机器学习能力。

GTC之外—计算力提升从创新驱动变为需求驱动

提到英伟达和黄仁勋,就不得不提到CPU。在2017年的GTC上,黄仁勋曾声称摩尔定律已经终结,设计人员无法再创造出可以实现更高指令集并行的GPU架构,晶体管数量每年增长50%,但CPU的性能每年仅增长10%。

在演讲中,黄仁勋没有放过任何一次揶揄CPU的机会。不管是更新后的Tesla V100、DGX 2,还是最新发布的GV100 GPU,黄仁勋声称“在提供相同的计算力下,它们都比CPU组成的集群要更节能、高效,占用更少的空间。”

“买得越多,省得越多。”已经成了他的口头禅。然而回归到英伟达本身,其本身的高速增长很大一部分是依赖于市场对图形芯片的巨大需求。

在英伟达公布的2018财年第四季度财报中,虽然数据中心业务同比实现了一倍多的增长达到6.06亿美元。但游戏图形芯片业务的营收达17.4亿美元,同比增长29%,占该季度总营收的一半以上。

“加密货币市场的强劲需求超出了我们的预期。” 英伟达首席财务官科莱特·克雷斯表示,“尽管加密货币对我们业务的总体贡献仍难以量化,但我们认为,其在营收中所比例高于上一季度。”

从产品本身来说, GPU目前只能是不断叠加性能,带来的惊喜越来越少。以DGX系列为例,内含的GPU芯片从4颗变成了8颗,今年从8颗增长到了16颗,改变的只不过是互联的架构。单颗芯片的算力提升越来越难,英伟达的“横向发展”只是另辟蹊径。

不过,英特尔的Nervana芯片,谷歌的TPU(目前只在谷歌内部使用)对于英伟达来说是潜在的竞争对手。有竞争在,更大的惊喜才有可能会到来。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4541

    浏览量

    101472
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4336

    浏览量

    126288
  • 人工智能
    +关注

    关注

    1773

    文章

    43356

    浏览量

    230103

原文标题:Nvidia黄仁勋发布了全球最大GPU

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA 软件实现了跨  Blackwell GPU、新交换机和 BlueField-3 SuperNIC 的分布式计算,大幅提升了 AI、数据处理、高性能计算和云工作负载的性能     美国加利福尼亚州
    发表于 03-19 10:05 80次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>发布</b>全新交换机,全面优化万亿参数级 <b class='flag-5'>GPU</b> 计算和 AI 基础设施

    NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

    根据各方信息和路线图,NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。
    的头像 发表于 03-04 09:33 497次阅读
    <b class='flag-5'>NVIDIA</b>将在今年第二季度<b class='flag-5'>发布</b>Blackwell架构的新一代<b class='flag-5'>GPU</b>加速器“B100”

    NVIDIA的Maxwell GPU架构功耗不可思议

    整整10年前的2013年2月19日,NVIDIA正式推出了新一代Maxwell GPU架构,它有着极高的能效,出场方式也非常特别。
    的头像 发表于 02-19 16:39 404次阅读
    <b class='flag-5'>NVIDIA</b>的Maxwell <b class='flag-5'>GPU</b>架构功耗不可思议

    巨头豪购35万块NVIDIA最强GPU H100

    NVIDIA AI GPU无疑是当下的硬通货,从科技巨头到小型企业都在抢。
    的头像 发表于 01-29 09:58 510次阅读
    巨头豪购35万块<b class='flag-5'>NVIDIA</b>最强<b class='flag-5'>GPU</b> H100

    如何选择NVIDIA GPU和虚拟化软件的组合方案呢?

    NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站,加速图形和计算,使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。
    的头像 发表于 01-12 09:26 220次阅读
    如何选择<b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>和虚拟化软件的组合方案呢?

    NVIDIA GPU的核心架构及架构演进

    在探讨 NVIDIA GPU 架构之前,我们先来了解一些相关的基本知识。GPU 的概念,是由 NVIDIA 公司在 1999 年发布 Gef
    发表于 11-21 09:40 347次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b>的核心架构及架构演进

    177倍加速!NVIDIA最新开源 | GPU加速各种SDF建图!

    但最近,NVIDIA和ETHZ就联合提出了nvblox,是一个使用GPU加速SDF建图的库。计算速度非常快,相较CPU计算TSDF甚至快了177倍。更重要的是,因为所有数据都已经存储在GPU上,所以很容易和深度学习方案结合!
    的头像 发表于 11-09 16:46 455次阅读
    177倍加速!<b class='flag-5'>NVIDIA</b>最新开源 | <b class='flag-5'>GPU</b>加速各种SDF建图!

    Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

    。为了帮助满足这一需求,Oracle 云基础设施(OCI)于近日宣布,在 OCI Compute 上全面提供 NVIDIA H100 Tensor Core GPU ,同时 NVIDIA L40S
    的头像 发表于 09-25 20:40 274次阅读
    Oracle 云基础设施提供新的 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>GPU</b> 加速计算实例

    NVIDIA最强CPU芯片架构——NVIDIA Grace CPU

    NVIDIA Grace Hopper Superchip将节能、高带宽的 NVIDIA Grace CPU 与功能强大的 NVIDIA H100 Hopper GPU 结合使用 NV
    发表于 08-30 10:45 927次阅读
    <b class='flag-5'>NVIDIA</b>最强CPU芯片架构——<b class='flag-5'>NVIDIA</b> Grace CPU

    NVIDIA DLSS 3.5发布,多款DLSS和Reflex游戏、《半条命2》RTX版:RTX Remix项目等即将发布

    2023 年 8 月 22 日 德国科隆,Gamescom 2023 开幕,NVIDIA 发布大量新游戏新 闻。 NVIDIA 发布 AI 增强型实时光线追踪技术, 支持全新 DLSS
    的头像 发表于 08-23 19:10 381次阅读

    NVIDIA CPU+GPU超级芯片大升级!

    NVIDIA官方宣布了新一代GH200 Grace Hopper超级芯片平台,全球首发采用HBM3e高带宽内存,可满足世界上最复杂的生成式AI负载需求。
    的头像 发表于 08-10 09:37 918次阅读
    <b class='flag-5'>NVIDIA</b> CPU+<b class='flag-5'>GPU</b>超级芯片大升级!

    NVIDIA虚拟GPU技术推动快速无痛的牙科治疗

    NVIDIA虚拟GPU技术推动快速无痛的牙科治疗
    的头像 发表于 08-01 14:46 267次阅读

    NVIDIA Hopper GPU上的新cuBLAS12.0功能和矩阵乘法性能

    NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩阵乘法性能
    的头像 发表于 07-05 16:30 1607次阅读
    <b class='flag-5'>NVIDIA</b> Hopper <b class='flag-5'>GPU</b>上的新cuBLAS12.0功能和矩阵乘法性能

    探索NVIDIA AI和Omniverse加速设计创作

    协作,是专为虚拟协作和实时逼真模拟而打造的易于扩展的开放式平台。NVIDIA Omniverse 是连接世界最大的工具生态系统,目前连接 220 个工具软件,下载量超过 30 万。
    的头像 发表于 06-13 15:40 319次阅读

    芯片“新王”手创造的GPU制造龙头——英伟达

    当chatgpt掀起一股新的ai大规模模型热潮时,提供基本计算能力的nvidia最大的受惠者之一,而nvidiagpu产品几乎没有能够替代大规模模型训练的东西。
    的头像 发表于 06-05 10:58 1099次阅读