0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ampere架构GPU带来了什么

姚小熊27 来源:比特网 作者:比特网 2020-12-01 10:39 次阅读

在今年10月份,NVIDIA正式发布了采用8nm制程工艺Ampere架构的RTX A6000、RTX A40两款专业图形和计算GPU,这两款产品采用RT Core、Tensor Core和CUDA Core,旨在加速图形、渲染、计算和AI,分别面向工作站和服务器用途。

长久以来,NVIDIA在专业级别GPU领域不断进行创新,此前已经推出过Kepler、Maxwel、Pascal以及Turing等架构,此次,最新的Ampere架构在图形处理、AI、光线追踪等性能上又有进一步的提升。

NVIDIA 中国区高级技术市场经理施澄秋表示:“在过去20年里,NVIDIA在各式各样的图形和可视化运算及AI等不同领域,都针对GPU做出相应优化。NVIDIA GPU无论是在软硬件设计,还是功能改进,都针对不同用户产生了不同性能飞跃,包括现在很流行的AEC、BIM、CAM等。”

此外,NVIDIA还带来了全新Omniverse平台的秋季更新,有了这套平台,分散在各地的远程团队,能够同时针对特定的设计项目来进行协同作业。

Ampere架构GPU带来了什么

我们发现,在发布全新的RTX A6000系列显卡时,与此前的“Tesla”一样,“Quadro”品牌也被NVIDIA淡化了。NVIDIA没有对变更名称给出官方的解释,笔者认为主要是因为目前图形卡、计算卡的界限渐渐地模糊,产品线之间的重合度越来越高造成的,这也可以理解为NVIDIA未来的GPU产品线突破了自己“画的圈”,更加“野蛮”地生长。

随着Ampere架构的发布,NVIDIA进一步提升在GPU领域中主导地位,新架构与前代Turing相比有三大优势:

一、新一代的SM(新一代流式多处理器)架构最高可以提供39 TFLOPS的FP32算力。

二、第二代RT Core相对于第一代Turing架构里的RT Core最高可以提供76 TFLOPS光线追踪算力。和以往GPU不同的是除了SM之外,加入了RT Core、Tensor Core,该张量运算核心主要是针对AI里面最有倚重、最主要的运算单元Tensor Core。

三、新架构产品最多可以提供310个Tensor TFLOPS的算力。

NVIDIA Ampere架构和上一代Turing架构相比最重要的就是SM以及传统图形运算核心采用全新设计,进行全新增强,并采用基于全新架构及设计第二代RT Core及第三代Tensor core,使得RTX A6000在性能、AI、光线追踪等方面获得了非常大的增强。

施澄秋表示:“其实就CAD、CAM或者模拟,以及整个大型复杂零组件装配等工作来说,对于GPU的依赖程度非常高。企业去设计一款产品,产品本身可能对于用户而言只是一个最终拿到手上的物品,但生产制造设计人员其实经历了非常多的繁琐、冗长的步骤。”

也的确如此,比如设计一款产品要经过选择材质、考虑材质的牢固程度、材质的耐磨损程度、材质使用过程中的舒适程度以及美观程度,还要考虑产品是否符合人体工学等等一系列的设计和制造流程。在过程中要花费设计人员相当多的时间与精力。

而在使用高性能的RTX A6000或A40时,就可以帮助大家节约很多的工作时长、能够大幅提升工作流程和效率,优化每一个步骤。这样的过程中,其实NVIDIA专业可视化显卡一直以来都是生产类工具。

对于采用A6000的实例,美国NASA给出了一个评价很有意思,他们觉得新一代Ampere架构的A6000与双路的上一代旗舰级别的RTX8000运算能力差不多,而且,功耗、散热、噪音以及管理成本都下降不少,这足以说明Ampere架构的提升。

让远程协助更简单

今年的疫情改变了很多人的工作方式,其中就包括创意工作者以及开发人员。

一直以来,设计人员为了创建视觉效果、建筑可视化和制造设计,需要不同团队协作,并且,在设计完成之后还需要多个客户进行审查。

由于不同的文件格式、所有权、软件和团队不连通等问题,不同软件之间无法建立联系,不但会导致信息延迟,在某些情况下还会影响效率甚至阻碍工作的完成。Omniverse能够让不同的设计师使用不同的工具,无缝地完成同一个设计项目的不同部分。

在Omniverse推出之后,另一个关键创新是仅需一键点击即可在Autodesk.Revit、McNeel.Rhino或Trimble.SketchUp之间进行切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。

此外,Omniverse还更好地对光线追踪进行支持,可以把实时光线追踪的能力带到任何一个设备上。我们以前给客户做演示的时候会拿一个手机或者平板电脑,客户可能只会看到一张图或者一个视频,既不可交互也不能改变视角。

借助Omniverse平台,设计师可以用流媒体的方式把设计程序,甚至整套流程串流到任何一个设备上。只需一台平板电脑/手机/上网本/轻型笔记本,就可以给客户进行演示,而且还可以得到实时反馈,让客户看到当前设计的状况,甚至可以利用AR/VR的方式让用户更真实的体验你所使用地应用程序。

如果Omniverse平台有RTX A6000显卡加持,会创造出什么样的画面呢?在NVIDIA刚刚放出来的夜间版《Marbles》便是这两者合体的杰作,施澄秋介绍:“视频中物体的摩擦、弹跳、互动,包括里面不同位置的声音全部由NVIDIA Ampere架构的技术来完成。该视频制作者来自超过12个团队,几十个工程师和设计师分散在全世界各个地方,实时利用NVIDIA Omniverse和NVIDIA RTX Ampere架构GPU完成了这一艺术创举。”

写在最后

在Turing架构推出三年之后,NVIDIA为大家带来了更加强悍的Ampere架构,让我们再一次感受到GPU性能的提升,而且二代RT Core、Tensor Core的引入对全新光线追踪和AI性能的加强也让其成为更出色的生产工具。

今年7月NVIDIA市值达到2513亿美元,首度超越Intel成为美国市值最高半导体公司,截止至目前,其市值更突破3000亿美元大关,在NVIDIA刚刚发布的第三季度财报中,创下收入47.3亿美元的记录。一个个记录随时间迁移不断被打破,未来还会发生什么?我们非常期待。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4576

    浏览量

    101635
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4400

    浏览量

    126541
  • Ampere
    +关注

    关注

    1

    文章

    54

    浏览量

    4501
收藏 人收藏

    评论

    相关推荐

    全新NVIDIA RTX A400和A1000 GPU全面加强AI设计与生产力工作流

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-18 10:29 99次阅读

    FPGA在深度学习应用中或将取代GPU

    的玩家来说不是什么大问题。但在其他领域,如汽车行业,需要硬件有更高的耐用性,这就带来了问题。特别是过多的暴露在恶劣的环境中,再加上高强度的使用,GPU 的使用寿命将会更短。 Larzul 说:“从商
    发表于 03-21 15:19

    深入解读AMD最新GPU架构

    GCN 取代了 Terascale,并强调 GPGPU 和图形应用程序的一致性能。然后,AMD 将其 GPU 架构开发分为单独的 CDNA 和 RDNA 线路,分别专门用于计算和图形。
    发表于 01-08 10:12 438次阅读
    深入解读AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战。GPU架构创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。
    的头像 发表于 12-21 08:28 416次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>设计的挑战

    NVIDIA GPU的核心架构架构演进

    在探讨 NVIDIA GPU 架构之前,我们先来了解一些相关的基本知识。GPU 的概念,是由 NVIDIA 公司在 1999 年发布 Geforce256 图形处理芯片时首先提出,从此
    发表于 11-21 09:40 421次阅读
    NVIDIA <b class='flag-5'>GPU</b>的核心<b class='flag-5'>架构</b>及<b class='flag-5'>架构</b>演进

    对英伟达A100芯片算力服务收费价格上调100%,这家企业的硬气来自哪里?

    半导体芯情了解到,A100是英伟达最新推出的一款高性能计算芯片,采用了全新的Ampere架构Ampere架构是NVIDIA于 GTC 2020发布的
    的头像 发表于 11-14 16:30 625次阅读
    对英伟达A100芯片算力服务收费价格上调100%,这家企业的硬气来自哪里?

    Ampere推出全新软件迁移工具Ampere Porting Advisor

    当前,开发者对高效的软件迁移解决方案的需求与日俱增。随着计算从传统 x86 架构向 AArch64 架构迁移,尤其是向 Ampere 处理器迁移的势头日益强劲,开发者们正在寻找加速代码库迁移的方法
    的头像 发表于 08-24 10:14 1194次阅读

    英伟达h800和a100的区别

    架构,而A100使用NVIDIA Ampere架构Ampere架构比Volta架构更先进。 2
    的头像 发表于 08-08 16:05 1.4w次阅读
    英伟达h800和a100的区别

    Gaudi2架构和软件的全面解释

    ,Gaudi2以其架构为基础,为数据中心和云的深度学习带来了新的性能和效率。 Gaudi2由SynapseAI®软件套件支持,该软件套件与TensorFlow和PyTorch框架集成。我们在哈瓦那的GitHub
    发表于 08-04 06:15

    基于磁贴的GPU架构优缺点

    本指南介绍了基于磁贴的GPU架构的优缺点。它还将ARM马里基于瓷砖的GPU架构设计与台式PC或控制台中常见的更传统的即时模式GPU进行了比较
    发表于 08-02 12:54

    NVIDIA Ampere 架构的结构化稀疏功能及其在搜索引擎中的应用

    NVIDIA Ampere 架构的结构化稀疏功能 及其在搜索引擎中的应用 深度学习彻底改变了我们分析、理解和处理数据的方式,而且在各个领域的应用中都取得了巨大的成功,其在计算机视觉、自然语言处理
    的头像 发表于 07-18 17:45 306次阅读
    NVIDIA <b class='flag-5'>Ampere</b> <b class='flag-5'>架构</b>的结构化稀疏功能及其在搜索引擎中的应用

    Ampere Altra系列处理器的锁和内存序

    让我们先来了解一些基本的问题。Arm 在 Arm v8.2-A 架构中引入了大型系统扩展(Large System Extensions, LSE),它用单个原子指令取代了锁操作的指令序列。这里
    的头像 发表于 06-07 17:36 897次阅读
    <b class='flag-5'>Ampere</b> Altra系列处理器的锁和内存序

    Ampere全新AmpereOne系列处理器,多达192个单线程Ampere

    强调Ampere凭借过去Ampere Altra和Ampere Altra Max处理器创建了云原生处理器类别,提供可预测和快速节奏的产品,使得其性能和效率方面都引领着市场。
    发表于 05-23 11:44 310次阅读

    Ampere Computing发布全新AmpereOne系列处理器,192个自研核

    2023 年 5 月 19 日,中国北京——Ampere Computing 宣布推出全新 AmpereOne 系列处理器,该处理器拥有多达 192 个单线程 Ampere 核,内核数量为业界最高。这是第一款基于 Ampere
    的头像 发表于 05-19 11:04 881次阅读

    大模型训练,英伟达Turing、Ampere和Hopper算力分析

    GPU 架构升级过程计算能力不断强化,Hopper 架构适用于高性能计算(HPC)和 AI 工作负载。英伟达在架构设计上,不断加强 GPU
    的头像 发表于 05-15 11:16 1328次阅读
    大模型训练,英伟达Turing、<b class='flag-5'>Ampere</b>和Hopper算力分析