0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ampere架构GPU带来了什么

姚小熊27 来源:比特网 作者:比特网 2020-12-01 10:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在今年10月份,NVIDIA正式发布了采用8nm制程工艺Ampere架构的RTX A6000、RTX A40两款专业图形和计算GPU,这两款产品采用RT Core、Tensor Core和CUDA Core,旨在加速图形、渲染、计算和AI,分别面向工作站和服务器用途。

长久以来,NVIDIA在专业级别GPU领域不断进行创新,此前已经推出过Kepler、Maxwel、Pascal以及Turing等架构,此次,最新的Ampere架构在图形处理、AI、光线追踪等性能上又有进一步的提升。

NVIDIA 中国区高级技术市场经理施澄秋表示:“在过去20年里,NVIDIA在各式各样的图形和可视化运算及AI等不同领域,都针对GPU做出相应优化。NVIDIA GPU无论是在软硬件设计,还是功能改进,都针对不同用户产生了不同性能飞跃,包括现在很流行的AEC、BIM、CAM等。”

此外,NVIDIA还带来了全新Omniverse平台的秋季更新,有了这套平台,分散在各地的远程团队,能够同时针对特定的设计项目来进行协同作业。

Ampere架构GPU带来了什么

我们发现,在发布全新的RTX A6000系列显卡时,与此前的“Tesla”一样,“Quadro”品牌也被NVIDIA淡化了。NVIDIA没有对变更名称给出官方的解释,笔者认为主要是因为目前图形卡、计算卡的界限渐渐地模糊,产品线之间的重合度越来越高造成的,这也可以理解为NVIDIA未来的GPU产品线突破了自己“画的圈”,更加“野蛮”地生长。

随着Ampere架构的发布,NVIDIA进一步提升在GPU领域中主导地位,新架构与前代Turing相比有三大优势:

一、新一代的SM(新一代流式多处理器)架构最高可以提供39 TFLOPS的FP32算力。

二、第二代RT Core相对于第一代Turing架构里的RT Core最高可以提供76 TFLOPS光线追踪算力。和以往GPU不同的是除了SM之外,加入了RT Core、Tensor Core,该张量运算核心主要是针对AI里面最有倚重、最主要的运算单元Tensor Core。

三、新架构产品最多可以提供310个Tensor TFLOPS的算力。

NVIDIA Ampere架构和上一代Turing架构相比最重要的就是SM以及传统图形运算核心采用全新设计,进行全新增强,并采用基于全新架构及设计第二代RT Core及第三代Tensor core,使得RTX A6000在性能、AI、光线追踪等方面获得了非常大的增强。

施澄秋表示:“其实就CAD、CAM或者模拟,以及整个大型复杂零组件装配等工作来说,对于GPU的依赖程度非常高。企业去设计一款产品,产品本身可能对于用户而言只是一个最终拿到手上的物品,但生产制造设计人员其实经历了非常多的繁琐、冗长的步骤。”

也的确如此,比如设计一款产品要经过选择材质、考虑材质的牢固程度、材质的耐磨损程度、材质使用过程中的舒适程度以及美观程度,还要考虑产品是否符合人体工学等等一系列的设计和制造流程。在过程中要花费设计人员相当多的时间与精力。

而在使用高性能的RTX A6000或A40时,就可以帮助大家节约很多的工作时长、能够大幅提升工作流程和效率,优化每一个步骤。这样的过程中,其实NVIDIA专业可视化显卡一直以来都是生产类工具。

对于采用A6000的实例,美国NASA给出了一个评价很有意思,他们觉得新一代Ampere架构的A6000与双路的上一代旗舰级别的RTX8000运算能力差不多,而且,功耗、散热、噪音以及管理成本都下降不少,这足以说明Ampere架构的提升。

让远程协助更简单

今年的疫情改变了很多人的工作方式,其中就包括创意工作者以及开发人员。

一直以来,设计人员为了创建视觉效果、建筑可视化和制造设计,需要不同团队协作,并且,在设计完成之后还需要多个客户进行审查。

由于不同的文件格式、所有权、软件和团队不连通等问题,不同软件之间无法建立联系,不但会导致信息延迟,在某些情况下还会影响效率甚至阻碍工作的完成。Omniverse能够让不同的设计师使用不同的工具,无缝地完成同一个设计项目的不同部分。

在Omniverse推出之后,另一个关键创新是仅需一键点击即可在Autodesk.Revit、McNeel.Rhino或Trimble.SketchUp之间进行切换。用户无需进行数据准备或抽样,就能使用兼容的照片级逼真的渲染软件浏览大型模型。这就避免了转化延迟和切换软件工具造成的错误,大量节省了时间和成本。

此外,Omniverse还更好地对光线追踪进行支持,可以把实时光线追踪的能力带到任何一个设备上。我们以前给客户做演示的时候会拿一个手机或者平板电脑,客户可能只会看到一张图或者一个视频,既不可交互也不能改变视角。

借助Omniverse平台,设计师可以用流媒体的方式把设计程序,甚至整套流程串流到任何一个设备上。只需一台平板电脑/手机/上网本/轻型笔记本,就可以给客户进行演示,而且还可以得到实时反馈,让客户看到当前设计的状况,甚至可以利用AR/VR的方式让用户更真实的体验你所使用地应用程序。

如果Omniverse平台有RTX A6000显卡加持,会创造出什么样的画面呢?在NVIDIA刚刚放出来的夜间版《Marbles》便是这两者合体的杰作,施澄秋介绍:“视频中物体的摩擦、弹跳、互动,包括里面不同位置的声音全部由NVIDIA Ampere架构的技术来完成。该视频制作者来自超过12个团队,几十个工程师和设计师分散在全世界各个地方,实时利用NVIDIA Omniverse和NVIDIA RTX Ampere架构GPU完成了这一艺术创举。”

写在最后

在Turing架构推出三年之后,NVIDIA为大家带来了更加强悍的Ampere架构,让我们再一次感受到GPU性能的提升,而且二代RT Core、Tensor Core的引入对全新光线追踪和AI性能的加强也让其成为更出色的生产工具。

今年7月NVIDIA市值达到2513亿美元,首度超越Intel成为美国市值最高半导体公司,截止至目前,其市值更突破3000亿美元大关,在NVIDIA刚刚发布的第三季度财报中,创下收入47.3亿美元的记录。一个个记录随时间迁移不断被打破,未来还会发生什么?我们非常期待。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5258

    浏览量

    136039
  • Ampere
    +关注

    关注

    1

    文章

    81

    浏览量

    4910
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    内存要取代GPU?HBM之父警告:以英伟达GPU为核心的架构要被颠覆

    主板和CPU成为了主角。   而最近“HBM之父”金正浩教授也语出惊人,提出未来内存将成为主角:“GPU和CPU将会被集成到内存(HBM和HBF)里,沦为内存中的一个组件”。   倒反天罡,在内存里装GPU?   目前AI计算的架构
    的头像 发表于 04-03 09:54 6679次阅读
    内存要取代<b class='flag-5'>GPU</b>?HBM之父警告:以英伟达<b class='flag-5'>GPU</b>为核心的<b class='flag-5'>架构</b>要被颠覆

    GPU与汽车安全有何关联?

    汽车行业正在经历自电子技术应用于汽车以来最深刻的变革。车辆正朝着软件定义、智能网联、AI驱动和持续迭代的方向演进。这一转型带来了前所未有的新功能,同时也引入了更高层级的网络安全与功能安全风险。GPU
    的头像 发表于 01-12 13:21 939次阅读
    <b class='flag-5'>GPU</b>与汽车安全有何关联?

    摩尔线程公布全功能GPU架构路线图:以“花港”新架构与万卡训练集群,开启自主算力新时代

    MUSA统一架构为核心的全栈技术成果,全面展现公司在高端全功能GPU领域的关键突破与前瞻布局。 本次发布的核心成果包括: 1、新架构“花港”亮相:全功能GPU
    发表于 12-20 12:51 1152次阅读
    摩尔线程公布全功能<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>路线图:以“花港”新<b class='flag-5'>架构</b>与万卡训练集群,开启自主算力新时代

    汽车中的GPU是如何使用的?

    (HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
    的头像 发表于 12-03 14:45 9688次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    GPU架构参数如CUDA核心数、显存带宽、TensorTFLOPS、互联方式等,并非“冰冷的数字”,而是直接关系设备能否满足需求、如何发挥最大价值、是否避免资源浪费等问题的核心要素。本篇文章将全面
    的头像 发表于 10-09 09:28 1495次阅读
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架构</b>?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    汽车电气系统的发展演进为测试带来了哪些影响?

    随着汽车智能化进程加速,车辆电气系统方案持续演进。为满足日益严格的功能安全要求,主机厂逐渐引入智能配电、冗余配电等新型方案,这给电气系统的测试环节带来了显著影响。智能配电测试何为智能配电?下图分别
    的头像 发表于 09-01 15:13 365次阅读
    汽车电气系统的发展演进为测试<b class='flag-5'>带来了</b>哪些影响?

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 4500 Ada Generation 具体有哪些
    的头像 发表于 08-28 11:02 4320次阅读
    NVIDIA RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    带来了总双向带宽160GB/s的通讯速率,远高于当时的PCIe接口(实际比现在的PCIe5.0也还要快)。首代的NVlink主要是增强了GPUGPU的通信性能和GPU对系统内存的访问
    发表于 06-18 19:31

    GPU架构深度解析

    GPU架构深度解析从图形处理到通用计算的进化之路图形处理单元(GPU),作为现代计算机中不可或缺的一部分,已经从最初的图形渲染专用处理器,发展成为强大的并行计算引擎,广泛应用于人工智能、科学计算
    的头像 发表于 05-30 10:36 2008次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>架构</b>深度解析

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 4872次阅读

    又一颗国产GPU芯片成功点亮!6nm制程,自研TrueGPU架构

    电子发烧友网综合报道 近日消息,砺算科技宣布其首颗自研架构全自主知识产权GPU芯片在封装回片后已成功点亮,结果符合预期。   砺算科技成立于2021年,是一家致力于研发高性能GPU的公司。砺算科技首
    发表于 05-29 00:48 2789次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB内存,32GBEMMC。 四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NPU,支持INT4/INT8/INT16/FP16混合运算
    发表于 05-15 10:36