0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA GeForce RTX 4060 Ti 8GB FE解析

jf_MYvksKR0 来源:Microcomputer 2023-05-24 09:09 次阅读

NVIDIA Ada Lovelace架构的RTX 40系GPU继续朝向纵深的主流市场延伸,继RTX 4090、RTX 4080和RTX 4070系先后布局了4K+及1440p游戏市场之后,面向当前最为主流的1080p游戏市场的RTX 4060系GPU也在这个5月全面发布,而且NVIDIA一口气发布了三款“60”家族的产品——GeForce RTX 4060 Ti 16GB、RTX 4060 Ti 8GB和RTX 4060。

相较于7月才会正式上市的GeForce RTX 4060 Ti 16GB和RTX 4060来说,RTX 4060 Ti 8GB将在5月下旬正式上市销售。按照NVIDIA的构想,RTX 4060系GPU将在1080p全特效光追游戏的市场上找到属于自己的位置,并取代当前的RTX 3060系级更老的RTX 2060系GPU完成产品的换代更迭。那么,RTX 4060系是否有这个实力扛旗前进,为RTX 40系GPU在主流级游戏市场上继续开疆辟土呢?先上市的RTX 4060 Ti 8GB或许能告诉我们一些答案。



NVIDIA对RTX 40系GPU的游戏市场定位布局还是比较清晰的,最初面世的顶级产品RTX 4090和RTX 4080毫无疑问是主打4K+全特效游戏市场,而之后的RTX 4070系则主打1440p@100fps+的全特效光追游戏市场。那么按照系列的传承逻辑,RTX 4060系GPU自然就应该是应对1080p分辨率的主流级游戏市场。在目前这个市场上,核心战力还是RTX 3060 Ti、RTX 3060以及RTX 2060 SUPER等产品,RTX 4060系GPU的主要目标之一无疑是完成基于这些前一代甚至前两代GPU的游戏升级,从RTX 20系、30系的“60”家族,进化到RTX 40系的“60”家族,为有此需求的游戏玩家带来游戏体验的一波新定义升级——全特效、高光追的1080p@100fps+游戏,这就是RTX 4060系GPU的核心目标。而对于首发的RTX 4060 Ti 8GB GPU来说,按照NVIDIA官方对其的定位,其主要特色在于性能相较 RTX 3060Ti GDDR6提升 15%~70%(DLSS 3),相较 2060 SUPER 提升60%-160%(DLSS 3),同时得益于32MB大容量L2缓存的配置,CUDA核心、光追核心的执行效率也更高,能为玩家带来1080p分辨率下的高帧率、低延迟优秀游戏体验。同时在AI内容和设计创作上,也有非常明显的加速效果。因此对主流消费群体来说,它算是一款真正意义上的甜点级产品。

RTX 4060 Ti GPU核心解析

核心架构全面进化

902fd5ac-f9ca-11ed-90ce-dac502259ad0.png

作为首发上市的“60”家族成员,RTX 4060 Ti GPU在架构上是完全传承了RTX 40系GPU Ada Lovelace核心的全部精髓。采用第三代光追核心和第四代AI核心设计,第三代 RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。新的 Tensor Cores 新增 FP8 引擎,具有高达 1.32 petaflops 的张量处理性能,超过上一代的5倍。

同时,在SM单元的设计上也是全新进化,效率达到了上一代的2倍。RTX 40系GPU所支持的着色器执行重排序SER可以重新调度着色器的工作排序,从而避免部分着色器在等待中浪费算力和电能,以获得更好的效率和性能。着色器执行重排序 SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%以上。

DLSS 3与OFA光流加速器

9050b88a-f9ca-11ed-90ce-dac502259ad0.png

90740fec-f9ca-11ed-90ce-dac502259ad0.png

基于Ada光流加速器的DLSS 3最高可带来相对于DLSS 2达2 倍的性能提升,使 DLSS 3 能够预测场景中帧和帧之间的运动变化,使神经网络能够在保持图像质量的同时提高帧率。DLSS 3 技术支持 GeForce RTX 40 系列 GPU,它包括 3 个功能:帧生成技术、超分辨率(DLSS 2 的关键创新)和 NVIDIA Reflex。开发者只需整合 DLSS 3,即可默认支持 DLSS 2。

为DLSS 3优化,更高效的GPU存储系统设计

GPU的存储系统整体由L1缓存、L2缓存、显存(位宽、带宽、频率)以及系统内存四部分组成。

90935280-f9ca-11ed-90ce-dac502259ad0.png

▲L1缓存位于SM单元内,与CUDA核心几乎是一体的。

90be2226-f9ca-11ed-90ce-dac502259ad0.png

▲L2缓存,位于RTX 40系GPU芯片内,通过高速总线桥梁与SM单元(GPC)通信,由所有SM单元共享。

90ef765a-f9ca-11ed-90ce-dac502259ad0.jpg

▲显存位于显卡的PCB板上,通过显存控制器总线与GPU核心通信。

GPU在工作时需要频繁且有效地访问数据,数据访问越快、越准确,那么GPU所表现出来的游戏或创作性能就越高。在RTX 40系GPU的每个SM单元内都存在一个超低延迟的L1缓存,这是CUDA核心、AI核心和光追核心在进行计算时的数据访问首选项,理论速度上它是最快的。但由于L1缓存位于SM单元内,因此不可能设计得非常大(空间、散热与成本的综合考虑)。

如果GPU的核心在L1中访问不到所需要的运算数据,那么就会转向L2缓存中寻找,在L2缓存中如果找到了所需数据,则会直接调用到GPU内核,这叫缓存信息命中。反之,如果在L2缓存中仍然找不到数据(缓存信息缺失),那么就要由GPU的显存控制器通过显存总线接口去访问GPU外部更大容量的显存,这一速度是远低于访问GPU内部缓存的,而且产生了额外的工作流程。相比L1、L2缓存的信息访问而言,在性能和功耗效率上都大大降低了。

910fa3ee-f9ca-11ed-90ce-dac502259ad0.png

▲传统GPU的存储系统设计中,如果在较低的L2缓存设计下,访问未命中的情况会比较多(图中红色部分),此时这些访问未命中的数据就需要通过总线接口到显存(VRAM)中寻找,速度大大降低。如果显存中仍然未找到需要的数据,那么就要通过系统总线去访问系统内存,并复制到显存中进行调用,这一过程是效率最低的。

91276b46-f9ca-11ed-90ce-dac502259ad0.png

▲RTX 40系GPU上,L2缓存容量得到了极大增强,RTX 4060 Ti GPU配置了32MB的大容量缓存,大大提高了L2缓存中的访问命中率。因此在相同甚至更低的显存带宽下,大容量的L2缓存设计能有效提升GPU核心的效率,表现在游戏性能上就是大幅度提升了游戏帧率。

简单来讲,更高的L2缓存设计能极大提升GPU的数据访问命中率,从而让GPU核心能在整体显存带宽和容量成本控制上有更大的冗余空间,且拥有更高的效率。尤其是对于DLSS 3来说,更大的L2缓存也在很大程度上提升了DLSS 3的执行效率,对整体游戏性能的表现提升有着巨大贡献。

更多的GPU存储系统控制理论在这里我们就不赘述了,后续我们会专门出一篇相关的技术解析文章为读者解惑。

新一代NVIDIA编码器(NVENC)


RTX 40系GPU全部采用了第八代NVENC编码器的配置,能够将视频导出时间至多缩短一半,并支持 AV1 编码。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多公司都已在采用 NVENC AV1 编码器。RTX 4060 Ti也搭配了第八代NVENC编码器和第五代NVDEC解码器。

更强的Studio性能

9164bafa-f9ca-11ed-90ce-dac502259ad0.png

除了游戏性能之外,RTX 40系GPU也是用于内容创作的优秀GPU,在加速3D设计创作、视频剪辑处理和AI计算方面,都有非常不错的表现。

同时吗,专用的NVIDIA Studio Driver在顶级创意应用上经过全面测试,能够最大限度地提高可靠性,比如:

●主播可以用支持AV1的全新第八代编码器来提高现场直播质量,利用 NVIDIA Broadcast AI

特效改善麦克风和网络摄像头,并进入AI驱动的 VTubing。

●得益于RTX 40 系列的双编码器和高达2倍的AI工具性能,视频编辑的输出速度最高可提升2倍。

●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 设计创作者可以在4K@60fps 下进行创作。

●Modder可以重制经典游戏,并通过RTX Remix开启RTX。

AD106核心,1080p游戏设计优化

9190f246-f9ca-11ed-90ce-dac502259ad0.png

91aa6302-f9ca-11ed-90ce-dac502259ad0.png

91c1e0d6-f9ca-11ed-90ce-dac502259ad0.png

▲完整版AD106核心(上)、RTX 4060 Ti 采用的AD106-350核心(中)、7月将会上市的RTX 4060所采用的AD106核心(下)。

91e53cb6-f9ca-11ed-90ce-dac502259ad0.png

规格上来看,本次测试的主角RTX 4060 Ti 8GB FE采用的是代号为AD106的Ada Lovelace核心。完整版的AD106拥有三个完整的GPC,36个SM模组。RTX 4060 Ti的设计则去掉了一个GPC中的2个SM模组,共有三个GPC、34个SM模组。因此,RTX 4060 Ti 8GB FE配置了34个第三代光追核心和136个第四代AI核心,拥有4352个CUDA核心。同时,GPU配置了4个32bit的16Gb GDDR6显存控制器(每个控制器控制2GB显存),实现了128bit的显存带宽和8GB GDDR6显存容量配置,整体显存带宽为288GB/s。与RTX 4070相比,硬件规格上的差距约35%。

和前一代的RTX 3060 Ti FE相比,RTX 4060 Ti 8GB FE在CUDA核心数和显存位宽上都有所落后,不过在L2缓存容量上达到了前者的8倍之多,结合更高效的SM单元和更高的核心频率,因此在游戏运行效率上有望超越RTX 3060 Ti不少。再加上DLSS 3的支持,RTX 4060 Ti 8GB FE的游戏性能表现还是可以期待的。




TGP设计为160W的GeForce RTX 4060 Ti 8GB FE在外观尺寸上与RTX 4070 FE保持了一致,仍然是非常轻盈的“小卡”设计,而且传承了RTX 40系公版显卡的风格——X形的金属中框搭配正反交错的散热风扇,而散热片仍然是外露的分布式散热片。不过与RTX 4070 FE不同的是,在金属中框部分的颜色由RTX 4070 FE的香槟银色改为了亮银色,以与RTX 4070 FE在外观上有一个显眼的区隔。



▲整体设计朴素大方,没有RGB灯效,非常素雅。

92ad8acc-f9ca-11ed-90ce-dac502259ad0.jpg

▲RTX 40系的特色标配——ATX 3.0电源规范支持的PCIe 5.0 16Pin 12VHPWR接口供电接口。

92c63dba-f9ca-11ed-90ce-dac502259ad0.png

▲输出接口部分仍然是3DP 1.4a+1 HDMI 2.1的组合

NVIDIA GeForce RTX 4060 Ti Founders Edition(8GB)产品参数

核心架构:Ada Lovelace

核心代号:AD106-350

制程工艺:TSMC 4N定制

SM单元:34

CUDA核心数(流处理器):4352

光追核心数(RT Cores):34

AI核心数(Tensor Cores):136

核心频率:2310MHz~2535MHz

显存容量:8GB GDDR6

显存速率:16Gbps

显存位宽:128bit

显存带宽:288GB/s

支持DLSS版本:DLSS 3

TGP:160W

建议搭配电源额定功率:550W

显卡厚度:双槽

首发参考价格:3199元

性能实测

传统游戏性能超RTX 3060 Ti 15%左右,DLSS 3作用下增幅巨大

接下来让我们进入实测环节。在这一环节中,我们将主要考察GeForce RTX 4060 Ti 8GB FE显卡在游戏性能和设计创作性能两大方面的实际表现。综合玩家的实际情况与显卡升级的需求,我们将前一代的GeForce RTX 3060 Ti FE(8GB GDDR6)、RTX 3070(8GB GDDR6,替代我们手中暂时没有的RTX 3060 Ti GDDR6X版本,二者性能比较接近,RTX 3070 FE略强一点)以及更前一代的图灵核心的GeForce RTX 2060 SUPER纳入了对比参考测试的范畴,主要是看看对还在使用RTX 2060 SUPER这类老显卡的用户来说,从RTX 20系的“60”家族升级到RTX 40系的“60”家族,能带来多大的性能提升。

测试平台

GPU:NVIDIA GeForce RTX 4060 Ti 8GB FE、RTX 3070 FE、RTX 3060 Ti FE、RTX 2060 SUPER FE

CPU英特尔酷睿i9-13900K

主板:英特尔Z790

内存:影驰名人堂DDR5 6000 32GB

电源:鑫谷昆仑冰山1250W(ATX 3.0)

显示器:戴尔UP3218K(7680×4320@60Hz)

操作系统:Windows 11 Pro 22H2

显卡驱动:NVIDIA Game Ready Driver 531.93

传统游戏性能测试

先来看下在非DLSS 3的传统游戏环境下,RTX 4060 Ti 8GB FE会有怎样的性能表现。在这部分测试中,我们主要目的是考察在不开启DLSS 3的状态下,GeForce RTX 4060 Ti 8GB FE的游戏性能。测试选取了当前比较热门的共16款游戏大作,来检验RTX 4060 Ti 8GB FE在1440p和1080p分辨率下的具体表现。游戏统一设置为最高画质和最高光追效果,DLSS模式统一设置为“平衡”。

92ee06c4-f9ca-11ed-90ce-dac502259ad0.png

在3DMark理论性能测试部分,RTX 4060 Ti 8GB FE领先RTX 3060 Ti FE约13%,领先RTX 2060 SUPER FE近60%。在与RTX 3070 FE的比较中,RTX 4060 Ti 8GB FE平均性能落后约3%。

930d2202-f9ca-11ed-90ce-dac502259ad0.png

932ae684-f9ca-11ed-90ce-dac502259ad0.png

93464d98-f9ca-11ed-90ce-dac502259ad0.png

9373095a-f9ca-11ed-90ce-dac502259ad0.png

938f33f0-f9ca-11ed-90ce-dac502259ad0.png

与前一代的对位产品RTX 3060 Ti FE相比,无论是1080p分辨率还是1440p分辨率,RTX 4060 Ti 8GB FE的性能都领先15%~18%,表现还是比较不错的。而与更前一代的图灵核心的RTX 2060 SUPER FE相比,RTX 4060 Ti 8GB FE的整体游戏性能领先更是达到了75%以上,这无疑大大增添了从RTX 2060 SUPER升级到RTX 4060 Ti的价值。

同时我们可以看到,在最高画质、最高光追特效设置下,开启DLSS之后,RTX 4060 Ti 8GB FE几乎在所有游戏中都实现了60fps+的流畅游戏水平,在半数以上的游戏中甚至都达到了100fps+的绝对流畅游戏水平线,表现不错。

从实际游戏的测试情况来看,RTX 4060 Ti 8GB FE在所有游戏的综合测试结果中性能表现基本与RTX 3070 FE相差不大,综合差距在2%左右。在不开启DLSS时,RTX 4060 Ti 8GB FE整体综合成绩略略逊色于RTX 3070,开启DLSS之后则略微领先,也说明第四代AI核心在DLSS的执行效率上要强于RTX 30系所配置的第三代AI核心。

RTX 4060 Ti 8GB FE与RTX 3070 FE的纸面规格差距比较大,二者在核心规模,包括CUDA、AI和光追核心的数量上存在35%以上的差距,而且显存位宽也相差一倍。我们在测试前曾想过RTX 4060 Ti 8GB FE相比RTX 3070 FE是否会有明显的领先优势,测试结果显示二者的传统游戏性能基本相当,还让我们感觉略有一点点意外。不过在核心规格相差35%的硬条件前提下,RTX 4060 Ti 8GB FE表现出与RTX 3070 FE跨代次与档次而持平的性能,仔细想想,这也是可以接受的吧。何况它的首发价格也只是399美元而已,远低于RTX 3070的首发价格499美元。

DLSS 3,性能跨越提升的主要价值

光追游戏环境目前来看肯定是已经成为未来游戏大作的发展主流,目前已经有超过300款游戏和应用提供了对DLSS的支持,而且已经有超过30款的游戏和应用已经实现了对DLSS 3的支持。从近期推出的各类热门游戏大作来看,对实时光线追踪的支持已经占据了游戏发展趋势的主流。而为了在全特效+高光追的极致环境中流畅游戏,NVIDIA赋予RTX 40系GPU的正是DLSS 3。

在之前的多次首发评测中,我们都再三提到了RTX 40系GPU的这一秘密黑科技武器。现在有不少玩家还认为DLSS 3只是RTX 40系GPU的一个“添头”,它只存在附加价值,而不是GPU本身的硬件性能表现。在衡量显卡综合性能乃至综合性价比时,不能成为其中的加分项或参考水平,甚至很多玩家根本对其无视。

其实我们对此倒是有一些不同的看法。DLSS 3作为RTX 40系GPU的黑科技武器,正如我们之前在多次测试中再三强调过的一样——它是GPU自身的价值体现之一,也是在综合衡量GPU性能时的重要参考指数。支持DLSS帧生成功能,这就是RTX 40系GPU的一项巨大优势,也是它相较于前两代光追GPU及与竞争对手产品进行市场竞争时的重要闪光点。

在DLSS 3的性能测试部分,我们选取了8款目前支持DLSS 3的热门游戏大作在RTX 4060 Ti 8GB FE显卡上进行了详细测试。

93aae88e-f9ca-11ed-90ce-dac502259ad0.png

93d04ebc-f9ca-11ed-90ce-dac502259ad0.png

93eeaf60-f9ca-11ed-90ce-dac502259ad0.png

毫无意外,DLSS 3再一次表现出了超强的游戏性能提升效果。相对于关闭DLSS的游戏环境,开启DLSS 3之后,游戏帧率都获得了100%以上的提升,部分游戏中的提升幅度甚至超过了200%。相比不开启帧生成功能的DLSS 2而言,游戏帧率的提升也达到了50%~100%不等。表现非常优秀。

94141d5e-f9ca-11ed-90ce-dac502259ad0.png

942df9c2-f9ca-11ed-90ce-dac502259ad0.png

943f5dde-f9ca-11ed-90ce-dac502259ad0.png

945a5332-f9ca-11ed-90ce-dac502259ad0.png

再来看前后代产品在DLSS 2环境和DLSS 3环境下的游戏性能实际表现。前面的测试中我们看到在不开启DLSS 3时,RTX 4060 Ti 8GB FE的游戏性能基本与RTX 3070相当。但在开启DLSS 3之后,相比只支持DLSS 2的RTX 3070 FE而言,RTX 4060 Ti 8GB FE在1080p分辨率下的性能达到了RTX 3070 FE的1.5倍左右,在1440p分辨率下的性能也达到了RTX 3070 FE的1.4倍,彻底实现了对RTX 3070 FE的跨代跨档次完全超越。

与前一代的对位产品RTX 3060 Ti FE相比,开启DLSS 3之后,RTX 4060 Ti 8GB FE的性能领先优势达到了70%(1440p)和80%(1080p)。而对老显卡RTX 2060 SUPER的用户来说,升级到RTX 4060 Ti 8GB FE后,DLSS 3环境下的性能增幅更是可以达到150%以上。

开启DLSS 3之后,可以看到在1080p分辨率下全部的测试游戏中,RTX 4060 Ti 8GB FE都实现了100fps+的绝对流畅游戏水准。即使在1440p分辨率下,也有半数游戏在最高画质、最高光追效果的设置下实现了100fps+的游戏水平,表现还是非常抢眼的。

接下来再看看NVIDIA Reflex。NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延迟技术,能够极大地改善游戏体验的流畅性,尤其是对FPS游戏来说更是意义重大,毕竟更低的延迟也就意味了更快速的反应操作。目前已经有超过70款的游戏和应用支持NVIDIA Reflex。另外随着FrameView 1.4版本的更新,现在FrameView已经能够在支持的游戏中监测、记录游戏的PCL系统延迟时间与1%L fps低帧,这两个指标都是关系到游戏流畅与否的主要因素。

在RTX 4060 Ti 8GB FE的平台上,开启DLSS 3之后,游戏延迟是否能得到有效降低?1%L fps有没有明显的改善呢?

946b4f5c-f9ca-11ed-90ce-dac502259ad0.png

在这个部分的测试中,我们仍然基于前一测试选择的八款支持DLSS 3的游戏进行了全面的测试。而从测试结果来看,也完全符合我们的预期。

从整体结果来看,DLSS 3不只是在帧率表现上相对于Native原生帧率有100%~400%的提升,而且在1%L fps和PCL系统延迟上也有惊艳的表现。比如在1440p分辨率设置的《赛博朋克2077》游戏中,在DLSS关闭的情况下游戏帧率不足30fps,游戏的1%L fps仅为22fps左右,说明游戏已经基本无法正常进行,卡顿的情况十分严重,而且PCL系统延迟在DLSS关闭时也高达118ms。在开启DLSS 3的平衡模式之后,游戏帧率飙升到立刻90fps左右,达到了绝对流畅水准。同时1%L fps也提升到了64fps,说明已经不会在任何情况下影响到游戏的流畅运行。另一方面系统延迟也在开启DLSS 3之后从118ms下降到了56ms,让游戏更加丝滑顺畅,能有效提升游戏体验。在其余几款测试游戏中,包含了NVIDIA Reflex技术的DLSS 3也有着同样的表现,比如在《巫师3:狂猎》测试中,1080p分辨率下开启DLSS 3之后,游戏帧率从42fps飙升到105fps,同时在Reflex的作用下系统延迟也从131ms降低到了44ms左右,效果十分明显。

最后再说两句。DLSS 3的各大模式(除了在低于4K分辨率环境下开启为8K分辨率准备的超级性能模式之外)开启之后对游戏画质几乎没有实质性的影响,肉眼几乎不可察觉,甚至在质量和平衡模式下,游戏画质还有略优化的迹象。所以,面对支持DLSS 3的游戏,RTX 40系显卡的用户根本不需要考虑,直接开启就好!鱼与熊掌兼得的机会就摆在面前,为啥不要呢?

设计创作性能测试

从NVIDIA重点打造Studio生态圈以来,RTX GPU就在设计创作领域绽放出了异彩,当下RTX GPU已经能够为超过110款的设计创作应用提供加速性能,无论是3D渲染加速,还是视频剪辑、转码,都有着优异的表现。我们之前在测试RTX 4090、RTX 4080和RTX 4070系GPU时也验证过RTX 40系GPU的设计创作加速性能。到了面向主流群体的甜点GPU——RTX 4060系上市之时,它在设计创作性能上是否也还是有相对前一代产品的明显优势呢?

9487b66a-f9ca-11ed-90ce-dac502259ad0.png

94b2b5f4-f9ca-11ed-90ce-dac502259ad0.png

在视频转码测试部分,我们选择了两款主流的视频剪辑处理软件Davinci Resolve Studio和剪映Pro的最新版本进行了详细测试。从测试结果可以看出,在Davinci Resolve Studio中,在视频转码部分性能RTX 4060 Ti 8GB FE比RTX 3070 FE强10%,比RTX 3060 Ti强20%左右。魔法遮罩AI处理则比后二者强23%。相比RTX 2060 SUPER FE来说,性能领先程度更是达到了40%左右。新一代的NVENC性能更加强悍。

在剪映Pro的测试中结果也比较类似,除了在8K源视频转码测试中RTX 4060 Ti 8GB FE与RTX 3070 FE和RTX 3060 Ti FE基本相当之外,在4K转码性能测试中性能也领先约20%。在AV1转码性能上,RTX 4060 Ti 8GB FE更是领先达到了200%左右,相比RTX 2060 SUPER FE,在AV1转码性能上领先超过了300%(RTX 30系与RTX 20系的NVENC不支持GPU硬件加速编码AV1,只能采用软算法转码)。

这里还是要强调一下RTX 40系GPU的第八代NVENC编码器所支持的AV1格式硬件编码加速。AV1格式相比H.264等传统视频格式,在同码率下的视频质量更优秀,同时占用的体积也较小,代表着未来的视频主流方向。对AV1格式硬件编码加速的支持,也是RTX 40系GPU的特色之一。

94c76396-f9ca-11ed-90ce-dac502259ad0.png

94fa41f8-f9ca-11ed-90ce-dac502259ad0.png

▲我们用OBS录制了《毁灭全人类2:重新探测》游戏中的一段原始视频,并在Davinci Resolve Studio中用RTX 4060 Ti 8GB FE将其分别转码输出为1080p@30fps、6000Kbps码率的H.264格式(图右)和AV1格式(图左)的两段视频。通过在NVIDIA ICAT软件中的逐帧比较分析,可以清晰地看到,AV1格式的视频在相同码率下视频质量明显比H.264格式的视频要优秀得多(图片可点击放大观察)。

953962de-f9ca-11ed-90ce-dac502259ad0.png

955c5f78-f9ca-11ed-90ce-dac502259ad0.png

958c3770-f9ca-11ed-90ce-dac502259ad0.png

再来看3D渲染性能。在V-Ray Benchmark测试中,GPU CUDA加速性能测试中,由于CUDA核心数量相差了35%左右,RTX 4060 Ti 8GB FE性能略略小负于RTX 3070 FE,不过差距仅有2%左右,基本可以认为性能相当。而在GPU RTX加速性能测试部分,RTX 4060 Ti 8GB FE性能领先RTX 3070 FE约6%,领先RTX 3060 Ti FE约20%,也充分展现了第三代光追核心的优秀架构与性能。相比前两代的产品RTX 2060 SUPER FE而言,RTX 4060 Ti 8GB FE更是在两项V-Ray Benchmark测试中平均性能领先达到150%左右。

Blender Opendata Benchmark与Blender 3.5的实际模型渲染测试中的结果也比较类似。RTX 4060 Ti 8GB FE综合性能领先RTX 3070 FE约10%~15%,领先RTX 3060 Ti FE约20%~30%,相比RTX 2060 SUPER则有着平均约60%的性能领先幅度。

AI运算性能

在这部分的测试中,我们主要考察第四代Tensor Core AI核心配合全新设计的SM带来的高效CUDA核心配合之下,RTX 4060 Ti 8GB FE在当下热门的AI计算应用中会有怎样的性能表现。

959ab408-f9ca-11ed-90ce-dac502259ad0.png

首先是ON1 Resize AI 2022软件中的图片AI缩放处理性能测试。和之前测试RTX 40系GPU时的方法与设置一样,我们选择了5张5K照片,并将其等比无损缩放到200%(10K+级精度照片)。从测试结果来看,RTX 4060 Ti 8GB FE的图片AI处理性能明显遥遥领先,相对RTX 3070和RTX 3060 Ti FE的领先程度分别达到了15%和25%,相对于RTX 2060 SUPER的性能领先达到了40%以上。

早在RTX 4070 Ti发布时,NVIDIA就公布了RTX VSR(RTX Video Super Resolution,RTX视频超分辨率)的相关信息,这是一种基于RTX GPU之上的视频缩放增强技术。在RTX 4070发布时,NVIDIA也正式在驱动控制面板中实现了对VSR的支持。简单来说,它可以通过AI计算的细节增强,让视频播放更加清晰。

目前要实现VSR需要两个硬性条件,其一是必须基于RTX 30系以上的GPU并得到驱动程序的支持,其二则是需要支持VSR功能的浏览器或播放器。我们测试所用的Game Ready Driver 531.91驱动程序已经开放了对VSR的支持,我们就通过FireFox浏览器(不支持VSR)和Google Chrome浏览器(支持VSR),播放两段来自Bilibili网站的视频,来体验一下RTX VSR的表现。

95ade622-f9ca-11ed-90ce-dac502259ad0.png

▲勾选RTX视频增强选项下的“超分辨率”,就能在支持VSR功能的浏览器中开启RTX 视频增强。增强等级有1~4可选。

95bdad78-f9ca-11ed-90ce-dac502259ad0.png

▲在《黑神话:悟空》游戏8分钟实战演示视频中,可以明显地看到在Chrome浏览器中开启VSR(图右)后,视频质量得到了较大程度的增强,相比FireFox浏览器中播放质量更好,更清晰(点击放大观察)。

95e261ae-f9ca-11ed-90ce-dac502259ad0.png

▲在东方废土题材的游戏《Ashfall》的演示视频中,同样可以看到在Chrome浏览器(图左)中开启VSR之后,相比FireFox浏览器播放时,视频质量得到了明显的增强,清晰度更好,细节更丰富(点击放大观察)。

最后我们再来看一下Stable Diffusion AI图片生成计算性能的测试。和之前我们测试RTX 4070 FE时一样,测试中我们也选择了“一座都铎风格的房子,在水边,美丽渲染图,日落,梦幻森林,照片般逼真,电影般构图,电影般高细节,超高逼真,电影般的照明,景深,超精细,色彩编码精美,8k,多细节,明暗错落,梦幻”作为构图的关键词,分别按照这样的关键词生成1、4张高精度AI图片。

考虑到RTX 4060 Ti 8GB FE及对比显卡的显存容量与硬件规格,参数设置如下:

采样迭代步数:20

生成批次-每批数量:1-1、4-1

提示词相关性:7.5

分辨率:768×768

9666b6fc-f9ca-11ed-90ce-dac502259ad0.png

我们就通过生成单张图片与4张图片的两次简单测试,来考察RTX 4060 Ti 8GB FE的AI图片生成计算能力。

968f8f14-f9ca-11ed-90ce-dac502259ad0.png

96aade04-f9ca-11ed-90ce-dac502259ad0.png

从最终测试结果来看,基于CUDA和Tensor Core加速的Stable Diffusion测试中,RTX 4060 Ti 8GB FE的性能领先RTX 3070 FE约6%~7%,领先RTX 3060 Ti FE约20%,领先RTX 2060 SUPER FE则达到了35%~45%。在CUDA核心与Tensor Core数量都远低于RTX 3070 FE的情况下,RTX 4060 Ti 8GB FE的Stable Diffusion AI计算性能却更强,显然是Ada架构的CUDA核心与第四代Tensor Core的性能与效率更高所导致。

功耗与温度

RTX 4060 Ti 8GB FE的TGP官方数据为160W,这显卡的理论功耗上限。但在实际应用场景中,不同的显卡却有不同的表现,比如4K游戏状态、1440p游戏状态、视频编辑处理状态,3D建模渲染状态等等,都有不同的功耗表现。在不同的应用场景下,RTX 4060 Ti 8GB FE在功耗上又会有怎样的表现呢?

96d22414-f9ca-11ed-90ce-dac502259ad0.png

96ef91de-f9ca-11ed-90ce-dac502259ad0.png

在《赛博朋克2077》游戏的1440p及1080p分辨率、最高画质、超级光追效果、DLSS平衡设置下(关闭DLSS Frame Generation),可以清晰地看到,在1440p分辨率下,RTX 4060 Ti 8GB FE的功耗在140W左右波动,1080p分辨率下则在130W左右波动。对比RTX 3070 FE功耗则平均达到了200W左右。同时RTX 3070 FE功耗的波动幅度非常大且频繁,相比之下RTX 4060 Ti 8GB FE的表现则非常稳定,性能发挥更稳定,有助于提升1%L fps,确保游戏运行更加顺畅,减少卡顿的情况。

974e3c2a-f9ca-11ed-90ce-dac502259ad0.png

我们用《霍格沃茨之遗》《原子之心》《赛博朋克2077》以及《CS:GO》四款游戏测试了1080p和1440p分辨率下最高画质、最高光追效果(如果支持光追)、DLSS平衡模式(关闭DLSS Frame Generation,如果支持DLSS 3)下的游戏帧率,并取其平均值汇总。最终我们发现,在1080p分辨率和1440p分辨率下,RTX 4060 Ti 8GB FE的平均游戏功耗为130W和141W,对比之下RTX 3070 FE的平均游戏功耗则分别达到了163W和182W,RTX 3060 Ti FE更是在两种分辨率下都达到了接近200W的程度。这也清晰地表明了全新架构设计的RTX 4060 Ti 8GB FE有着更高的能耗比。

975efc7c-f9ca-11ed-90ce-dac502259ad0.png

▲在散热部分,RTX 4060 Ti 8GB FE烤机温度为71℃,与RTX 3070 FE相当,表现中规中矩。

主流游戏市场新甜点,重新定义1080p游戏升级

首先是测试总结,懒人福利:

1.RTX 4060 Ti 8GB FE的传统游戏性能相比RTX 3060 Ti FE约有15%~20%的性能提升,相比RTX 2060 SUPER FE的性能提升则在80%左右。跨档次对比RTX 3070 FE,在传统游戏性能上二者基本相当,各有胜负。不开启DLSS时,RTX 4060 Ti小幅度落后,DLSS开启时,RTX 4060 Ti 8GB FE略略小幅领先,但差距都在2%以内。整体来看传统游戏性能中规中矩,算是正常的迭代,不能说有特别惊艳的表现,不过倒也不算差。

2.DLSS 3再次成为RTX 40系的核心亮点。在开启DLSS 3之后,RTX 4060 Ti 8GB FE的游戏性能猛涨,相比RTX 3070 FE性能增幅达到了40%左右,相比RTX 3060 Ti的性能增幅也达到了70%以上,更是拥有了相对于RTX 2060 SUPER约2.7倍的性能。此时RTX 4060 Ti 8GB的表现是惊艳的。

3.全新的SM、第八代NVENC和第四代Tensor Core使得RTX 4060 Ti 8GB FE在设计创作性能上有着不俗的表现,视频转码性能整体领先RTX 3070 FE近15%,领先RTX 3060 Ti FE约15%~20%。设计创作性能上也表现不俗,领先RTX 3070 FE和RTX 3060 Ti FE分别达到接近10%和20%。

4.能耗比出色仍然是RTX 4060 Ti 8GB FE的一大亮点,平均游戏功耗仅为135W左右,远低于RTX 3070 FE的170W左右以及RTX 3060 Ti FE的195W左右。

5.尽管CUDA核心相比RTX 3070 FE和RTX 3060 Ti FE更少,但凭借更高效的CUDA架构与效率,以及第四代的Tensor Core核心,RTX 4060 Ti 8GB FE在AI相关计算上仍然表现出了较为明显的优势,相对于RTX 3070 FE和RTX 3060 Ti FE分别达到了7%和20%左右。

按照NVIDIA的官方定位,RTX 4060系GPU都是面向1080p主流游戏市场的,但3199元起的价格可能会让很多玩家感到迷惑——这是1080p游戏显卡的定位吗?很显然,NVDIA所说的1080p游戏市场应该是一个升级的概念——全特效、全光追下的高帧率1080p游戏市场,在最好的游戏环境中玩1080p游戏。从实际测试的情况来看,RTX 4060 Ti FE在传统游戏环境下开启DLSS之后,几乎所有的测试游戏大作都能在全特效、全光追的设置环境下在1080p分辨率下达到60fps以上的流畅游戏水平,而在开启DLSS 3之后,游戏帧率在全特效、全光追环境下则几乎都能达到100fps+的绝对流畅游戏水准,达到了NVIDIA的预设构想。

这些年来我们一直在提倡消费升级,现在NVIDIA很明显是要想带来游戏体验的升级,RTX 4090和RTX 4080带来4K+游戏的体验升级,RTX 4070系带来1440p游戏升级,而这次面世的RTX 4060系则想要带来的是1080p游戏升级。确实,受限于硬件规格配置,不开DLSS 3的话,RTX 4060 Ti 8GB FE跟RTX 3070 FE大差不差,性能非常接近,没有表现出对RTX 3070的明显性能领先,相信这也会让不少玩家有些“吐槽”。但开了DLSS 3后性能突飞猛进,就明显领先RTX 3070 FE。结合Ada架构大缓存的针对性设计思路,NVIDIA为RTX 4060系预设的战场就是DLSS 3下的全特效1080p@100fps+光追游戏,这是RTX 3070和RTX 3060Ti 都达不到的。而且对DLSS 3的支持也是大加分项,它的战场在更深远的未来,我们也非常看好DLSS 3的发展,全特效光追+DLSS 3应该已经成为今后3A级游戏大作的核心方向之一。

最后实话实说,不吹不黑,不能说RTX 4060 Ti 8GB是一款非常优秀的高性价比GPU产品,毕竟性能未能明显超越RTX 3070相信在不少玩家看来都是一种遗憾。不过我们认为它算是一款合格的游戏市场布局产品。如果你追求的只是1080p下的“能游戏”,那么千元级的显卡就能实现,RTX 4060 Ti 8GB确实不是你的菜。但如果要追求高帧率、低延迟、高能耗比的1080p全特效光追游戏,目前来看RTX 4060 Ti 8GB是一个不错的选择。尤其是对于那些追求极致高能小钢炮的玩家来说,拥有出色能耗比、低功耗、优秀1080p游戏性能的RTX 4060 Ti 8GB更是合适的佳选。而对于RTX 2060 SUPER甚至是GTX 1660这类老显卡玩家来说,升级到RTX 4060 Ti 8GB之后,1080p的游戏体验也能直接从全特效能玩飞跃提升到全特效、全光追的高帧率体验。如果你有足够的预算,那它也是老的“60”家族显卡升级或是万元内新装机的值得考虑的对象。


审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    744

    浏览量

    36600
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4420

    浏览量

    126705
  • 存储系统
    +关注

    关注

    2

    文章

    382

    浏览量

    40704

原文标题:DLSS 3加持40系甜点上市,NVIDIA GeForce RTX 4060 Ti 8GB FE解析

文章出处:【微信号:Microcomputer,微信公众号:Microcomputer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    宏碁发布两款14英寸游戏本新品:Nitro 14与Predator Heli 

    新版Nitro 14定价自1299.99美元(约合9412元RMB)起,顶配版配置包括AMD锐龙7 8845HS处理器、Nvidia GeForce RTX 4060显卡、32
    的头像 发表于 04-10 09:59 135次阅读

    英伟达、AMD新款显卡或仍配备2GB GDDR7显存

    据悉,现行GDDR6显存每模块采用8GB显存容量,对此,@kopite7kimi援引内部消息称,英伟达即将发布的GeForce RTX 5090显卡并无内存翻倍的可能性。
    的头像 发表于 03-08 14:54 190次阅读

    技嘉RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰显卡评测

    3月正是开学季,技嘉作为专注板卡大厂,在这个时候带来了4款基于GeForce RTX 40 系列的EAGLE OC ICE冰猎鹰显卡,分别对应RTX 4070 Ti SUPER、
    的头像 发表于 03-06 10:00 424次阅读
    技嘉<b class='flag-5'>RTX</b> 4070 <b class='flag-5'>Ti</b> SUPER Eagle OC ICE冰猎鹰显卡评测

    英伟达GeForce RTX 4090显卡怎么样

    英伟达的GeForce RTX 4090确实是一款高端显卡,其强大的规格和性能使其在游戏和图形处理领域处于领先地位。这款显卡拥有高达760亿个晶体管、16384个CUDA核心和24GB的高速镁光GDDR6X显存,使得它在处理大型
    的头像 发表于 03-01 17:04 631次阅读

    影驰GEFORCE RTX 4070 TI SUPER星曜OC评测分析

    作为MC评测室的“常驻嘉宾”,影驰星曜系列的设计对于我们来说可谓烂熟于心,而影驰GEFORCE RTX 4070 TI SUPER星曜OC在外观设计方面依然沿袭了星曜系列的设计,其差异与它的“姐姐们”相差不会过于悬殊,主要还是在
    的头像 发表于 01-29 10:49 392次阅读
    影驰<b class='flag-5'>GEFORCE</b> <b class='flag-5'>RTX</b> 4070 <b class='flag-5'>TI</b> SUPER星曜OC评测分析

    七彩虹推出龙年限定版iGame GeForce RTX 4060系列显卡

    近日,知名显卡制造商七彩虹推出了一款限量版龙年限定iGame GeForce RTX 4060系列显卡,包括RTX 4060
    的头像 发表于 01-29 10:31 860次阅读

    RTX 4070 Ti SUPER详细评测

    2024年1月9日,NVIDIA发布了GeForce RTX 40 SUPER系列显卡,包括RTX 4070 SUPER、RTX 4070
    发表于 01-29 10:31 1418次阅读
    <b class='flag-5'>RTX</b> 4070 <b class='flag-5'>Ti</b> SUPER详细评测

    耕升GeForce RTX 4070 SUPER追风显卡评测

    耕升RTX 4070 SUPER追风5个GPC、28个TPC、56组SM单元以及7168个CUDA核心的规格相比RTX 4070 Ti要弱5%左右,而相比RTX 4070则要强20%左
    发表于 01-19 13:44 605次阅读
    耕升<b class='flag-5'>GeForce</b> <b class='flag-5'>RTX</b> 4070 SUPER追风显卡评测

    NVIDIARTX 3060将会继续正常生产、供应

    最新消息显示,RTX 3060原本确实有在近期停产、停售的计划,其地位交给RTX 4060来继承。
    的头像 发表于 12-05 10:08 644次阅读

    Stable Diffusion的完整指南:核心基础知识、制作AI数字人视频和本地部署要求

    3070;NVIDIA RTX GeForce 3080;NVIDIA RTX GeForce
    的头像 发表于 09-07 14:12 1436次阅读
    Stable Diffusion的完整指南:核心基础知识、制作AI数字人视频和本地部署要求

    NVIDIA推出 GeForce RTX 系列游戏处理器

    NVIDIA 发布全球首款实时光线追踪 GPU —— GeForce RTX
    的头像 发表于 08-01 15:08 552次阅读

    RTX 4060 Ti 16GB闪电降价

    NVIDIA日前极为低调地推出了RTX 4060 Ti 16GB大显存版本,价格达到了3899元起,相比于
    的头像 发表于 07-25 10:33 723次阅读
    <b class='flag-5'>RTX</b> <b class='flag-5'>4060</b> <b class='flag-5'>Ti</b> 16<b class='flag-5'>GB</b>闪电降价

    RTX 4060遇冷:没想到降价这么快、这么狠!

    60系列本来是主流玩家最青睐的显卡,但是这一代的RTX 4060 TiRTX 4060都栽了大跟头:性能提升有限,价格却高高在上。
    的头像 发表于 07-05 11:20 542次阅读

    第一款采用AD107小核心的桌面显卡RTX 4060

    RTX 4060将是第一款采用AD107小核心的桌面显卡,只有3072个CUDA核心、128-bit 8GB GDDR6显存,不会像RTX 4060
    发表于 06-26 10:42 667次阅读
    第一款采用AD107小核心的桌面显卡<b class='flag-5'>RTX</b> <b class='flag-5'>4060</b>

    速度穿越!GeForce RTX 4060 系列 GPU 隆重推出:售价 ¥2,399 元起!

    美国加利福尼亚州圣克拉拉市 — 2023 年 5 月 18 日 — NVIDIA 发布   GeForce RTX 4060  系列 GPU,这两款 GPU 支持  
    的头像 发表于 05-23 07:45 780次阅读