NVIDIAGeForce RTX3060 Ti 全球首发评测

时间：2024-05-04

《微型计簋机》评测室

自从9月初NVIDIA GeForce RTX 30系显卡的首发以来，RTX 3080、3090和3070先后面世，超强的性能以及近乎“白菜”的首发价格也引来了无数玩家对RTX 30系显卡热烈追捧。但受限于产能问题导致的RTX 30系高端显卡的缺货状况却是让玩家们难以释怀，甚至RTX 3080在溢价2000元左右仍然是一卡难求。面对高端RTX30系显卡市场“叫好却无货”的固态以及AMD发布Radeon RX 6800 XT/RX 6800带来的竞争压力，NVIDIA现在急需用RTX 30系显卡来巩固自己的市场优势，尤其是在玩家们最为关注的中端主流显卡市场上，NVIDIA需要一位强力的代言人来取代既有的RTX 20 SUPER显卡以及加强自己的话语权。于是，GeForce RTX 3060 Ti就这样来了。

GeForce RTX 3060 Ti的发布和上市多少有些出乎我们的意料之外，因为我们一直认为RTX 3060 Ti这种中端主流应该在2021年初才会与玩家们见面。但现在看来高端RTX30系缺货导致的玩家抱怨和AMD Radeon RX 6800、6900系显卡的竞争压力使得NVIDIA下定决心要稍稍提前推出RTX 3060 Ti。毕竟在“旧换新”的市场更替时期，“早入蜀都，先到先得”是永恒不变的市场规律与竞争态度。

技术解析：Ampere架构核心的一脉相承

在之前的RTX 30系显卡，如RTX 3080、RTX 3090及RTX 3070的首发评测时，我们就已经对NVIDIA新一代的Ampere核心进了详细的解析。作为Ampere架构GPU家族的第四个亮相的‘小兄弟”，RTX 3060 Ti肯定和前辈师兄一样，完全继承了Ampere架构的所有特色技术。所以，尽管说了许多次，但今天在RTX 3060 Ti的首发评测时，我们仍然“老生重谈”，简单地复习—下NVIDIA安培核心架构的特色。

全新的SM模块，CUDA翻倍

SM（Streaming Multi-processer，流式多处理器模块）模块—直是NVIDIA GPU的计算核心，在新的GA10X核心的安培架构上，由于计算任务的变化，GAlOX的SM模块也有了巨大的变化。在之前的图灵SM模块的单个计算单元配置上（4个SM计算单元组成一个SM模块），每个SM模块中的计算单元拥有1个warp调度单元和1个派遣单元，16384x32bit寄存器、16个FP32内核和16个INT32内核，2个张量核心以及后端的LD/ST单元、特殊功能单元（Special Function Unit，简称SFU）等。

在新的GAlOX安培SM的计算单元内部，依旧配置了1个warp调度单元和1个派遣单元、16384×32bit寄存器和后端LD/ST、SFU单元，但是在计算的部分却包含了1组16个可自由执行FP32和INIT32计算的双功能计算单元（ALU）-它们既可以完成FP32计算，又可以完成INT32计算，另外还包含了1组16个FP32计算单元和1个新的第三代张量核心。这样，同为4个SM计算单元组成的SM模块，GA10X安培架构拥有等效128个CUDA核心（极致情况下），相当于图灵核心的两倍。这对游戏性能有什么影响？是的，影响很大。我们知道，图形和计算操作和算法、现代着色器工作负载通常混合使用FP32算术指令。FP32加速也有助于光线追踪降噪着色器。光线追踪渲染工作负载越大，相对于上一代产品的性能提升越大。

第二代RT Core光追核心

圖灵架构为游戏引入实时光线追踪，轰动一时，为游戏带来了逼真的光照、图像质量、游戏玩法和沉浸感、阴影和特效，并带来超出想象的游戏画质表现。NVIDIA Ampere架构的第二代RT Core的性能提升一倍，带来2倍于第一代RT Core的吞吐量，同时支持光线追踪和着色，使光线追踪性能达到全新高度。换而言之，光线追踪使用率越高，速度提升越大！同时第二代RT Core还引入了动态模糊等重要特性。NVIDIA Ampere架构的RT Core将光线交汇处理速度提高一倍，同时支持光线追踪与着色。光线三角形吞吐量增加一倍，Ampere架构的RT Core可达39.7 RT TFLOPS，Turing架构为23.8 RT TFLOPS，提升巨大。如用于Al超分辨率的NVIDIA DLSS和用于Al增强的声画处理技术NVIDIA Broadcast应用。从本质上讲，Tensor Core让DLSS能够加快游戏速度，同时带来高画质图像，甚至更细致的图像。借助第三代Tensor Cores的性能，NVIDIA Ampere架构GPU上的DLSS性能得到进一步增强。伴随Ampere显卡的发售，目前DLSS已经进化到了2.1版本，支持最高9X的游戏帧速率加速，这对于防止在高分辨率下开启光追效果后的游戏帧率下跌有着非常重要的意义。

当然，在RTX 3060 Ti的身上，同样也包含着诸多全新的，RTX 3080等“老大哥”所拥有的特色技术：

1.支持HDMI 2.1。它将总带宽从18Gigabits/秒提高到48Gigabits/秒，并增加对高动态范围（HDR）的支持，支持更高对比度的明亮图像和更鲜艳的色彩，以及更好的阴影和高光;

2.支持AV-I解码。与现有的H.264、HEVC和VP9等编解码器相比，它能提供更好的压缩和质量，比H.264节省50%-55%的容量;RTX 10，在DirectStorage加持下，下一代游戏将能够在降低CPU负载的同时，充分利用RTX lO硬件，缩短加载时间，打造更宽阔的开放世界;

3.NVIDIA Reflex低延迟技术。它通过革命性的GeForce和G-SYNC新技术来优化和测量竞技游戏中的系统延迟，从而更快地获取目标，做出反应，并提高瞄准精度;

4.NVIDIA Broadcast。这项A1驱动的声画处理技术的基础是NVIDIA Encoder，支持高质量直播。用户可以通过RTX 30系显卡和Broadcast将自己的家改造成直播室，通过Al驱动的噪音消除、虚拟背景和自动取景等将直播和视频聊天提升到一个新水平。通过在GeForce RTX显卡上加速A1驱动的Tensor Core，Al网络能够保证高质量直播的实时运行。

小身躯，大能量

从规格上来看，RTX 3060 Ti可以看作是RTX 3070的精简版——比后者少了8个SM模组，因此相比RTX 3070，它少了1024个CUDA核心（极限情况）。8个SM模组的精简也导致RTX 3060 Ti相比RTX 3070在Tensor Core和RT Core上分别少了32个和8个，而纹理单元和ROPs则分别减少了32个和16个。但是在显存的配置上，RTX 3060 Ti和RTX 3070则完全一致——8GB GDDR6，显存速率为14Gbps，结合256bit的显存位宽，带来了448GB/s的显存带宽。因此，RTX 3060 Ti从规格上来看就是相比RTX 3070精简了模组，Boost频率上略降低了60MHz左右，整体性能理论上应该相比RTX 3070逊色约15%-20%。当然具体表现究竟如何，我们将在后面的测试中为大家解惑。

在极限情况下，RTX 3060 Ti的最大可用CUDA核心为4864个（38×128），已经远超过了上一代的高端型号RTX 2080 SUPER的3072个（48x64）。虽然在Tensor Gore和RT Core的绝对数量上逊色于RTX 2080 SUPER，不过凭借更新进化的第二代RT Core和第三代Tensor Core，RTX 3060 Ti在光追性能、DLSS性能上也不见得会比RTX 2080 SUPER差。

如果参考我们此前测试的RTX 3070和RTX 2080 Ti的对比，不出意外的话，RTX 3060 Ti应该在性能上会超过RTX 2080 SUPER-就像KIVIDIA的官方资料所宣称的那样。而作为理论上的前后两代对位产品-RTX 2060 SUPER，仅仅是在规格上就已经被RTX 3060 Ti远远抛开，更不要提全新的安培架构的改进和第二代RT Core、第三代Tensor Core带来的性能飞跃了。也就是说，RTX 2060 SUPER在RTX 3060 Ti面前已经完全不够看，从Maxwell时代开始的NVIDIA显卡换代“新60极力挑战老80”的传统仍然在继续，而且陛能差距在安培架构面世后进一步被缩小甚至彻底反超。NVIDIA GeForce RTX 3060 Ti FE賞析及测试

性能实测，RTX 2080 SUPER已OUT

以RTX 3070精简版形象出现的RTX 3060 Ti到底拥有怎样的性能？作为RTX 30系定位中端主流游戏市场的产品，它能否如NIVIDIA所说一样战胜上一代的高端产品RTX 2080 SUPER？我们决定用实际的测试来检验RTX 3060 Ti。同时，NVIDIA的官方首发指导价仅为2999元，目前在3000元级的价位上，AMDRadeon RX 6000系的主流级产品尚未推出，但RDNA架构的RX5700XT还是AMD方面在这一市场上的“当红炸鸡”，所以我们也将3000元级的某型号非公版RX 5700XT加入了对比测试之中。

3DMark理论性能测试

从3DMark理论测试部分可以看出，RTX 3060 Ti的确已经完成了相对于RTX 2080 SUPER的性能超越，GPU性能平均领先幅度在5%左右。在我们测试时，正碰上3DMark的一个较大更新，不但更新了结果呈现界面，而且还在增加了DXR特性测试部分，也就是主要针对纯粹光追性能的又一测试手段。而在这项测试中，RTX 3060 Ti相对于RTX 2080 SUPER性能领先了23.5%左右，也就意味着在DXR API下，RTX 3060 Ti有着更强的性能表现。和RTX 3070的对比，理论性能的测试与我们之前的预估基本完全一致，RTX 3060 Ti相比RTX 3070大概有着18%左右的性能差距。而作为目前3000元级别的主力AMD显卡，RX 5700XT相比RTX3060 Ti则是疲态尽显，在TimeSpy的DirectX 12性能部分落后约28%，在TimeSpy的DirectX 11性能部分落后约8%-10%。作为上一代理论上的对位显卡，RTX 2060 SUPER相比RTX 3060 Ti则明显落后许多，其整体性能相比RTX 3060 Ti落后约40%。

游戏性能测试

在游戏测试部分，我们选择了6款光追游戏和5款非光追游戏进行了综合测试。在测试中，统一设置游戏画质为游戏本身预设的顶级画质（《地铁：离去》游戏中设置为次顶级的“Ultra”）。从理论上讲，RTX 3060 Ti应该是一款主流级别的1080p分辨率游戏显卡，不过鉴于它的目标是能否将RTX 2080 SUPER拉下马，因此我们也将4K（3840×2160）和2.5K（2560 x1440）两个分辨率下的游戏表现也加入了测试之中。

《控制》

光追：支持

DLSS：支持

在支持实时光线追踪的游戏中，《控制》可以说是一个完美的典型代表——不但支持光追，还支持DLSS。在游戏测试中，当开启光追时，在三个分辨率下RTX 3060 T相比RTX 2080 SUPER有10%左右的性能领先幅度，而在非光追环境下，这一领先程度则降低到2%左右，但仍然是明显强于RTX 2080 SUPER。而对比“顶头大哥”RTX 3070，RTX 3060 Ti在整体性能上落后大约13%-15%。RX 5700XT在《控制》游戏性能测试上三个分辨率下整体性能落后约25%，差距比较明显。同样情况的还有RTX2060 SUPER，这款名义上的上一代对位显卡在性能上差了RTX3060 Ti 30%以上，已经没有太大的可比性。

《银河破裂者》

光追：支持

DLSS：不支持

和《控制》的游戏测试结果基本一致，RTX 3060 Ti在光追环境下领先RTX 2080 SUPER约10%，非光追环境下领先RTX2080 SUPER约4%，但是在整体性能上仍然和RTX 3070有大约10%-15%的差距。至于RX 5700XT，在这一游戏测试中相比RTX 3060 Ti的性能差距有所缩小，大概在8%左右（非光追环境）。作为对位产品，RTX 2060 SUPER相对RTX 3060 Ti仍然有30%以上的性能差距。

《德军总部：新血脉》

光追：支持

DLSS：支持

不得不说，《德军总部：新血脉》的DLSS优化确实做得相当不错，在开启光追+DLSS的情况下，RTX 3060 T相对RTX 2080SUPER平均性能领先约3%，在关闭DLSS之后，这一领先程度则提高到了g%。在关闭光追之后，RTX 3060 Ti平均性能大约领先RTX 2080 SUPER约4%，与此前测试结果基本相符。在这款游戏的测试中，RX 5700XT在非光追环境下，性能上落后RTX 3060Ti 35%左右，基本和RTX 2060 SUPER相当。

《古墓丽影：暗影》

光追：支持

DLSS：支持

在《古墓丽影：暗影》游戏中，RTX 3060 Ti和RTX 2080 SUPER在开启光追+DLSS时基本打成平手，游戏帧率差距在1fps以内，算上测试误差的话，基本可以认为二者在该游戏的光追+DLSS环境下性能相当。不过当关闭DLSS之后，RTX 3060 Ti相比RTX 2080 SUPER在2.5K以上分辨率下仍然有6%的性能领先。而在关闭光追和DLSS之后，1080p分辨率下RTX 2080 SUPER实现了对RTX 3060 Ti的小幅度反超，性能领先在2%左右，这也是本次测试中极少有的RTX 2080 SUPER比RTX 3060 Ti更强的测试项之一。而对于RTX 2060 SUPER来说，其性能仍然落后RTX 3060 Ti约35%-40%。RX 5700XT在测试中仍然落后RTX 3060 Ti 20%以上，而RTX 3070仍然领先RTX 3060 Ti在15%左右。

《地铁：离去》

光追：支持

DLSS：支持

在《地铁：离去》游戏测试中，在光追开启时，RTX 3060 Ti性能上领先RTX 2080 SUPER约8%，而在关闭光追之后，二者基本打成平手，几乎没有差别。而对于RTX 3070来说，无论是光追环境还是非光追环境，相对RTX 3060 Ti都有15%-20%的性能领先。而RX 5700XT在这一测试中仍然落后RTX 3060 Ti约25%。

《魔兽世界：暗影国度》

光追：支持

DLSS：不支持

在我们测试RTX 3060 Ti的时候，正好赶上《魔兽世界》更新到9.0版本的《暗影国度》资料片，同时也正式上线了对实时光线追踪的支持。不过或许是因为游戏引擎较老，而且游戏本身对显卡性能要求也不算高的原因，在《魔兽世界：暗影国度》的测试中，RTX 3060 Ti和RTX 2080 SUPER基本持平，二者在该游戏的性能测试中不相伯仲。而在光追环境下，RTX 3060 Ti相比RTX 3070也仅有10%左右的性能差距。比较有意思的是在非光追环境下，我们怀疑《魔兽世界》应该内置了最大帧率的限制，即使我们在设置中关闭了一切帧率限制和垂直同步选项，游戏的最大帧率也被限制在了320fps左右，这也导致包括RX 5700XT在内的所有显卡，在非光追环境下2.5K和1080p分辨率下的游戏帧率测试结果几乎完全一致，自然也没有太大的可比性。

非光追游戏

在全部5款非光追游戏的测试中，RTX 3060 Ti整体综合性能相对于RTX 2080 SUPER来说仍然有6%-8%的性能提升。而RTX 3070在非光追环境下仍然领先RTX 3060 Ti约15%。比较有意思的是RX 5700XT，在《死亡搁浅》《极限竟速：地平线4》等游戏中，它相对于RTX 3060 Ti的性能落后幅度约20%，但在《尘埃5》《无主之地3》等游戏中，性能落后幅度却又不到10%，这种情况或许是由于游戏本身对A卡和N卡的优化程度不一所导致吧！另外还有就是《刺客信条：英灵殿》这个游戏比较有意思，应该是针对AMD显卡的优化比较到位，在这个游戏测试中，RX 5700XT的成绩达到了接近甚至超过RTX 2080 SUPER的表现，这和其他所有游戏中的成绩完全相悖，因此我们也只能认为《刺客信条：英灵殿》这个游戏对AMD显卡有着特别的优化吧！

另外，在我们的散热控制能力的测试上，RTX 3060 Ti FE在满载20分钟后，GPU核心的温度大约控制在70℃左右，凭借与RTX 3070几乎完全一致的散热系统架构，它在温度控制上还是有着比较不错的表现。同时，在Blender Open Data Benchmark与D5渲染器等创作软件测试中，RTX 3060 Ti仍然强势地领先RTX2060 SUPER超过100%的性能，相比RTX 2080 SUPER仍然有20%左右的性能提升。

或许会成为当下“最”受欢迎的RTX 30显卡

3000元级的主流显卡市场肯定会迎来剧烈的震荡，这已经是毫无疑问的事情！在测试完RTX 3060 Ti之后，我们对此深信不疑。2999元的首发价格却带来了超越目前5000元级显卡的性能表现，对此我們觉得确实无法苛求更多。在RTX 3080、3090、3070集体陷入高价与缺货的困境中时，在AMD发布Radeon RX6800系显卡带来巨大的市场竞争压力时，NVIDIA抢先将RTX3060 Ti投向了受众最广的主流级显卡市场，肯定是想要抢占新一代主流显卡市场的制高点，从而在市场上占得先机。

综合RTX 3060 Ti的性能表现与价格来看，可以说它—上市必将秒杀掉现在市场上的所有RTX20 SUPER系显卡，包括RTX 2080 SUPER在内。当众多的玩家还在纠结于RTX 3080和RTX 3090“高贵”的价格和极度缺货时，RTX 3060 Ti很可能会成为这部分玩家最需要的新宠。当然，RTX 3060 Ti的抢滩登陆确实占据了先机，但AMD这边也有RX 6700系产品蓄势待发，而且不排除AMD有后发制人的招数。或许到那时候，主流级显卡市场上又会再度燃起战火，RTX 3060系和RX 6700系之间恐怕还有战斗。

从我们目前的性能测试结果来看，RTX 3060 Ti在中端主流级显卡市场上基本是处于“无敌”的状态，无论是性能或价格都找不到同等级可与其匹敌者，具备了成为明星级产品的实力，或许它在上市之后就会成为最受欢迎的RTX 30系显卡。当然，我们也希望RTX 3060 Ti千万别再像RTX 3080那样极度缺货了！拭目以待！