副标题#e#
【DIY硬件频道】从9月发布至今,NVIDIA安培架构的GeForce RTX 30系列显卡上市接近3个月时间,但RTX 3080依然一卡难求。虽然使用GA104核心的GeForce RTX 3070显卡货源相对充足,唯一不足就是部分高端型号价格直逼RTX 3080,让消费难以下手。
在GeForce RTX 3070上市一个月后,NVIDIA在12月1日为用户带来GA104核心的GeForce RTX 3060 Ti显卡。新显卡的GA104-200核心同样拥有174亿晶体管、三星8nm工艺制造;热设计功耗降低至200W,内建38组SM单元、共4864个CUDA;搭配与RTX 3070相同的256bit位宽、8GB GDDR6显存。
GA104-200 GPU核心
NVIDIA GeForce RTX 3060 Ti采用与RTX 3070相同的GA104核心,新核心内建6组GPC,每组的TPC数量从6组减少到4组(24组TPC),每组TPC包含2个SM单元,合计48个SM单元,每个SM内置128个CUDA核心、理论最高6144个CUDA;8个32bit位宽的显存控制器,组成256bit的显存位宽。
RTX 3060 Ti的GA104-200核心屏蔽10组SMe单元,启用38组SMe,4864个CUDA,基础频率14100MHz、Boost频率1665MHz;256bit显存位宽、速率14Gbps的8GB GDDR6显存,带宽为448GB/s。与公版不同的是,iGeme GeForce RTX 3060 Ti Advanced OC支持双BIOS切换功能,其中高频BIOS最高Boost频率可达1800MHz。
NVIDIA安培架构简介
与上一代图灵架构PGU相比,NVIDIA在安培架构上引入第二代RT Cores以及第三代Tensor Cores,并加入可同时支持INT32或FP32两种数据类型的新ALU。NVIDIA和微软合作的RTX IO功能最快在2021年加入支持。
第一代的RT Cores实现了从无到有,第二代光追核心带来更优秀的性能,在新插值算法支持下,新增的动态模糊的加速运算,可保证动态模糊精确性、同时提高实时光线追踪效率,拥有最高8倍于上代的性能。第二代RT Cores在基础的BVH计算上也比第一代快2倍。
负责运行AI计算的硬件单元Tensor Cores也升级到第三代,虽然NVIDIA对游戏卡的Tensor Cores核心进行精简,但依然能提供比第二代Tensor Cores高2倍的能效。性能更强的Tensor Cores为GPU带来更出色的AI运算——DLSS,能够通过深度学习技术,能将画面分辨率拉伸至8K。
安培架构GPU核心可以同时进行INT32和FP32运算,而非图灵架构那样在进行某种运算时,另一种运算无法同时进行,新的ALU大幅提升GPU核心的计算效率,也是安培架构GPU单精度性能暴涨的重要原因。
在安培架构上,NVIDIA提升GPU内部各种单元之间的并行性,让传统的INT/FP计算单元、RT Cores和Tensor Cores三大单元同时工作,进一步缩短帧渲染时间,提高GPU的运算性能。
NVIDIA RTX IO功能需要借助微软的DirectStorage API,以插件的形式与后者整合实现。这项技术能让显卡绕开CPU,直接读取SSD数据,从而降低CPU的占用率,而且最终商用还要游戏开发商做针对性优化。
另外,NVIDIA还为电竞玩家和直播用户带来NVIDIA Refiex和NVIDIA Broadcast。
NVIDIA Reflex分为硬件和软件两部分,硬件部分叫Reflex Latency Analyzer,可视为LDAT的升级版,直接预安装在显示器中,通过测量玩家从点击鼠标直到画面出现变化的时间差,得到整套系统的所有延迟。软件部分则是NVIDIA Reflex SDK,作用是降低以及测量渲染延迟,开发者可直接整合到游戏内。在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列进而降低渲染延迟。
NVIDIA Broadcast则是为直播主们准备的,利用RTX GPU的AI运算能力替换或消除直播背景、摄像头重构图、甚至为麦克风提供智能降噪,减少直播场景的搭建。
iGame GeForce RTX 3060 Ti Advanced OC外观
外观方面,iGame GeForce RTX 3060Ti Advanced OC采用家族式的冰海银鲨散热器,两个9cm配合一个8cm捕风手风扇,13翼扇叶能够将更多的空气压入散热器内,智能启停技术不仅拥有低噪音的特点、同时还具备更长使用寿命。
#p#副标题#e#
合金压铸的导流罩大幅提高出风效率,配合4条8mm热管,能轻松慢热设计功耗为200W的RTX 3060 Ti显卡。
为了保证显卡的稳定性,iGame还为RTX 3060 Ti Advanced OC显卡配备金属背板。
虽然8pin+PCIe合计可提供225W的供电,但考虑到显卡的稳定性,iGame还是为显卡提供双8pin,让显卡能够全速运行。
作为玩灯好手,iGame为RTX 3060 Ti Advanced OC采用凝聚灯光效果的双灯环,1600万色和5种RGB模式。协同灯光闪频和一定数值的风扇转速,带来放佛精致的视觉效果,全是Advanced以静制动的压迫力。
输出接口方面,iGame GeForce RTX 3060 Ti Advanced OC与提供3个DP 1.4a和1个HDMI 2.1接口,接口均配备金属屏蔽罩,确保输出信号干净、稳定。双BIOS切换功能在输出接口上方,玩家轻松快速的切换BIOS。
拆解iGame RTX 3060 Ti Advanced OC可以看到,显卡采用8+2相供电,其中8为GPU核心供电,剩余2相为8GB GDDR6显存供电。
GPU核心为GA104-200-A1,默认频率1410MHz,BOOST频率提升至1665MHz;切换至高频BIOS时的BOOST频率1800MHz。
显存使用三星提供的GDDR6显存,单颗容量1GB、8颗共8GB,14Gbps的速率和256bit位宽,为显卡提供448GB/s的带宽。
性能测试
从GPU-Z识别的频率可以看到,iGame RTX 3060 Ti Advanced OC的BOOST频率达1665MHz,笔者将BIOS切换至BOOST下对性能进行测试。
测试平台
CPU:英特尔酷睿i5-10600K
主板:iGame Z490 Vulcan X
内存:七彩虹捍卫者DDR4-3200 8GB*4
显卡:iGame GeForce RTX 3060 Ti Advanced OC
iGame GeForce RTX 3070 Advanced OC
iGame GeForce RTX 3080 Ultra 10G
NVIDIA RTX 2080 Ti
iGame GeForce RTX 2070 SUPER Advanced OC
电源:鑫谷昆仑KL750W
#p#分页标题#e#
基准性能测试以3DMark为主,测试DX11、DX12性能,包括Time Spy、Fire Strike、光线追踪性能,并对比RTX 2070 SUPER、RTX 2080 Ti、RTX 3080以及RTX 3070。
从3DMark中的DX11、DX12测试可以看到,除了1080P的Fire Strick领先约16%、Time几乎持平之外,RTX 3060 Ti实现对RTX 2070 Super碾压,2K分辨率的Fire Strick Ultra领先12%,其他的领先幅度均在10%左右。在新的RT Core和新的Tensor Core加持下,RTX 3060 Ti的光线追踪领先RTX 2070 Super约14%。
无光追、DLSS选择《古墓丽影:暗影》、《刺客信条:奥德赛》、《绝地求生:大逃杀》、《孤岛惊魂5》、《GTA5》以及《巫师3》,分别在1080P、2K和4K三种分辨率下测试。
#p#副标题#e#
在游戏实测中可以看到,RTX 3060 Ti再1080P下与RTX 2070 Super互有胜负,性能差距不大。2K分辨率下除了巫师3几乎持平外,其他游戏领先幅度在6%至20%之间。4K分辨率下的RTX 3060 Ti全面领先RTX 2070 Super,帧率差距在2%到25%之间。
开启光线追踪和DLSS选择《古墓丽影:暗影》、《控制》、《死亡搁浅》及《我的世界》四款游戏,同样细分为1080P、2K和4K三种分辨率,直接比较平均帧率。
开启光线追踪和DLSS之后,1080P分辨率下的RTX 3060 Ti与RTX 2070 Super得到缩小,《古墓丽影:暗影》和《死亡搁浅》的游戏基本持平,另外两款游戏的性能差距在20%左右。2K分辨率下的RTX 3060 Ti性能得到一定提升,《死亡搁浅》并未拉开差距,但《古墓丽影:暗影》、《控制》和《我的世界》领先10%至20%。RTX 3060 Ti终于在4K分辨率取得全面领先,《死亡搁浅》的差距在10%左右,《控制》的领先幅度多达27%。
温度噪音测试
在温度、功耗测试方面,裸平台测试,保证显卡风扇不受机箱风道的影响。笔者选择FurMark软件对显卡进行拷机测试,项目包括整卡功耗、噪音和温度。
噪音方面,得益于冰海银鲨散热器2.0和4热管+3风扇设计,室温20℃下的室内环境下满载噪音58.8分贝。显卡满载状况下的噪音并不高。温度控制方面,得益于iGame的冰海银鲨散热器2.0,1665MHz频率下的RTX 3060 Ti Advanced OC烤机最高72℃,满载下的温度在70到72℃之间跳动。功耗方面,RTX 3060 Ti的核心功耗在165W左右,整卡功耗也在210W之内。
评测总结:从价格的定位来看,RTX 3060 Ti将取代RTX 2070 SUPER的位置,成为新一代的“甜品级”显卡。可媲美RTX 2080 SUPER的游戏性能,让显卡可以轻松胜任2K分辨率下的3A大作;高刷新率的4K显示器价格比显卡还贵,虽然RTX 3060 Ti没到不能玩的地步,但某些场景下十多帧还是会影响到游戏体验。
评测平台介绍
主要测试平台处理器采用英特尔6核12线程的i5-10600K,默认频率4.1GHz,单核睿频4.8GHz。
主板为iGame Z490 Vulcan X,12+2相的I.P.P至纯供电可以为处理器提供稳定供电。
内存七彩虹CVN捍卫者3200MHz系列,拥有5大板卡厂商的ARGB同步认证。
电源是鑫谷昆仑KL750G,额定750W,80plus金牌认证、全模组设计,轻松带动RTX 3060 Ti与i5-10600K平台。