副标题#e#
【DIY硬件频道】时隔两年,NVIDIA终于在9月1日为游戏爱好者带来新一代Ampere架构的GeForce显卡,率先登场的三款产品分别是RTX 3090、RTX 3080和RTX 3070,分别取代RTX TITAN、RTX 2080 Ti和RTX 2070 Super。需要注意的是,国内没有公版的RTX 3080,用户只能在AIC购买非公版本。
三款产品中最早解禁的是公版RTX 3080,解禁时间为9月16日,9月17日解禁非公版,本次评测的非公版RTX 3080显卡来自iGame的Ultra 10G。
NVIDIA RTX 3080显卡采用三星8nm工艺制造,内建7组GPC,每组GPC有12个SM单元,NVIDIA关闭其中16组SM单元,为显卡提供68组、共8704个CUDA;显卡则采用最新一代频率17GHz的GDDR6X,拥有320bit位宽,总显存容量达10GB。
GeForce安培架构解析
GA100核心架构图
对于用户来说,安培架构GeForce显卡最明显的提升就是CUDA数量翻倍,而且GeForce显卡和同源的安培GA100大核的架构差异巨大。安培GA100核心架构分为四大部分,分别是16个FP32+16个INT32混合单元、32个FP32、32个FP64和Tensor Core组成,安培GA100核心每个周期可以同步执行64个运算。
GA102核心架构图
消费级GeForce的情况略有不同,NVIDIA直接取消其中的FP64单元,并减小Tensor Core部分,增加RT Core,应对游戏使用需求。从GPU内部的架构图可以看到,每个SM单元细分为4个区,每个分区除了第三代Tensor Core核心外,还有16个FP32单元、16个FP32/INT32组成的混合单元,其中混合单元可执行FP32或INT32运算。
每个分区执行16个FP32,加上16个FP32或者16个INT32运算,四个分区就可以实现4*32(32个FP32或16个FP32+16个INT32)运算,也就是一个周期内可以同时执行128个运算,这也是GeForce如果性能翻倍的根本原因。换句话说,只算浮点性能,安培GeForce显卡的性能已经实现翻倍。
为了确保运算性能,NVIDIA提升FP32性能需要配套,首先是一级缓存容量提高33%,并将带宽从116GB/s提高至219GB/s,共享内存的性能也从每周期64B翻倍到128B。
iGame GeForce RTX 3080 Ultra 10G解析
与公版RTX 3080采用正反双风扇设计不同,iGame RTX 3080 Ultra 10G采用传统的三风扇设计。为了加强显卡的散热能力,7条热管和大面积鳍片,你能够快速将核心、显存以及供电等部分的热量带走。如此高规格的散热器,使显卡的整体厚度达到3槽,加上超过30cm的长度,让小机箱用户变得十分难受。
接口方面,RTX 3080提供3个DP 1.4a接口和1个HDMI 2.1接口。iGame还未RTX 3080 Ultra 10G提供一键超频按钮,方便用户切换到高性能BIOS。
显卡散热器采用7条直径8mm热管,热管与鳍片之间采用回流焊工艺,使鳍片与热管成为一体,提升散热器的到热效率。
显卡背部配备一块大面积的金属背板,不仅为PCB提供更优秀的抗变形能力,iGame还十分巧妙的在显存部分加入到热贴,提升显存部位的散热能力。
作为一款TDP达320W的显卡,iGame RTX 3080 Ultra 10G并没有采用公版新的12pin供电接口,而是由3个8pin接口为显卡供电,配合PCIe最大可提供525W的功率,确保显卡稳定运行。
iGame为RTX 3080 Ultra 10G提供高达20相供电,其输入、输出滤波电容均来自富士通。
显卡核心为GA102-200-KD-A1,内建280亿个晶体管、核心面积628mm2,默认频率1440MHz,最高加速频率1710MHz。
10颗美光显存组成10GB容量,320Bit位宽、19GHz频率下,拥有760GB/s带宽。
理论性能测试
#p#副标题#e#
理论性能测试以3DMark为主,测试项目包括1080P、2K、4K分辨率的基准成绩、DX12性能、光线追踪和DLSS性能。与对位的RTX 2080Ti进行对比。
除了为用户带来更优秀的游戏体验外,RTX 3080同样可为用户带来出色的生产力。NVIDIA在Studio中内置包含AI加速功能的专用驱动和工具,让显卡提供更出色的渲染效果,缩短渲染时间。RTX 3080显卡还提供新一代硬件编码和解码技术,为直播用户提供实时高编码视频录制和直播。
RTX 3080在基于DX 12的Time Spy中得到13916分,Time Spy Extreme得分则是7159分。与RTX 2080 Ti相比,Time Spy有超过25%的性能提升,4K场景的Time Spy Extreme提升超过30%。
在基于DX11的Fire Strike测试中,RTX 3080得分到26752,Fire Strike Extreme得到18036分,Fire Strike Ultra得分10655分。与RTX 2080 Ti,RTX 3080在4K分辨率的DX11场景下的提升均超过30%,幅度还是非常不错的。
在第二代RT Core的加持下,RTX 3080的光追性能比RTX 2080 Ti高30%;第三代Tensor Core夹持下的DLSS性能同样有超过25%的性能提升。
#p#分页标题#e#
3DMark 11的X分性能
与公版RTX 3080采用新散热设计不同,传统的散热器和3槽的高度,确保iGame RTX 3080 Ultra 10G拥有足够出色的散热能力,为热设计功耗达320W的GPU提供散热。为了更好的测试显卡的温度控制和噪音情况,笔者选择AIDA 64和FurMark进行1小时烤机测试。
在满载测试过程中,iGame RTX 3080 Ultra 10G在通过iGame center手动将频率拉到1800MHz之后,在100%满载时的最大噪音为61.9分贝,最高温度也飙升至75摄氏度,比公版普遍的78度要低一些,毕竟三风扇和3槽的厚度,为显卡带来更优秀的散热能力。
游戏性能测试
作为高性能游戏显卡,GeForce RTX 3080的游戏实测性能如何?笔者分别在1080P、2K和4K分辨率下,测试《巫师3》、《GTA 5》、《战地5》、《孤岛惊魂5》、《绝地求生》、《刺客信条:奥德赛》、《古墓丽影:暗影》七款主流游戏,并记录游戏平均帧数,对比上代的RTX 2080Ti、RTX 2080两款显卡。
在1080P分辨率下,RTX 3080的领先幅度最小,游戏的平均帧数仅比RTX 2080高38%,比RTX 2080Ti高约16%。如果使用1080P的高刷新率电竞显示器,用户暂时无需考虑升级RTX 30系列。
2K分辨率下,RTX 3080的性能比RTX 2080Ti高达约25%,比RTX 2080高52%,性能差距开始体现。但RTX 2080在《刺客信条:奥德赛》平均帧数达到60帧,性能可满足2K分辨率的使用需求,但部分场景较低的帧数依然会对游戏体验造成影响。
RTX 3080在4K分辨率下开始拉开差距,性能领先RTX 2080Ti约33%,比RTX 2080高67%。从测试的成绩可以看到,RTX 3080在4K分辨率下的提升幅度巨大,流畅玩3A大作压力不大。
#p#副标题#e#
评测总结:在9月1日的发布会上,NVIDIA号称RTX 30系列实现性能和热效率大幅度提升。从首发GeForce RTX 3080来看,与RTX 2080Ti相比有接近30%的性能提升,光追性能也提升50%。而且iGame GeForce RTX无论是散热设计、稳定性都十分出色,公版5499元的定价只有RTX 2080Ti的一半,性价比至少翻番,对价格敏感的游戏用户十分重要。