映众RTX 3070 冰龙超级版显卡评测
映众的冰龙系列显卡一直主打良好的温控设计,曾在英伟达9系、10系显卡产品中还在侧面打造了单独的显存散热风扇,不过这个设计在英伟达20系显卡中并没有被继承,现在随着英伟达30系显卡的发布,映众将这个独特的设计带了回来,在这张映众RTX 3070 冰龙超级版上就可以看到这个独特的3+1风扇设计。
全新的GA104 GPU
先说说RTX 3070这颗核心的事儿吧,GeForce RTX 3070与上个月发布的RTX 3090/3080不同,用的不是GA102核心,而是用了相对小一点的GA104 GPU,核心面积从628mm2缩小到392.5mm2,晶体管数量也从283亿变成了174亿,芯片面积和晶体管数量都缩小了40%左右,生产工艺依然是三星为NVIDIA定制的8nm工艺,更小的核心换来的当然是更低的发热量与更低的功耗。
完整的GA104拥有6组GPC,但每组的TPC数量从6组减少到4组,一共24组TPC,每组TPC包含2组SM,所以总共拥有48个SM单元,每组SM有128个CUDA,一共有6144个CUDA,8组32位的显存控制器组成256bit的显存位宽。
但RTX 3070所用的GA104-300核心屏蔽了两组SM单元,只启用了46组SM,5888个CUDA,GPU核心基础频率1500MHz,Boost频率1725MHz,显存位宽是完整的256bit,搭配8GB GDDR6显存,等效数据频率14Gbps,显存带宽和上代的RTX 2080/2070一样是448GB/s,显卡TGP是220W,比RTX 3080的320W低得多,比上代的RTX 2070的185W高出不少,介于RTX 2080和RTX 2070 SUPER之间。
NVIDIA Ampere架构简介
而RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开CPU直接读取SSD数据,从而降低CPU的占用率。不过由于RTX IO需要依靠Windows的DirectStorage API,并且还需要游戏开发商做针对性的优化,所以最快我们也要等到明年才能看到这项技术的具体应用。
NVIDIA Reflex
伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
NVIDIA Broadcast
NVIDIA Broadcast是为直播主们推出的,这用到RTX GPU的AI能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。
在安装了NVIDIA Broadcast软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到RTX GPU的AI能力来做一些AI增强效果,耳机和麦克风现在支持了降噪功能,AI会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。
而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过Broadcast进行处理,再传到OBS这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。
映众RTX 3070 冰龙超级版显卡规格
显卡外观及灯效:回归冰龙的3+1风扇设计
映众RTX 3070 冰龙超级版给人带来很强的机甲战士的感觉,并且拿到手的手感非常的好。显卡顶部的一个小风扇非常的吸引眼球,这个专门为增加显存散热效果而设置的一个风扇。其次,仔细观察视频接口,会发现都是金黄色的,因为全部进行了镀金处理,这样可以使得接口的氧化性更好,信号品质更佳。
映众RTX 3070 冰龙超级版正面,仍然是三个大风扇承担主要的散热功能,直径均为90mm,背板是金属背板,而且厚度非常不错,背板上有部分激凸小圆柱设计,这样是为了增大表面积,可以得到更好的散热效果,当然,这样别致的设计让手感和美观度也都上了一个档次。
背板尾部,可以看到大面积的镂空处理,可以增加气流穿透,加强散热效果。映众RTX 3070 冰龙超级版仍然是将近三槽的厚度,供电方面是双8Pin供电接口,配合PCIE接口可以提供的75W,总共最多可以提供375W的供电,足够RTX 3070核心使用。
映众RTX 3070 冰龙超级版的灯效也非常不错,该卡没有选择在风扇部分做灯效,而是在整个显卡的肩部做的灯效,默认的灯光效果是RGB彩虹灯效,玩家也可以通过软件进行DIY调节,并且映众RTX 3070 冰龙超级版有赠送灯效同步线,可以和主板的灯效同步。
显卡拆解:6+1热管设计、10+2相供电
映众RTX 3070 冰龙超级版在设计上走的非常整体化,它的拆解除了要先拆卸掉背板上看得见的螺丝之外,还要把IO挡板那一面以及对面的显卡尾部各卸下两颗螺丝。拆开后可以发现映众RTX 3070 冰龙超级版用的导热贴很薄,所以部分显存上的导热贴笔者并没有揭下来,不然很容易撕烂,需要说明的是,导热贴的厚薄并不影响导热效果。
映众RTX 3070 冰龙超级版采用的是6+1热管的设计,与核心接触的部分可以明显的看到6根热管,采用热管直触的方式与GPU核心相连,另外还有一根热管是为供电模块单独设计,搭配上那个侧面小风扇形成了对显卡的立体散热。
在PCB上可以明显的看到RTX 3070的GA104-300核心,周围有8颗显存颗粒环绕,均为三星的K4Z80325BC-HC14显存,这是GDDR6显存,单颗1GB容量、32bit的位宽,一共8颗组成8GB容量和256bit位宽。
供电方面,可以看到映众RTX 3070 冰龙超级版一共是12相供电,其中10相核心供电在GA104-300核心的左边和上边,2相显存供电在核心的右边。核心供电的MosFET均是来自万国半导体(Alpha & Omega Semiconductor)的,不过上面只刻了生产批次编号。显存供电的MosFET是UBIQ Semiconductor的M3816N,核心供电的PWM控制器是一颗uP9512R,在PCB的反面。
测试部分
从GPU-Z可以看到,映众RTX 3070 冰龙超级版显卡的基础频率为1500MHz,Boost频率为1785MHz,显存等效数据速率为14Gbps,并且映众RTX 3070 冰龙超级版的风扇具有待机停转的功能,通过GPU-Z的传感器监测页面可以看到待机状态下,风扇转速为零。
映众RTX 3070 冰龙超级版的默认温度上限是83摄氏度,玩家可以选择向上解锁到90摄氏度,功耗上限默认为240W,玩家可以选择向上解锁到最大260W。
测试平台
这次对于映众RTX 3070 冰龙超级版的性能测试采用了和我们RTX 3070公版首发评测同样的一套平台,处理器是AMD锐龙9 3900X,内存是2条16GB的芝奇皇家戟DDR4-3600内存组成的32GB双通道配置,电源是ROG雷神1200W电源,其他各方面配置也是足够高的,尽量排除了系统瓶颈。
基准性能测试:相比公版提升4%
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
通过测试来看,映众RTX 3070 冰龙超级版相比RTX 3070公版平均性能提升幅度为4%,该卡的Boost频率为1785MHz,性能提升幅度约等于频率的提升幅度。
实际频率:在1980MHz和1935MHz之间
由于英伟达的GPU Boost技术,显卡实际的运行频率一般都是高于其标称的Boost频率的,笔者在3DMark Fire Strike压力测试中通过GPU-Z记录了该卡的核心实际运行频率,结果如下:
可以看到,映众RTX 3070 冰龙超级版的实际核心频率还要高于1785MHz不少,大部分时间在1980MHz和1935MHz之间,最高到过2025MHz。
游戏性能测试
游戏测试部分分为三个部分,分别是不开实时光线追踪效果和DLSS技术下的2K分辨率游戏测试和4K分辨率游戏测试,最后在加上4K分辨率下开启实时光线追踪效果和DLSS技术的游戏性能测试。
2K游戏测试
这部分游戏实测选择了7款游戏进行实测,测试均将它们开到预设最高画质(《地铁:离去》是开启Ultra画质),分辨率设为2K,此外默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除以上所述之外其他选项均为默认设置,且均采用游戏自带的Benchmark输出结果如下:
4K游戏测试
这部分测试同样均将它们开到预设最高画质(《地铁:离去》是开启Ultra画质),分辨率设为4K,默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除以上所述之外其他选项均为默认设置,且均采用游戏自带的Benchmark输出结果如下:
4K且开启光线追踪和DLSS游戏测试
此部分选择了三款已经上市的支持实时光线追踪的3A大作,《地铁:离去》是开启Ultra画质,《古墓丽影:暗影》和《看门狗:军团》则是开到预设最高画质,这两款游戏均将实时光线追踪开到“高”并且打开DLSS。
可以看到,映众GeForce RTX 3090冰龙超级版的游戏性能可以完全满足2K分辨率的游戏环境,对于4K分辨率也是大部分属于能玩的,当然对于《看门狗:军团》这样最新的3A大作表现差点,不过在DLSS技术的加持下,也是能较为流畅的运行,并且还是开启了光线追踪效果的。
温度测试及噪音表现:满载最高仅70℃
我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,本次测试时环境温度约为25.8℃。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Fire Strike压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
映众RTX 3070 冰龙超级版具有风扇待机停转的功能,所以待机状态下全靠被动散热。经过十分钟的待机测试,从开始的38摄氏度上升到43摄氏度左右,仍然属于很清凉的范畴。满载状态下,最高温度仅仅才只有70℃,属于RTX 3070显卡的主流水平,对于显卡运行来说,这个温度完全不需要担心。
噪音方面,映众RTX 3070 冰龙超级版的风扇待机停转功能让它在待机状态下完全无任何噪音,满载状态下,风扇最高转速1941RPM,但是就听感来说,在办公室的较安静环境下,并未感觉到明显的噪音。
功耗测试:满载平均244W
通过我们专用的显卡功耗测试仪器,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Fire Strike压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
经过测试,映众RTX 3070 冰龙超级版的待机功耗平均为18W,满载功耗平均为244W,搭配电源的话,考虑到CPU等平台其他部件的功耗,建议650W的电源起步,当然,如果你预算允许,我们推荐搭配750W起步的电源会更好。
超频测试:还可以提升约8%的性能
将功耗上限和温度上限解锁到最高之后,经过多番手动超频尝试,映众RTX 3070 冰龙超级版最终在核心频率+120MHz,GDDR6显存数据速率+3Gbps下完成超频,超频幅度非常大。这个状态下,这张映众RTX 3070 冰龙超级版能顺利通过3DMark的FireStrike项目测试并且分数最高, 此时这张映众RTX 3070 冰龙超级版的Boost频率为1905MHz,显存等效频率为17Gbps。这张映众RTX 3070 冰龙超级版在超频状态下运行3DMark FireStrike项目的显卡得分与默频状态下显卡得分的对比如下表所示。
这张映众RTX 3070 冰龙超级版的超频体质还不错,在较为极致的压榨下,还可以提升约8%的性能。
总结:既有经典设计回归,也有新的耀眼超越
在映众RTX 3070 冰龙超级版显卡上,映众曾经的侧面显存散热风扇设计得以回归, 配合上一根单独的为供电模块单独设计的热管,形成了对显卡的立体散热。除此之外,在IO接口上,可以看到全部进行了镀金处理,镀金之后的接口抗氧化性更好,信号品质也会更佳。
与上一代20系冰龙显卡对比,除了以上这些升级之外,这次在灯效上也豪华了很多,映众RTX 3070 冰龙超级版在显卡肩部设计了大面积的灯效,这也是大多数显卡安装时候最容易展示到的位置,肩部的RGB灯效配合肩部的单独小风扇,让映众RTX 3070 冰龙超级版在机箱中的识别度很高,非常亮眼。
作为一张OC版的显卡,映众RTX 3070 冰龙超级版的温控表现仍然很不错,满载仅70摄氏度,延续了冰龙显卡一贯的特长。性能方面,这一代的RTX 3070核心也完全足以胜任任何2K分辨率下的游戏,RTX 3070核心相比上代的光追性能大大提升,加上DLSS 2.0技术的加持,映众RTX 3070 冰龙超级版也可以较流畅的运行4K分辨率下的光线追踪游戏。
目前这张卡在京东售价4299元,仅比公版最低起售价贵了400元,作为一张OC版的非公版显卡,映众RTX 3070 冰龙超级版在性能和温度方面都比公版优秀很多,并且设计上还独具特色,笔者觉得这个价格还是很合适的。