N 卡杀手 ? RNDA 2 微架构 AMD Radeon RX 6800 / 6800 XT 登场

AMD 正式发布「Radeon RX 6800 / RX 6800 XT」显卡登场,采用全新「RDNA 2」GPU 微架构在相同功耗下性能大幅提升 + 54%,创新 Infinity Cache 技术配合 16GB 大容量 GDDR6 显存、追加 Ray Accelerators 光线追踪引擎,配搭自己的 Ryzen 5000 处理器更可提供 Smart Access Memory 加速,究竟新卡能否为 NVIDIA 带来威胁,小杨今天用 AMD Radeon RX 6800 / RX 6800 XT 与 GeForce RTX 3080 作对比测试。

268 亿个晶体管、AMD Big Navi 正式登场

代号 Big Navi、全新 RDNA 2 GPU 微架构, AMD 全新 Radeon RX 6800 系列正式登场,采用全新「Navi 21」显卡核心在性能表现和功能规格均有着惊人突破,是 AMD 近年来首次紧追 NVIDIA 高端型号。

定位方面,AMD在 11 月 18 日推出 Radeon RX 6800 与 RX 6800 XT 两款显卡型号,RX 6800 拥有 60 个 CU、3,840 个 Stream Processors、16GB GDDR6 显存容量,京东售价为4599元;RX 6800 XT 则拥有 72 个 CU、4,608 个 Stream Processors、16GB GDDR6 显存,京东售价为5099元,对应 RTX 3080显卡。

此外,AMD 会在 12 月 8 日再推出旗舰级的 Radeon RX 6900 XT,拥有完整 80 个 CU、5,120 个 Stream Processors、16GB GDDR6 显存容量,官方定价为 6599元,但不会有非公板型号,对应显卡将会是 GeForce RTX 3090。

经改良的 RDNA 2 GPU 微架构

被大家称之为 N 卡杀手,全新的「RDNA 2」微架构是基于「RNDA」作出改良,目标是在相同的内部频宽框架下,将 CU 单元的数目提升 100%,通过微架构的最佳化实现同频率下 CU 单元功耗降低 50%,或者是相同功耗下让频率提升 1.3倍,另一个方向是能大幅提升内部缓存,让 CU 单元减低单元闲置,令 GPU 指令吞吐量能进一步提升,在 GDDR6 频宽保持不变提升显存容量有效频宽等,最终则提升 +54% 的性能功耗比提升。

全新「RDNA 2」设计针对 Compute Unit 重新设计,「Navi 21」显卡核心增至 4 个 Shader 引擎共享前端,每个 Shader 引擎拥有 2 组 Graphics Array 运算群,每个 GA 运算群内含 5 个 Dual Compute Unit (DCU) 并共享 L1 Cache、Rasterizer、RB+、Prim Unit 等资源,总计整颗芯片合共有 80 个 CU 单元、数量增加了 1 倍 100%。

此外,前端换上了重新设计的 RB+ 光栅化单元,每个 Shader 引擎共享 32 个 RB+ 单元,数量与上代 RDNA 相同,但每个周期能处理 8 个 32bit Pixel 指令,数目是上代的 1 倍,更重要是新增 Variable Rate Shading (VRS) 可变速率着色、 Mesh Shaders 网格着色器、Sampler Feedback 取样器回馈等功能,以满足 DirectX 12 Ultimate 规格要求 ,允许游戏选择性地降低画面里部分区域的细节水平来提高性能,对图像品质几乎没有明显影响但性能却能进一步提升。

RDNA 2 微架构与  RDNA 同样采用 Dual Compute Unit (DCU) 设计,将 2 个 CU 结合在一起并共用 Scalar Data Cache、Sahder Instruction Cache 及 Local Data Share,DCU 设计可以让 Shader Processor 之间有更佳的并行运算能力,现在积累 Zen CPU 研发时所得出的高频率设计经验,RDNA 2 加入了 Streamlined Micro-Architecture 设计,DCU 的 Pipeline Logic 布局修改后,使运行频率可以在相同功耗下提升 1.3倍。

RDNA 2  微架构在每个 CU 中加入了 Ray Accelerator (RA) 硬件加速运算单元,属于软硬件混合加速方式,实现支持光线追踪技术,它是基于 Microsoft  Raytracing (DXR) API,每个 Ray Accelerator 每个时序可完成 4 Ray/Box 或 1 Ray/Triangle 的光线相交运算,运算速度较纯软件运算性能提升约 10倍,虽然与 NVIDIA 的 RT 硬件运算单元设计仍有距离,但至少 Ray Tracing 不再是 NVIDIA 卡的专利。

区别在于 NVIDIA 采用更宽的显存位宽、更高速的 GDDR6X 显存颗粒,AMD 的做法明显比 NVIDIA 聪明,在 RDNA 2 微架构中首次加入 Infinity Cache 技术在 L2 Cache 与 GDDR6 之间加入了 128MB 缓存,GPU 与 Infinity Cache 之间由 16 条 64bit 1.94GHz 的 Infinity Fabric 连接,频宽基本上是 256bit GDDR6 显存的 4 倍。

据 AMD 称,Infinity Cache 将能大幅升游戏 工作负载 资料使用率,降低读取延迟达 34%,并减少 GDDR6 显存频宽使用,实际性能表现和 384bit GDDR6 的 2.17倍,但功耗只有 384bit GDDR6 的0.9倍 功耗, Infinity Cache 可以说是 RDNA 2 微架构最重要性能改动。

搭配 Ryzen 5000 支持 Smart Access 技术

除了 Infinity Cache 技术外,RDNA 2 微架构另一项重要的显存改良就是 Smart Access Memory 技术,传统的 x86 PC 架构中受限于 PCIe 规范,只能通过 Base Address Register (BAR) 每次将 256MB 系统显存射映到 GPU 显存,这个限制严重影响到系统内存与 GPU 显存之间的资料传输效率。

AMD 在 RDNA 2 中加入了全新 Smart Access Memory 技术,当玩家使用AMD 新一代 Ryzen 5000 系列处理器时,不再使用 PCIe Mapping 方式,CPU 可以直接存取 GPU 显存,完全解除 CPU 与 GPU 之间的读写瓶颈,游戏性能平均能提升约 6%,尤其对大量使用 Texture 的游戏,性能提升会更为明显。

(0)

相关推荐