RTX 3080用的GDDR6X显存有什么大不同?
这几天PC业界最火爆的新闻肯定就是NVIDIA发布新一代RTX 30系列显卡,没有之一。新的显卡自然是使用了搭配有一系列新技术的新核心,比如说第二代RT Core啊,第三代Tensor Core啊这些。而对于RTX 3080和RTX 3090这两张高端显卡,它们GPU核心的外部,作为仓库的显存也有很大的变化,具体一点就是从GDDR6升级成了全新的GDDR6X。
想必还有很多读者记得当年在高端Pascal显卡上面出现的GDDR5X显存,它是NVIDIA和美光联手合作研发出来的显存种类,随后被提交给了JEDEC进行标准化。不过可惜的是,除了美光之外,没有其他内存厂采用该标准生产显存产品,而显卡市场上,除了高端的几张Pascal显卡外,也没有别的显卡采用GDDR5X显存,就连NVIDIA自己也在之后就转向了更高速的GDDR6显存。
NVIDIA在2018年的Turing显卡上面首次应用了GDDR6显存,在当时,GDDR6显存能够提供比疲态尽显的GDDR5高的多的带宽,也让GDDR5X黯然失色。在GDDR6显存正值壮年的现在,NVIDIA却再次联手美光,在短短的两年之后就推出了它的进阶版本,那么到底是什么原因让NVIDIA决心换用GDDR6X,它的背后隐藏了哪些技术,又能带来哪些好处呢?本期超能课堂就讲一讲GDDR6X显存和它背后的全新技术。
带宽最高提升50%,突破1000GB/s大关
显存是显卡用来存放各种计算、渲染用素材的仓库,GPU在执行图形计算任务的时候,会不停地从这个仓库里面拿东西,而CPU也会不停地把数据传递过来,要GPU塞进仓库里面备用。那么这个仓库的大小,存取素材的快慢会很明显地影响到GPU的工作效率,也就是说,显存的大小和显存的带宽都会对显卡的整体性能产生影响。
而在如今,1080p分辨率早已普及,不少玩家已经开始用上1440p分辨率或者是4K分辨率的显示器或电视,在更高的分辨率下,游戏的材质、纹理等原始数据的体积越来越大,在进行图形计算时所需的数据交换带宽越来越高,这就需要显卡设计厂使用有更高带宽和容量的显存系统,这也是NVIDIA和AMD两家一直在提升他们显卡的显存规格的缘由。
上一代的GDDR6显存将数据的预取宽度从GDDR5时代的8-bit拓宽到了16-bit,这让它的等效频率再次倍增,能够达到14~16Gbps左右,在显存位宽相同的情况下,其带宽较8Gbps的GDDR5显存高75%~100%,进步非常巨大。而GDDR6X做到了更高的等效频率,其范围为19~21Gbps,也就是说,同显存位宽的情况下,它能够增加35%~50%的显存带宽,达到912GB/s~1008GB/s,正式突破了1000GB/s这个大关。
但是GDDR6X如果强行用传统方式,也就是提升运行频率的方式去获取带宽的话,会遇到非常大的困难,比如说受到工艺的制约,它的运行频率去不到更高,即便是能够实现更高的等效频率,其信号的纯净度也会大打折扣,在电气性能上无法满足要求。
那么该如何去推高它的等效频率呢?NVIDIA和美光选择从信号的调制方式上入手。
PAM4信号调制方式
原本的GDDR系显存在传输数据时使用的是非常原始的二进制信号,再具体一点,该系列显存使用的是NRZ(Non-Return-to-Zero)调制,或者叫做PAM2调制。这种信号调制方式很简单,它用高电平代表1,低电平代表0。如果要提高它的数据传输速率,只要提高显存的时钟频率即可。但现在由于受到制程工艺等各方面因素的限制,显存的时钟频率在现阶段已经很难再攀高,那么该怎么办呢?厂商想到了用新的信号调制机制来提高信号传输的效率,他们选择了已经有较为广泛的PAM4。
PAM是一种用模拟信号脉冲编码信息的信号调制方式,PAM4是其中较为简单的一种。与NRZ这种仅有高和低两种状态的二进制信号不同的是,PAM4有4种不同的电平值,也就是有4种不同的状态,而每种状态对应着一组0和1的组合,也就是说,它的每个状态对应了2个bit的数据量,较NRZ是翻倍的。
如果这么说还有些模糊的话,这里可以将PAM4信号类比成MLC闪存存放数据的方式。我们知道,MLC闪存的每个单元可以存放2-bit的数据,在电信号层面上它表现为4种不同的电平,每个电平之间有固定的电压间隔,主控在读取和写入的时候都按照固定的规则将数据和电信号进行转换。
那么GDDR6X也是如此,根据NVIDIA公布出来的信息,GDDR6X有四种不同的电平信号,每个电平信号之间的电压差为250mV。
在采用PAM4调制之后,显存系统的信号纯净度有了一个很大的提升,有图为证:
上为GDDR6,下为GDDR6X
在换用PAM4之后,如果继续沿用原本的16n突发读取长度,那么每次将会读取到32-bit的数据,为了保证兼容性,GDDR6X将Burst Length降回了GDDR5时代的8n,这样每次的预取数据仍然为16-bit。
NVIDIA的黑魔法加持
为了更好的配合和利用GDDR6X显存,NVIDIA还应用了一些自己的黑魔法技术,比如MTA(Max Transition Avoidance)编码就是其中之一。
MTA编码是NVIDIA的专利技术,它是一项用于配合PAM4信号调制方式的技术,原理是将原本全长为16-bit的突发数据分割成两部分进行发送,以降低信号在传输过程中出现的误码、损耗等问题。
更高的能效比
不可否认的是,当代显卡上的显存能耗是越来越高了,一个是运行的频率高了,另一个因素是容量大了。而GDDR6X的一大特点就是能够提供更高的能效比。
美光提供的数据显示,同样的8颗显存,等效频率为21Gbps的GDDR6X显存的能效比跟14Gbps的GDDR6显存在每比特能耗上要低15%。要知道,在此同时GDDR6X还提供了多50%的显存带宽。
GDDR6X产品及应用
由于GDDR6X显存是NVIDIA和美光联手研发的,它暂时还没有被JEDEC给标准化,所以也没有第二家能够生产GDDR6X显存的内存生产商。
目前美光提供两种GDDR6X颗粒,容量密度均为8Gb(单颗1GB),两种颗粒的区别只有频率,后缀为19的颗粒等效频率为19Gbps,后缀21的颗粒等效频率为21。很明显,在RTX 3080上出现的就是型号为MT61K256M32JE-19的颗粒,但RTX 3090的显存颗粒现在还不明朗。
由于GDDR6X采用了完全不同的信号调制方式,所以GPU的内存控制器需要进行重新设计才能支持它,目前NVIDIA应该也只是计划只在GA102核心上做它的支持,而定位更低的GA104、GA106等核心应该都只支持GDDR6。在RTX 3070及之下的RTX 30系显卡和未来可能的GTX 26系列显卡上,我们看到的应该仍然是GDDR6显存。
总结:GDDR6X可能不会很普及,但它代表了未来方向
GDDR6X在GDDR家族中首次应用了PAM4信号调制方式,提升了信号传输的效率,能够以更低的时钟频率达成同样的等效频率。PAM4信号调制方式也并不是什么新的技术,它在高速以太网中早已经被广泛应用,而且目前正处于规划中的PCIe 6.0总线也计划将信号调制方式从NRZ切换到PAM4上去,在频率提升已经达到物理极限的时候,更高效率的信号调制方式就是新的用来提升带宽的手段了。
由于GDDR6X和GDDR5X类似,是NVIDIA和美光合作开发的,所以短时间内我们很难看到采用GDDR6X的A卡,也很难说美光会不会将GDDR6X提交给JEDEC进行标准化。就之前GDDR5X的情况来看,GDDR6X应该不会像GDDR6那么普及,主流级别的显卡将仍然采用GDDR6显存,而专业级的GPU则会选择有更大带宽的HBM。
或许我们不会看到标准化的GDDR6X,但未来比GDDR6更新的标准可能会吸收GDDR6X上所使用的新信号调制方式。它可能不会很普及,但它确实是显存发展的一个未来方向。