AMD公布Vega显卡详情:5年来GCN大改,HBM 2扩容没提速
从2011年底首发HD 7970显卡以来,AMD使用GCN架构已经有5年多时间了,同时针对图形、计算双重使命开发的GCN已经衍生出4代架构,时至今日依然是AMD显卡的主流,在异步运算等设计上很有前瞻性,在DX12/Vulkan时代依然不落伍。尽管如此,AMD还是准备了新一代显卡架构,昨晚正式公布了Vega显卡的架构设计,GCN架构将被NCU架构取代,不仅用上HBM 2显存,还会使用新的HPC缓存架构。
AMD之前就预告了这次活动,前情我们就不说了,这次官方公布的PPT洋洋洒洒近40页,前面介绍什么市场、趋势的内容就不提了,直接上干货,这篇文章可以告诉我们的是:
·Vega显卡新一代显存架构
·Vega显卡新一代几何渲染管线
·Vega显卡新一代NCU单元
·Vega显卡新一代像素引擎
但是AMD并没有公布的信息有Vega显卡的具体规格,包括但不限于流处理器单元数量、核心频率、显存频率、性能水平、上市时间、售价等等,这些关键信息还有待产品正式发布时再公布。
我们此前知道的Vega显卡
Vega显卡新一代显存架构
Vega显卡为人熟知的一个特点就是HBM 2显存,不过早在2015年的Fiji核心上AMD就使用过第一代HBM显存了,只是当时的Fiji架构并不是完全针对HBM开发的,现在的Vega核心不同,AMD称之为世界上最具并行性的GPU显存架构。
HPC缓存
HBM 2不仅仅是做显存,AMD给的定义是高带宽缓存(HPC,High Bandwith Cache)。
HBM 2优势
有关HBM 2显存的优势,我们之前的文章也介绍过多次了,相比HBM 1代1Gbps的速率,HBM 2的速率提升到2Gbps,这也是AMD宣称2x带宽/针脚的来源。
8倍密度,这是说HBM显存占用的面积比GDDR5更低
Techreport网站给出了Vega核心照片
看完上面的示意图,有些人可能要注意到HBM 2显存的配置方式跟Fury显卡不同——AMD之前是每个GPU核心堆栈4颗HBM显存,现在的Vega则是堆栈2颗,TR网站曝光的Vega实物图也证实了这个变化。这就解释了AMD之前公布的Vega显卡在使用了速率翻倍的HBM2之后,带宽为何是512GB/s,只跟第一代HBM显卡相同。
HBM 2显存容量更大,三星、SK Hynix都可以做到单颗容量4GB了,Vega显卡只要2颗就能实现8GB容量,容量上比Fury显卡扩大一倍,但堆栈数量少了一半,导致等效位宽从4096bit减少到2048bit,所以总带宽一降一升之后并没有变化,还是512GB/s。
这个问题怎么看呢?首先说512GB/s的显卡带宽在消费级产品依然是傲视群雄,比它高的是Tesla P100加速卡的720GB/s,但后者是针对高性能服务器市场的,价格贵的要死。其次,AMD这么做显然有助于降低成本,毕竟堆栈的HBM颗粒越少,制造难度也越低,成本也会更低。
HPC缓存主控
最高支持512TB虚拟寻址空间
自适应、细粒度数据迁移
辐射4、巫师3游戏的实例
AMD这么做的好处是什么?他们例举了巫师3、辐射4两款游戏做例子,它们分配的寻址空间要比实际占用的高得多,大约是实际使用的2倍,浪费严重。之所以这样,原因与DX11 API效率低有关,但也跟传统游戏的使用方式有关。
Vega显卡新一代几何渲染管线
Vega显卡第二个改进之处就是全新的可编程几何渲染管线,号称每周期吞吐率提升一倍,并使用了新的原语渲染器,改善了载入均衡。
2倍的吞吐率
新的原语指令渲染器
改善了载入均衡
Vega显卡新一代NCU单元
AMD显卡的GCN架构已经使用4代了,可以说是老骥伏枥,在Vega显卡上AMD又推出了NCU(Next-Generation Compute Engine)架构,优化了IPC性能,提高了灵活性。
NCU新一代引擎
此前曝光的AMD NCU架构
AMD在这次的PPT中并没有详细介绍NUC架构的特点,不过之前有消息提到了NCU的改进之处——现有的GCN单元中每个CU计算单元是64个流处理器,实际上是由4组固定16-Wide的单元组成,而Vega显卡的NCU架构中每组CU单元更具灵活性,可以根据工作负载来动态调配。
支持FP8、FP16精度计算
除了常规的FP32单精度、FP64双精度之外,NCU还将支持8位、16位计算,性能还会翻倍甚至4倍,这点其实也不是秘密了,因为之前公布的Radeon Instinct专业卡中MI25就是基于Vega显卡的,其25TFLOPS的性能就是指FP16,FP32浮点性能是12.5TFLOPS。
NUC为更高的时钟频率优化
注意这里的说法,AMD强调NCU是为更高的时钟频率优化,显然是在暗示Vega显卡的频率可以更高,目前的Polaris显卡虽然也是14nm工艺的,不过GPU核心频率在1.5GHz以内,这点比不上NVIDIA的Pascal显卡,后者跑到1.8GHz以上都不是事儿,现在AMD也强调Vega显卡为更高的时钟频率及IPC性能优化,希望核心频率也能跑的更高。
Vega显卡新一代像素引擎
最后一部分改进就是新一代像素引擎了,目前传统的架构中像素与纹理数据是非一致性的,新的像素引擎现在是后端与L2缓存相连,这将会提高使用延迟渲染技术的应用性能,换句话说这个改进对VR渲染之类的应用很有价值。
关注微信号expkf01,第一时间获知精彩活动和原创科技资讯。