NVIDIA正式公布Turing架构:自2006年以来图形界最伟大的跨越

虽然NVIDIA正式公布新一代的GeForce游戏卡应该要等到下周科隆游戏展前的“GeForce Gaming Celebration”活动,但是在昨天正式开幕的SIGGRAPH 2018,这场图形界顶级大会上,NVIDIA是不可能空手到来的,而事实上他们昨晚确实有很多重量级的公布,包括全新的Turing架构(注意,官博现在还没有使用任何中文命名),包括第一张专用于光线追踪的GPU:Quadro RTX,但是我们还是应该从它的根基:新的Turing架构开始说起。

NVIDIA的官方直播大概是早上的8:45结束的,现在还有很多细节没有公布出来,所以我们先来看看官方的Newsroom,首先关于Turing架构,NVIDIA对其非常有自信,称其为自从2006年通过统一渲染架构带来CUDA后最伟大的飞跃,所以你可想而知NVIDIA对其的期望,或者说野心。新的Turing架构很重要的一点就是混合渲染(Hybrid Rendering)来实现光线追踪,具体来说包括引入全新的RT Core来加速光线追踪,还有我们已经在Volta架构看到的Tensor Core来加速AI处理,当然还有光栅化,毕竟现在我们还没有厉害到能够抛弃光栅化的程度,所以新的Turing架构是包含多种力量的,而这种包含多方力量来实现光线追踪的混合渲染,应该会成为日后的关键词。

每次有新架构到来,我们最关心的就是微架构级别的变化:有哪些新增的特性,有哪些精简的部分,如果说Volta架构我们开始看到Tensor Unit,那么新的Turing架构当中最重要的就是新引入的RT Core。既然是“RT”,顾名思义就是冲着光线追踪(Ray Tracing)来的,它的作用是用来加速处理光线在三维环境中的传播,处理光线的速度是目前Pascal架构的25倍,同时让GPU作为节点处理最末帧(Final Frame)的效果渲染要比将CPU作为节点的速度快30倍。

同时让人兴奋的是,自从Volta架构开始引入的Tensor Core,我们都知道它能提供远远高于传统GPU的人工智能、深度学习性能,这部分性能能够赋予我们的GPU去做很多以往没有的工作,比如说在Turing架构当中的Tensor Core,能够在每秒处理500万亿的张量运算,通过这部分性能,我们能实现以往无法奢望的功能,比如说新的基于深度学习的抗锯齿技术:DLAA(Deep Learning Anti-Aliasing,万物基于深度计算)。

最后在传统的架构方面,Turing在我们熟悉的SM单元当中新增整数处理(Integer Unit)单元,以及新的统一缓存架构,能够带来目前架构两倍的带宽。规格方面,Turing架构能够搭载最多4608 CUDA,并且能够带来最高16 TFlops浮点性能。当然这是新发布的三款Quadro RTX显卡当中性能最强的RTX 8000而言的。

具体来说,昨晚NVIDIA共发布三款显卡,分别是Quadro RTX 5000\6000\8000,最高端的RTX 8000跟次旗舰的RTX 6000两张显卡在流处理器数量、张量单元数量、光线追踪性能方面都是一致的,分别是4608 CUDA、576 TC、10 GigaRays,只有显存存在差异,RTX 6000是搭载24GB GDDR6显存,通过NVLink桥接可以实现48GB显存,按照现在16Gb的显存来看,也是很夸张的,而RTX 8000的显存直接翻倍。“入门级”的RTX 5000则是3072 CUDA,384 TC(Tensor Cores)、6 GiagaRys,16GB GDDR6显存。

在流处理器方面,如果是按照Volta V100的架构,那就是每组SM单元包含64 CUDA,即72组SM单元,但是72组SM单元怎么构成GPC单元呢?过去的Volta V100是每组GPC单元包含14组SM单元,那这里就是除不尽的,难道NVIDIA还暗藏多余的SM单元?因为GPC单元肯定是4组、6组、8组的组成,如果是按照6组,就应该是6*14=84组SM单元,就算是按照128 CUDA/SM的构成,要么每组GPC单元的构成已经精简,要么目前的RTX 8000还不是完整架构。

至少就卡本身的规格方面,目前AnandTech已经拿到部分消息,他们已经做成架构之间的对比,就是RTX 8000分别对比GV 100、P6000、M6000,我们首先能看到在核心面积、晶体管数量、CUDA数量、纹理单元数量方面对比V100的规格是有精简的(甚至核心面积都变小),频率提高到1730MHz,显存频率14Gbps,位宽384-Bit,单精度16 TFlops,最后核心代号是尚不清楚的,GT102?现在谁知道呢。

图片来源于AnandTech,详情请咨询这里

(0)

相关推荐