砍了HBM 2、双精度及4路SLI,Titan X显卡凭啥卖1200美元?

NVIDIA之前出人意料地发布了Tiatn X显卡,这是Pascal架构的“泰坦”显卡,将成为GTX TitanX的继任者,8月2日就会正式开卖,售价1200美元。官方资料显示Tiatn X显卡拥有3584个CUDA核心,规格看起来跟之前GP100核心一样,但它实际上是完全不同的GP102核心,砍了HBM 2显存,砍了FP64双精度,而且也不是完整的GP102核心,是阉割版,而对高玩来说,你们再也不能愉快地用四路Titan X玩(zhuang)耍(bi)了。

NVIDIA的Titan X显卡售价1200美元

对于Titan X显卡,此前的发布新闻中我们已经得知了它的一些规格——3584个CUDA核心,基础频率1417MHz,加速频率1531MHz,显存为GDDR5X,位宽384bit,频率10Gbps,带宽480GB/s。

不过官方公布的信息还是有点少,关注Titan X显卡的高玩显然需要更全面了解该卡的资料,现在有些信息可以分享一下:

·关于GP102核心:架构与GP100不同,Titan X不是完整版核心

NVIDIA的Tesla P100使用的是GP100大核心,专为高性能计算而生,消费级市场上不会有GP100大核心,取而代之的是GP102核心,Titan X就是GP102核心的第一款产品,但它并不是完整版核心,而且GP102的架构跟GP100不同,倒是跟10系列核心的GP104核心相同。

GP104核心如图所示,GP102相当于GP104的150%放大版

这也很好理解,GP100因为要支持HBM 2显存、NVLink等,而且FP64双精度单元很变态,但这些设计在GP102上没什么意义了,而且会大幅增加成本,这个GP102核心的架构跟GP104差不多,只是规模上不同。

具体来说,我们知道GP104核心拥有4组GPC单元,每组由5个SM单元组成,每个SM单元又有128个CUDA核心,搭配256bit位宽,而GP102核心拥有6组GPC单元,完整版是30组SM单元,3840个CUDA核心,位宽384bit,规模比GP104提升50%。

只不过Tiatn X用的GP102核心阉割了,砍掉了2组SM单元,CUDA核心从3840降至3584个,而完整版GP102核心用在了刚发布不久的Quadro P6000显卡上了——后者拥有384个CUDA核心,性能要比Titan X更强。

有个小细节大家注意了没——NVIDIA官方对Titan X的描述是“Ultimate”(可以理解为终极、旗舰),但不像以往的Titan显卡发布时那样强调世界最快或者世界最强显卡(先别提Pro Duo这样的双卡),而Quadro P6000上NVIDIA官方博客描述的才是世界最快显卡,官方肯定知道Titan X并非世界最快显卡了。

Titan显卡用阉割版核心并非第一次,第一代Titan显卡用的就是阉割版GK110核心,之后的GTX Titan Black用的才是完整版GK110核心,但是后面的GTX Titan X就没用过阉割版核心了,高玩们现在被惯坏了,如果用阉割版核心做超旗舰,特别是售价超过1200美元,估计心里会不爽吧。

·关于浮点性能:阉割了FP16双精度/FP16半精度,新增FP8精度

GP100核心最让人震惊的地方之一就是重新强化双精度计算,甚至比之前的GK110核心还要变态,每个SM单元中按照2:1的比例塞入了大量FP64单元,也就是说FP64性能达到了FP32单精度的一半,FP32浮点性能是10.6TFLOPS,FP64性能为5.3TFLOPS,真的是为了计算而生。

此外,针对深度学习,NVIDIA还在GP100核心上增加了FP16半精度全速运算支持,因为并不是所有运算都需要高精度的,深度学习对性能要求更高,所以FP16性能达到了21.6TFLPOPS。不过在GP102身上,双精度被砍是必然的,因为FP64单元不仅会占用大量核心面积,对功耗、发热也会有影响,更重要的是在非专业计算市场上,FP64精度的需求并不高。

意外的是FP16半精度运算也砍了,但NVIDIA取而代之的是FP8精度,性能为44TFLOPS,这也是NVIDIA一直在强调的事。

需要说明的是,阉割了FP64和FP16不代表GP102完全不支持这两种运算精度,FP64估计会回到目前1/32的水平,详细资料还需要等待NVIDIA白皮书进一步确认。

不过阉割FP64的好处也是有的,GP100核心的面积为610mm2,晶体管数量153亿,GP102核心面积是471mm2,120亿晶体管,有助于降低成本、功耗及发热。

·关于SLI:土豪也别想3/4路SLI了,玩好双路SLI吧

如果你并关心Titan X显卡的核心架构、规格,只想做个好好玩显卡的土豪玩家,那么SLI方面的变化可能会让这些土豪玩家不高兴——以前可以用四路GTX Titan SLI接受众人敬仰,但Titan X就不会这么痛快了。

从GTX 1080显卡开始,NVIDIA就开始刻意限制多卡SLI,特别是3路、4路SLI,连个可信服的理由都没有,官方就是这么任性——玩SLI就玩双卡吧,3卡、4卡限制多多,此前说是需要玩家去官方申请密钥解锁,但直到现在NVIDIA还是没有给出具体的解锁流程,所以3卡、4卡SLI现在基本上是个摆设了,难道NVIDIA真的担心玩家多卡会毁灭地球?

至于Titan X显卡的3卡、4卡SLI支持,NVIDIA并没有给出明确的回答,在官方页面上可以看到NVIDIA是这样描述的,如下图所示:

Titan X支持SLI,支持SLI HB桥

支持SLI是必然的,而且也支持NVIDIA的SLI HB桥——但是你们要知道,NVIDIA的SLI HB桥只推出了2-Way的,没有3卡、4卡的(有3插槽、4插槽位的,别弄混了),而且售价39.99美元。

综上所述,SLI支持方面,Titan X虽然理论上还是有4卡能力,但实际操作起来并不容易,官方限制多多,再也不能愉快地装X了。

·关于Titan X命名:去掉GeForce是因为这不仅仅是游戏卡

这次的Titan X显卡并没有换名字,但大家也注意到了它已经不叫GeForce了,官方的称呼也是New Titan X(库克大人的New iPad命名深入人心啊),这个改变容易让人搞混,不知道有没有JS会用上代的GTX Titan X骗人呢,好在GTX Titan X现在应该也没什么库存了。

NVIDIA为什么要去掉GeForce品牌名呢?对于这个问题,官方解释说GeForce是消费级显卡的品牌,但Titan X显卡的目标用户不仅仅是游戏玩家,有些专业用户也可以选择它——估计这也是NVIDIA强调FP8精度运算的原因吧,毕竟FP8运算说GP104核心也不支持的。

这么说吧,售价1200美元的Titan X在游戏显卡中算是相当贵了,但如果以专业用户的角度来看,一千美元只能算是入门级,便宜多了,用作吃饭的家伙也算是赚了——这就是NVIDIA官方的打算。

好了,现在大家对Titan X显卡应该有个清晰的了解了,1200美元的价格比前代涨了20%,对用户来说虽然阉割核心、HBM 2等规格有些不爽,但最关键的是Titan X性能值不值得买,官方表示其性能比GTX Titan X高了60%,但是这是就浮点性能来说的,而且现在有GTX 1080显卡在前,其售价约为Titan X的一半,显存容量8GB,也是GDDR5X,Tiatn X的理论性能优势只有20-30%左右(11 vs.9 TFLOPS),这两天曝光的性能实测也证实了一点——除非有极强的说服力,否则Titan X真的是靠200%的信仰来吸引消费者了,不过NVIDIA并不担心Titan X的销售,有钱人的想法和玩法不一样,他们并不斤斤计较性价比。

关注微信号expkf01,第一时间获知精彩活动和原创科技资讯。

(0)

相关推荐