卓越生产力工具!NVIDIA RTX A6000专业显卡测试
【前言】
NVIDIA在1999年8月发布首款真正意义上的可编程GPU——GeForce 256,从此奠定了显卡在PC中的重要地位。同年11月再度推出基于GeForce 256核心、定位生产力工具的Quadro产品线,以90%以上的市场占有率霸占该领域至今。通过强劲的性能以及完善的生态环境,推动设计和视觉化产业的快速发展。
NVIDIA新一代Ampere架构的横空出世再一次将GPU性能推向了新的高度,其中面向专业领域有3款——NVIDIA A40、A100与RTX A6000,前者针对高性能计算、后者主攻图形渲染。本人有幸拿到了RTX A6000,今天就为大家分析它究竟有什么特点。
【RTX A6000硬件特性】
Ampere架构全新的SM多单元流处理器,单精度浮点 (FP32) 运算处理速度提升1倍,优化的性能功耗比,显著提高图形和模拟工作流程的性能,例如复杂的3D计算机辅助设计 (CAD) 和计算机辅助工程 (CAE)。
第2代RT Core的吞吐量是上代的2倍,并能同时运行光线追踪和着色或降噪功能,大幅加快工作负载的运行速度,例如电影内容的逼真渲染、建筑设计评估和产品设计的虚拟原型创建。这项技术还可加速渲染具有光线追踪效果的动态模糊画面,更快获得视觉准确性更高的结果。
第2代Tensor Core提供的人工智能训练吞吐量达到上代5倍,而且无需更改代码即可加速AI和数据科学模型的训练。从硬件上支持结构稀疏度使推理吞吐量提升一倍。Tensor Core 还通过DLSS、AI降噪等功能将AI引入到图形处理中,并增强了特定应用程序的编辑功能。
第4代PCI-E总线,相比PCI-E 3.0带宽增加1倍,能够更快地执行AI和数据科学等数据密集型任务。第3代NVIDIA NVLink,高达112GB/s的GPU互联带宽提供一体式可扩展显存,可加速图形和计算工作负载,并能处理更大的数据集。
RTX A6000采用完整GA102核心,内含10752个CUDA单元,配备48GB 384bit GDDR6 ECC显存,带宽768GB/s(GDDR6X没有如此的存储密度,发热量和功耗略高),可通过NVLink扩展到高达96GB。输出接口是4个DisplayPort 1.4a,连接多台8K显示设备,实现大型洞穴式自动虚拟环境 (CAVE)、视频墙等应用场景。
【外观赏析】
NVIDIA RTX A6000定位生产力工具,采用简约实用的方正造型,正面为镜面黑色面板,侧面通过金色的锯齿形进行装饰。传统公版涡轮式散热有利于组建多卡的高性能计算平台。
涡轮风扇的风道有能增加风压的收腰设计,显著提高整卡运行起来的散热效率并降低风扇高速旋转时产生的风噪。产品型号雕刻在显卡靠近IO挡板的前部,并使用金漆上色,彰显高端。
双路NVLINK接口搭配桥接器连接另一块RTX A6000扩展显存和性能,实现高达112GB/s带宽和96GB的共享GDDR6显存,满足最大视觉计算工作负载的需求。
SYNC接口用于连接Quadro Sync同步卡,轻松部署和管理多个显示设备,最多同步32个4K显示设备,确保显示设备的输出帧保持一致,不产生任何图像伪影。
RTX A6000背面加入全尺寸铝合金背板,保护PCB元器件、增加强度的同时,涡轮风扇也可以通过背部来进风,避免多卡运行时风道过于密集的问题。
输出接口方面,RTX A6000共使用4个DisplayPort 1.4a接口,单卡即可连接4屏8K 60fps同步输出,打造炫目的超高分辨率画面,来满足各行各业的可视化和展示需求。
RTX A6000标称功耗高达300W,但仅有1个8 PIN供电接口,为了兼容更多的电源,附赠1条双8 Pin电源转接线。
【内部拆解】
由于RTX A6000搭配48GB超大容量GDDR6显存,PCB两面共有24颗显存颗粒,对显存散热提出更高要求,所以铝合金材质背板上贴了大量显存导热贴。
散热模块采用大尺寸均热板,并且表面经过镜面抛光处理,更加高效地将热量传递到鳍片上。显存和供电的位置也都贴上了导热贴。
RTX A6000的PCB看起来是不是有似曾相识的感觉?密集的元器件布满了尺寸不大的PCB,看上去非常养眼,GPU核心处电容选用对高频性能更友好的MLCC阵列。
RTX A6000核心代号是GA102-875-A1,三星8nm工艺制程,内部拥有高达10752个CUDA核心、84个第2代RT Core、336个第3代Tensor Core。同时PCI-E 4.0得到支持,通过x16获得高达64GB/S的强大带宽,要比PCI-E 3.0高了一倍之多。
显存来自三星2000MHz频率GDDR6,单颗容量2GB,正面与背面各12颗组成384bit位宽48GB容量。之所以没有采用GDDR6X显存,主要原因是目前的单颗容量只能做到1GB,无法实现48GB规模,要知道很多专业应用是对显存容量极为苛刻。
【性能测试】
通过GPUZ 2.37.0版本能够准确识别出NVIDIA RTX A6000的规格信息,测试使用的驱动版本为461.72 DCH,系统环境Win10 64。
「AIDA64 GPGPU」
得益于最新的Ampere架构,RTX A6000在GPGPU通用计算中具有非常出色的表现,通过AIDA64测试,单精度浮点34384 GFLOPS,双精度浮点604.8 GFLOPS。
「Blender」
Blender是一款开源的跨平台全能三维动画制作软件,提供从建模、动画、材质、渲染、到音频处理、视频剪辑等一系列动画短片制作解决方案。Blender拥有内置有基于GPU技术Cycles渲染器。并以Python为内建脚本,支持多种第三方渲染器。
在Blender 2.90或更高版本中,能够开启OptiX GPU渲染选项,从而充分利用到RTX A6000的强劲性能和多达48GB的高速显存空间,大大减少渲染时间。
RTX A6000的48GB大显存允许GPU同时为最终帧渲染和交互式渲染会话加载场景数据,从而获得更好的创作体验,仅需32.95秒就能输出一帧高品质的3D图像。
「V-Ray」
V-Ray是知名的3D渲染器,支持NVIDIA显卡硬件加速。最新版中能够选择基于CUDA渲染加速或是RTX光线追踪渲染。CUDA模式得分为1420,切换成RTX渲染得分2014。
「3DMark」
虽然RTX A6000是高端生产力工具,仍旧可以降维打击作为旗舰级游戏显卡使用。3DMark测试结果:Time Spy图形分17647、Time Spy Extreme图形分9141,运行大型游戏毫无压力。
【Quadro Experience】
Quadro Experience是NVIDIA针对图形工作站推出的专用程序,能提供必要的生产力工具,让工作更加快捷、更为智能化。包含 4K录制功能、新版驱动更新提醒和游戏优化等内容。
随着众多团队的地理分散程度越来越高,以及上市时间压力不断压缩项目时间,如今的专业工作流程比以往更注重交互和协作。Quadro Experience提供本地屏幕截图和4K桌面录制功能。内置的录制工具可优化工作流程,从而加快产品开发周期,以及提升设计评审等工作的速度。
在Quadro Experience中,还可以直接访问NVIDIA RTX桌面管理器,从而轻松管理单显示器或多显示器工作空间。借助灵活的窗口快照、用户配置文件、窗口管理和热键支持等功能,可以完全控制屏幕有效使用区域,以实现持续工作不间断。
【全文总结】
总的来说,NVIDIA RTX A6000凭借Ampere架构的诸多技术革新,不仅在专业生产力工具软件中达到不可思议的性能成倍提升。同时产业生态的完善,让越来越多软件应用到NVIDIA提供的新特性,充分实现创新突破,实现前所未有的工作成果。