2020年12月1日,高通正式发布了他们最新一代的旗舰5G SoC——骁龙888。在当时的发布会后,我们三易生活已经对骁龙888的技术特性与拍照设计进行了一些深挖。但毕竟在那个时候,这款全新旗舰方案的具体性能数据尚未公布,因此外界对于它的实际水准还是有着诸多猜测。好在两个多星期的时间后,高通方面终于以视频+技术文档的方式,正式公布了骁龙888的性能测试成绩。虽然这次的测试还是基于一台并不属于任何品牌,使用了12GB LPDDR5内存+512GB闪存存储配置的开发用机,但它已经足够让我们看到骁龙888一部分的真实性能表现。为什么我们要说是“一部分真实性能”?一方面,这是因为骁龙888这次的跑分成绩的确非常亮眼。安兔兔综合性能成绩平均达到73.5万分,Geekbench5单核成绩平均达1132、多核则平均为3786,GFXBench曼哈顿场景平均高达169帧/秒,安兔兔AI测试成绩相比上代近乎翻倍,是竞品5nm旗舰芯片的五倍还多。换句话说,从CPU到GPU,再到AI性能,骁龙888都实现了巨大的提升与相比竞品的领先。但另外一方面,从我们三易生活目前拿到的相关资料来看,骁龙888这次公布的跑分成绩甚至还很可能不是“全力”。因为高通方面特别有提到,为了体现更接近实际日常使用中的性能表现,所有的骁龙888测试设备这次都完全采用了默认电源设定,换句话说,也就是没有开启许多机型上常见的“性能模式”或“游戏模式”,而是仅以平衡模式跑出的以上这些成绩。这意味着什么?简单来说,这代表着骁龙888很可能同时做到了顶级性能与超高的能效比,同时也意味着当相关机型正式上市的时候,大家看到的跑分成绩还会有进一步上涨的空间。那么问题就来了,高通究竟用了怎样的“黑科技”,让骁龙888实现了如此惊人的性能与能效表现呢?
为什么骁龙888的实测性能会如此之高?如果大家此前关注过我们三易生活的相关报道可能还记得,骁龙888这次在制程与架构上都进行了全面进化。一方面,它使用了最新的5nm制程,首次在高通旗舰5G方案中实现了5G SoC的一体化设计,有效改善了整套方案的能效比;另一方面,在对性能影响至关重要的架构上,骁龙888这次不仅用上了最新的Cortex-A78大核心,还首发了全新的Cortex-X1超大核。其实说起Cortex-A78,许多朋友都应该不会感到陌生。作为ARM去年发布的大核架构Cortex-A77“直系后代”,同功率下性能提升20%(数据源自ARM官方资料)的Cortex-A78,如今已经被高通、三星、联发科三家选定为次世代SoC所使用的CPU大核方案。但大家如果环顾市场就会发现,相比于Cortex-A78的“快速普及”,定位更高的Cortex-X1目前却仅有高通骁龙888采用,那么这是为什么呢?在ARM官方的资料中,我们其实很容易就能找到答案。这是因为Cortex-A78属于正常产品线更迭的产物,也就是所谓的“Roadmap core(路线图核心)”,客户只要肯掏钱,都能直接买到。而Cortex-X1则不然,它是ARM新推出定制设计服务的最新产物,属于“Custom core(定制核心)”的一种。说白了,就是由高通提出需求,双方共同设计出来的超高性能方案。这也就解释了为什么骁龙888能够首发X1超大核,以及为目前还没有第二家芯片厂商宣布跟进的原因。那么与“公版”的Cortex-A78相比,定制超大核Cortex-X1到底有哪些优势呢?简单来说,它可以视为Cortex-A78的“满血超级增强版”。相比A78,X1超大核架构将宏运算(Mops)的带宽增加了30%,将矢量加速单元(NEON)从两组128bit直接加倍为四组128bit,将所有的缓存配置全部加倍。于此同时,它的乱序执行设计完全不同于A78的小规模节能思路,而是采用了更类似苹果A系列或三星“猫鼬”的224条超大规模设计,以此来将重负载下的单核性能推向极致。事实上根据ARM方面早前公布的数据显示,与Cortex-A78架构相比,Cortex-X1的调度带宽增大了33%,整数运算能力提升了23%,浮点运算和机器学习能力更是大涨100%之多。考虑到我们前文中所说Cortex-A78对比Cortex-A77“仅有”20%的性能提升幅度,不难意识到Cortex-X1所具备的这种巨大性能进步,给骁龙888的CPU部分带来了多大的优势。
看完CPU部分,让我们将目光投向骁龙888的GPU。众所周知,在目前整个Android生态中,高通是唯一一家具备自主研发GPU能力的厂商。这意味着他们不需要被动等待Mali或者PowerVR的GPU授权“上新”,然后再去做适配,而是能够根据自己的SoC需求去进行“堆料”,同时让GPU与芯片的其他部分达成一个更合理的总体能效比。这样的优势体现在骁龙888上,会是怎样的的一个结果呢?简单来说,骁龙888这次集成的Adreno 660 GPU在GFX Bench “曼哈顿3.0”离屏测试中的平均帧率为169帧。我们只需简单在GFX Bench官网上查询一下就可以发现,骁龙888均衡模式下的3D成绩,就已经领先A14(iPhone 12 Pro)28.2%,相比华为麒麟9000(Mate40 Pro 5G)更是高出了47.3%之多。很显然,骁龙888在5nm这个技术节点上,再次拿下了3D游戏性能无可动摇的霸主地位。但是请允许我们提醒一下大家,骁龙888在实际游戏中的帧率和体验领先程度,很可能还远不止47%“这么一点”。为什么我们敢这样说?一方面,我们必须再次强调,今天公布的骁龙888性能测试成绩,是在平衡模式的电源管理设定下测得,而如今主流智能手机产品在运行游戏时,必然都会自动开启“性能模式”或“游戏模式”,使得其性能释放更加激进。另一方面,高通不仅能够自研GPU硬件,同时也有能力为自己的GPU提供驱动更新,以及自研的游戏开发与优化工具。特别是高通为旗下高端平台推出的Snapdragon Elite Gaming开发包,如今已经得到谷歌方面的支持,并将专门用于优化手游性能表现的Android GPU Inspector工具也整合了进来。这相当于Adreno GPU得到了谷歌官方“钦点”,使其更容易得到来自游戏引擎提供商以及游戏开发者的优先适配和性能优化。事实上根据我们目前已知的信息显示,高通的Adreno GPU至少已与Unity、Messiah、NeoX和虚幻等,多个行业主流游戏引擎都有进行合作优化。而骁龙888使用的Adreno 660 GPU还专门新增了在高画质、高帧率游戏中,能有效降低系统负载,进一步提高流畅度的可变渲染率技术。试想一下,当基于骁龙888的旗舰机型面世时,它们将能够从已经准备好的手游A中,得到可变渲染技术带来的额外30%以上的性能(帧率)提高效果,而其他原本就不支持此技术,或是没有做到引擎级优化的GPU则不能从新技术中得到好处。这样一来,骁龙888的实际游戏表现优势岂不就更大了。
最后,我们要来谈谈高通骁龙这一次的AI性能。事实上,关注我们三易生活的朋友或许还记得,我们曾不止一次指明,高通才是最早研发出移动NPU(神经处理单元),也最早将AI算力引入手机平台的厂商。早在2013年,型号为QRC52244563-QC的高通Zeroth NPU芯片就已公开亮相。而从它开始,发展到如今骁龙888上的AI引擎,其实已经算是高通的第六代移动AI设计方案了。那么,骁龙888的第六代AI引擎有什么特点呢?简单来说,它的优势主要表现在两个方面,一是本身的硬件算力特别高,二是计算效率进步明显。论算力,骁龙888这次官方公布的AI引擎总算力高达26TOPS,这比骁龙865(15TOPS)足足提升了73.3%,比同世代的其他5nm旗舰方案更是高出了一倍以上。但如果我们将骁龙888这次的安兔兔AI测试成绩与骁龙865进行对比,就会发现一个问题,骁龙888的平均AI测试成绩高达911883分,比官方榜单上的骁龙865(460413分)足足提升了98%。也就是说,骁龙888的实际AI性能提升幅度,甚至大于了理论上的算力增长幅度。那么这又是为什么呢?原因很简单,因为高通在骁龙888上大改了从CPU到GPU、再到DSP、NPU,甚至ISP在内的全部计算部件的AI处理架构,让它们不仅仅是算力更高,同时能效比和处理延迟也得到了大幅改善。比如说骁龙888这次搭载的Hexagon 780 DSP,就是架构完全改头换面的新设计产品。在以往的骁龙平台内部,DSP里会集成有张量、矢量和标量等多个功能不同的AI加速核心,它们各自都从内存里读取所需的AI数据,根据数据类型“各干各的”。但问题在于,很多时候一项AI运算任务同时需要涉及到好几种运算模型,这就会造成三种加速核心需要反复读写内存、交换数据,最终使得计算效率降低、延迟变大。针对这一情况,Hexagon 780首次实现了将三种不同的AI计算核心合并为一个“融合加速器”,其标量和张量加速计算能力分别比前代提升了50%和100%。同时高通又在这块DSP单元内部加入了大容量的共享内存,使得融合加速器无需访问内存,就能直接在内部完成不同计算任务的数据交换,以大幅降低计算过程中的内存延迟。经过这样的重新设计,骁龙888的DSP单元在执行AI计算任务时,单个应用的可用内存比原来增加了16倍,关键数据的传输效率更是比前代高出了1000倍之多。而这种效率上的极大提升,不仅让原本就很高的算力得到更充分的发挥(表现在跑分上就是73%的算力提升带来了98%的性能增长),更使得整个AI计算体系在执行本地计算时的能效比大增300%,不仅更快,而且还更省电,能持续高性能地运作更长时间了。
如果你是一位对新技术、新产品充满激情与好奇心的发烧友,相信骁龙888今天公布的性能表现就已经足够让你感到兴奋了。因为无论是从哪一款跑分软件、哪一个跑分项目的成绩来看,骁龙888都创造了智能手机行业的新纪录。但如果你是一位更理性的手机玩家、或者更关注实际表现的手游达人,那么骁龙888今天的跑分成绩发布,或许会引发你更深层次的思考。是的,骁龙888的跑分真的很高,高通却并没有刻意地通过极致的电源设定或者强力的冷却系统来刻意“压榨”分数,而是专门强调这是非高性能模式下的跑分结果。是的,骁龙888的性能也真的很强,但这种强却并非通过高主频来实现。事实上,骁龙888的CPU超大核主频“只有”2.84GHz,比很多采用上代老架构的产品都要更低。很显然,如果高通不这样做,那么骁龙888理论上还可能轻松跑出更高的成绩,在宣传层面上更加好看一些。但高通最终选择了“讲实话”,选择了追求更接近真实的使用场景,能真正在游戏、追剧、导航等场景下,长期维持不降频、不缩水的性能表现,作为骁龙888的设计依据。而这种“老实人”的产品设计思路,最终却还能依然实现远远甩开对手的跑分成绩。或许,这才是骁龙888在性能设计上真正的可怕之处。
vivo与蔡司此次的全球影像战略合作,显然并非“贴标”那么简单。
高通方面刚刚推出的骁龙678,也将为4G手机也带来不小的提升。