苹果A14裸片详细分析

前几天在“苹果A14处理器裸片(Die)显微分析:未达到台积电宣称的晶体管密度”这篇文章中我们已经看到了A14 芯片的裸片显微照片,不过并没有在照片上划分出各个功能快。

今天SemiAnalysis和SkyJuice联手进一步对A14芯片裸片的电子显微照片做了详细的功能块分析。

A14裸片电子显微照片及功能块划分:

苹果公司的A14由2个Firestorm内核,4个Icestorm小内核和4个GPU组成。
此核心配置与A13相似,因此CPU和GPU的所有性能提升都直接取决于体系结构的变化和时钟p频率的提升。A14的Icestorm小核心已经进行了大的修改,L1i cache从A13的Thunder核心的96KB扩展到了128KB。L1d也从48KB增长到64KB。NPU已经翻倍,达到16核,而A13中只有8核。使用上面的注释,我们还可以估算每个IP块的大小。
不出所料,尽管架构发生了变化,但大多数IP块都缩小了不少。NPU由于核心数量翻倍而变大。由于进行了较大的架构改造,Icestorm核心并未缩小。不出所料,LPDDR4x PHY并未缩小。此外A14的系统级缓存依然未16MB,与去年的A13相同。

由于系统级缓存主要由SRAM单元组成,架构上的变化应该不会使面积对比有太大偏差。尽管台积电宣称SRAM从N7到N5缩小了1.35倍,但Apple的16MB系统缓存仅缩小了1.19倍。A14缓存的形状有所不同,与A13相比更窄、更长。考虑到这种长宽比的变化,这个缓存的运行方式可能会重新设计。

从16MB LLC的面积减少乏力中得出的主要结论,对于业界来说意义深远。苹果并不是唯一一家依靠增加内存容量来提供巨大性能和功耗优势的公司。

AMD、英特尔、Nvidia以及Graphcore等各种人工智能初创公司也都把增加最后一级缓存大小作为辅助,帮助它们在CPU、GPU和AI专用芯片上获得架构上的优势。为了解决DRAM的延迟而在芯片内部集成越来越大的缓存的时代已经过去,台积电的N5只带来了1.35x的理论SRAM缩减,而未来的N3则更是只有微不足道的1.2x。正如在前一篇文章中所讨论的,3D集成将为我们带来更多的活力,但是架构师在如何提高性能和性能方面需要更加聪明和更积极。

两种潜在的途径是转向更复杂/更高效的缓存设计,或者引入替代性的存储器,如NRAM、FeRAM或MRAM。随着晶体管成本的上升和SRAM难以进一步缩小,摩尔定律正在慢慢失效。

原文:https://semianalysis.com/apple-a14-die-annotation-and-analysis-terrifying-implications-for-the-industry/




欢迎加星标

(0)

相关推荐