来源:内容由半导体行业观察(ID:icbank)编译自「wikichip」,谢谢。
半导体行业观察
最有深度的半导体新媒体,实讯、专业、原创、深度,50万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。《摩尔精英》《中国集成电路》共同出品,欢迎订阅摩尔旗下公众号:摩尔精英MooreElite、摩尔芯闻、摩尔芯球
2213篇原创内容
公众号
正如我们的读者所知,我们一直是新颖架构的忠实粉丝。当他们的新 M1000 系列真正的模拟加速器投入生产时,我们不得不重新审视 Mythic 也就不足为奇了。现在。Mythic 已发展到超过 110 名员工,公司在德克萨斯州奥斯汀和加利福尼亚州红木城设有办事处。去年年底,他们推出了他们的第一个 AI 模拟加速器系列——M1000 系列——以及他们的顶级芯片。最近,他们用第二个更通用的芯片扩展了该系列。5 月,Mythic 还宣布在贝莱德和 HPE 牵头的 C 轮融资中筹集了 7000 万美元。这使得该公司迄今为止筹集的总金额为 1.652 亿美元。Mythic 表示,公司获得的新资金旨在加速大规模生产计划,增加客户支持,构建其软件组合,并帮助开发其下一代硬件平台。Mythic 采用了一种非常不同的方法来加速 AI 工作负载。我们将只简要讨论他们的架构,因为我们之前已经更全面地介绍过。如您所知,大部分计算发生在重复的矩阵乘法运算中。它也恰好是内存密集型的,将大量数据移入移出。为了解决这个问题,大多数加速器通常依赖于大量的片上 SRAM。或者,有些人选择依赖外部存储器并通过大量存储器通道以及传统的 DDR4/LPDDR4x 或更宽的存储器总线(如 HBM2e)使用大量存储器带宽。在Mythic方面,他们则使用闪存。单个闪存单元可以存储多个值,因此比等效的 8 位 SRAM 存储器块要密集得多。但在他们的案例中,真正的优势在于他们如何使用闪存。据了解,通过在闪存中存储固定权重并将它们直接用作可变电阻器,Mythic可以利用欧姆定律通过施加一组电压来自然地执行矩阵乘法运算。这使他们不仅可以将权重存储在密集内存中,而且可以在不实际“读取”它们的情况下对这些权重进行操作。将闪存与模拟矩阵乘法运算结合使用,有望在能效和单位成本性能方面实现阶梯函数式改进。Mythic 将他们的神经处理器称为模拟矩阵处理器( Analog Matrix Processors :AMP)。芯片本身采用平铺架构。每个区块内都有 Mythic 模拟计算引擎 (Analog Compute Engine :ACE)、数字 SIMD 矢量引擎、32位 RISC-V 处理器、少量本地 SRAM 和 NoC 路由器。还有许多用于控制和界面的其他杂项tiles。Mythic 于去年 11 月推出的第一款产品是 M1108 AMP。这是一款旗舰产品,也是这一代基于tiles最大配置的芯片。“108”代表该芯片上的 108 个计算tile。还有 4 个控制和接口块,包括 x4 PCIe Gen2 通道。每个 tile 内有 1024×1024 闪存阵列,这意味着每个 tile 有 1 MiB 的内存。对于 M1108,这相当于 108 MiB 的内存。整个封装采用 19×19 mm² BGA 封装,功耗仅为 4 W 左右——仅为竞争对手功耗的一小部分。108 MiB 的权重存储容量很多。即使芯片采用前沿工艺,它也需要大量内存;但在 Mythic 的案例中,他们正在成熟且具有成本效益的 40 纳米 CMOS 上制造芯片。请记住,这些芯片的目标市场是数十亿的边缘设备,例如工业应用(机器视觉、自主无人机等)、视频监控、视觉系统和其他低功耗应用。在这里,模型可以完全安装在片上,无需任何外部存储器。事实上,多个模型通常可以适应该空间。因此,它实际上是一个没有任何外部存储器的单芯片平台,用于典型用例,可以进一步降低 BoM。Mythic 以多种方式提供 M1108 AMP。客户可以自行购买芯片并将其直接集成到他们认为合适的系统中。Mythic 还为想要采取更简单路线的客户提供 PCIe 评估套件和 M.2 卡。将他们的 M1108 与 Nvidia Xavier AGX 进行比较时,Mythic 声称其产品性能卓越,功耗仅为后者10 分之一,同时还能将平台尺寸保持在一小部分(无需昂贵的外部存储器或复杂的电源传输)。但也许最大的区别在于价格,以当前价格计算,价格仅为后者的三十分之一。现在,我们必须小心这种比较,因为它远非平衡。所述Xavier 的SoC装有许多其他功能,诸如一个可编程视觉加速器(PVA) ,立体声和光流引擎,当然,CPU核心和GPU计算。虽然您为这些功能支付了额外费用,但对于 Mythic 所针对的边缘和嵌入式空间,其中大部分并没有被许多客户使用。6 月初,Mythic 推出了该系列的第二款产品——M1076 AMP。正如型号所暗示的那样,这是 M1108 AMP 的进一步缩减版本,只有 76 个tile。该产品可能会比 M1108 便宜,Mythic 认为它也会更受欢迎。此版本背后的基本原理是外形。而原始 M1108 的尺寸为 M.2 M 钥匙卡,物理尺寸为 22 毫米 x 80 毫米。Mythic 表示,在嵌入式领域,人们对更小的 A+E 键变体产生了浓厚的兴趣,它的物理尺寸仅为 22 毫米 x 30 毫米。最初的 M1108 AMP 实在太大了。M1076 支持高达 25 TOPS,并且因为它少了 32 个tile,所以它以更低的功率运行——比 M1108 或 3 W 功率包络低约 1 W。新 M1076 AMP 的一个有趣方面是他们提供并让客户进行试验的新多芯片配置。Mythic 在这里提供最多 16 个 AMP 的 PCIe 卡解决方案。在最大配置下,具有 16 个 AMP 的全卡最大功率约为 75 W,可提供 400 TOPs 的计算能力以及高达 1.1875 GiB 的片上闪存存储,重量接近 13 亿。M1108 和 M1076 以及 M.2 和 PCIe 卡版本均可供客户评估。