拥有1000个RISC-V内核的人工智能加速器芯片

人工智能 (AI) 的兴起开启了一个全新的计算时代,一个并行性为王的时代。最初,图形处理单元(GPU) 是这些应用程序的主要处理单元;然而,即使 GPU 也可能过于通用,无法为 ML 特定任务挤出最大性能和能效。

随着对人工智能和数据中心处理的需求不断上升,一些新的人工智能加速器已经应用而生,站出来迎接挑战。一个例子是国外初创公司Esperanto,它最近通过其新的基于RISC-V 的 1000 个内核的加速器来改变了这一领域。据称该加速器的性能优于很多强大的对手。

经过多年的发展,Esperanto公司已经宣布了其ET-SoC-1 ML推理芯片。

Esperanto的ET-SoC-1芯片
对人工智能专用芯片的需求,那些能够提供大规模并行性和ML定制工作流程以及最佳功耗的芯片,导致了许多初创公司的出现。其中一个例子是Esperanto,它最近以其新的基于RISC-V的1000核加速器撼动了这个领域。

本文将讨论关于这个新的SoC的已知信息,并了解它如何与竞争对手抗衡。

Esperanto的新芯片内核

在今年的Hot Chips 33大会上,主要头条新闻之一来自总部位于加利福尼亚的 Esperanto 公司及其新的 AI 加速器。

这款新芯片ET-SoC-1专为数据中心推理而打造,可提供高水平的并行性,同时提供最大的能效。为此,新芯片在其基于台积电 7nm 工艺构建的 SoC上集成了 1000 多个 RISC-V 内核、160M BYTE的 SRAM 和超过 240 亿个晶体管。该 SoC 的内核是基于 RISC-V ISA 设计的:ET-Minion和 ET-Maxion。

ET-SoC-1 芯片图

ET-Minion 是一个通用的 64 位有序内核,具有机器学习的专有扩展,包括对每个时钟周期高达 256 位浮点数的向量和张量运算。新的 SoC 具有1088 个这样的内核。

ET-Minion 核心的架构 

ET-Maxion 是该公司专有的高性能 64 位单线程内核,具有四发射乱序执行、分支预测和预取算法。该SoC具有4个这样的内核,由一个完全一致性的高速缓存(coherent cache)捆绑。

了解了核心技术后,让我们深入研究一下这个 AI 解决方案的性能。

ET-SoC-1 的性能

在性能方面,Esperanto旨在达到计算和能源效率之间的最佳平衡点。

SoC 的每瓦性能因各种软件控制的设置而异,包括时钟频率;然而,该公司声称其最佳性能来自 1GHz 速度。在 ~0.4V 和 1 GHz 设定点下运行时,据报道该芯片在 20 瓦以下的功率下可运行 100 至 200 TOPS,或每瓦约 10 TOPS。

Esperanto 的基准测试表明它比竞争对手具有更好的性能和能耗效率

在一项基准测试中,Esperanto发现,一个6芯片、6000核心的加速器卡设置在运行MLPerf深度学习推荐模型时击败了竞争对手。根据这项基准测试,其加速卡的相对性能和每瓦特性能比同类采用英特尔至强、英伟达T4和英伟达A10具有更好的相对性能和每瓦性能。

虽然基准测试有时会产生误导,但该公司确实相信其 SoC 可以胜过许多最接近的竞争对手。

下一步怎么做?

Esperanto专门为低功耗数据中心应用打造了这款SoC,甚至更专门为面向广告的推荐性ML工作负载打造,比如社交媒体公司使用的那些。即使考虑到这一点,Esperanto也旨在将其芯片设计成通用的,设计师可以使用六片加速器卡(6000多个内核)来解决它所面临的大多数任务。

如果它的芯片性能真的像该公司声称的那样好,那么在不久的将来,它似乎有可能在数据中心找到自己的位置,用于ML和通用任务。

原文:

https://www.allaboutcircuits.com/news/ai-accelerator-chip-with-1000-risc-v-cores-shakes-up-data-center-inference/


关注创芯人才网,搜索职位

关注创芯大讲堂,祝您IC技能更上一层楼!

我就知道你“在看”
(0)

相关推荐