6小时vs数个月:谷歌用AI设计芯片,速度远超人类工程师

谷歌的人工智能团队展示了一种新的模型,可以将芯片设计核心的复杂流程自动化,为工程师们节省数以月计的工作量。
来源丨ZDNet
编译丨科技行者

来自谷歌的一个研究团队公布了一种新的人工智能模型,该模型可以在短短的几个小时之内完成复杂的芯片设计——这是一项繁重而复杂的工作,人类工程师们通常需要花费好几个月的时间才能够完成。

研究人员们使用一个包含了10,000 个芯片布局的数据集来训练机器学习模型,该模型用强化学习的方式进行训练。结果是,该模型可以在短短的六个小时之内就完成芯片上不同组件布局的优化设计,从而创建能够满足处理速度和能耗效率等操作要求的最终布局。

这种方法非常成功,以至于谷歌已经将该模型用在了该公司下一代张量处理单元(tensor processing units ,TPU)的设计中,这些TPU运行在谷歌的各大数据中心之中,以提高各种人工智能应用程序的性能。

Google Brain的研究科学家Anna Goldie参与了此项研究工作,并在推文中表示:“我们的强化学习(RL)代理在短短的几个小时之内就能够生成芯片布局,而人类的专家们要想完成这项工作,得要花上几个月的时间……这些超人式的人工智能设计的芯片布局被用在了谷歌最新的人工智能加速器上(TPU-v5)!”

现代芯片包含了数十亿个不同的组件,这些组件被布置在一块指甲盖大小的硅片上,并且彼此连接。例如,一块处理器通常会包含数千万个逻辑门(也被称为标准单元)和数千个存储块(也被称为宏块)——而且它们必须被连接在一起。

标准单元和宏块在芯片上的布局对于决定信号在芯片上的传输速度以及终端设备的效率至关重要。

这就是为什么工程师们的大部分工作都集中在优化芯片布局之上的原因。这部分工作从安置较大的宏块开始,这个过程被称为“布局规划”,其中包括为组件确定最佳配置,同时还要考虑为标准单元和布线留出足够的剩余空间。

宏块布局方式的数量是巨大的:根据谷歌研究人员的说法,可能有10的2500次方种不同的配置方式需要测试——也就是说,在1的后面,跟着2500个零。

更重要的是,一旦工程师提出了一种布局,在添加标准单元和布线的时候,他们很有可能还不得不对设计进行调整和修改。每一次迭代可能都要花费好几周的时间。

鉴于布局规划的工作异常复杂而且非常艰巨,整个过程似乎非常适合进行自动化。然而,在过去几十年中,研究人员一直没有能够开发出一种技术来减轻工程师们在这项工作上的负担。

芯片设计人员可以依靠计算机软件来协助他们完成任务,但仍然需要好几个月的时间才能确定如何最好地在设备上组装组件。

而且,这项挑战只会变得越来越困难。大家经常提到的摩尔定律预测,芯片上晶体管的数量每年都会翻一番——这意味着工程师们面临着一个复杂程度随着时间呈指数级别增长的工作,而且,与此同时,他们还必须赶上紧迫的时间进度要求。

这就是为什么说谷歌公司在自动化布局规划方面取得如此显而易见的成功可能会改变游戏规则的原因了。脸书的首席人工智能科学家Yann LeCun 在推特上表示:“谷歌在利用深度强化学习优化芯片布局方面做得非常出色。” Yann LeCun祝贺谷歌的团队攻克了“40年来”一直存在的难题。

谷歌新的人工智能模型可谓生逢其时:半导体行业目前出现了全球性的芯片短缺,从消费电子到汽车行业在内的多个行业都受到了芯片短缺的影响。

虽然芯片的短缺是由于制造端能力不足而不是半导体设计造成的,但是减少发明下一代芯片所需要的时间仍然可以为整个供应链带来帮助。

科学期刊《自然》对这种新方法表示欢迎。他们表示:“谷歌的研究人员已经设法大大减少了设计微芯片所需的时间。”他们认为,“这是一项重要的成就,将极大地帮助供应链提速。”

尽管这款机器学习模型可能会影响整个行业,但是谷歌自己对这项技术的应用状况仍然值得关注。

长久以来,这家搜索巨头一直明明白白地表示着自己的野心——希望在内部创建定制处理器,特别是以片上系统(SoC)的形式。

(0)

相关推荐