英伟达首度承认“黄氏定律”,它会是摩尔定律之后的扛旗者吗?

在媒体层面传播几年后,“黄氏定律”这一命名终于被英伟达官方认可。

作者 | 来自镁客星球的韩璐

摩尔定律会失效吗?

除了Intel一直不肯承认外,想必其他厂商的答案都是“肯定”的。

在这一事实的前提下,他们更多的考虑的问题是:摩尔定律失效后,该如何进一步提高处理器的能效?针对这个问题,一些公司已经找到了自己的答案,比如英伟达。

过去几年来,黄仁勋一直对外表达“摩尔定律已死、新定律正在形成”,尤其是在GPU方面,更是预测每10年GPU性能增长1000倍,这一预测也被戏称为“黄氏定律”。

值得注意的是,就在正在举办的GTC 2020中国线上大会上,“黄氏定律”正式被官方敲章——官方活动上,英伟达首席科学家兼研究院副总裁Bill Dally亲口说出“黄氏定律”。

图 | 英伟达首席科学家兼研究院副总裁Bill Dally

什么是黄氏定律?

聊黄氏定律之前,我们先了解一下被预测即将失效或“已死”的摩尔定律。

摩尔定律由Intel创始人之一的戈登·摩尔提出,预测集成电路上可以容纳的晶体管数目大约每经过24个月就会增加一倍。

之后,Intel前CEO大卫·豪斯更新了另外一版说法,即每18个月芯片性能将提高一倍。

现在,以性能提升一倍为目标,黄仁勋也带来了自己的答案——1年。没错,在黄仁勋认为,基于GPU的一倍性能提升只需要1年的时间,这个速度比摩尔定律至少快1.5倍。

当然,任何一个论点的成立没有事实依据来支撑必然是脆弱的,为此Bill Dally在线上演讲过程中直接以英伟达GPU产品为例,证明芯片产品性能的提升核心并不是制程工艺。

具体来看,Bill Dally带来了一张图标,其中展示了从2012年的Kepler,一直到今年5月份的Ampere A100等多款GPU产品的性能增长趋势图:

8年时间,单芯片推理性能提高了317倍。“实际上,我们的推理性能每年都要增加一倍以上,部分原因在于Tensor Core的改进、更优化的电路设计和架构,制程技术所发挥的作用不大。”Bill Dally表示。

他解释称,自2012年到2020年,英伟达在GPU产品养发上仅使用了3代制程工艺,分别是最开始Kepler架构使用的28nm、中间时期采用的16nm,以及最近Ampere架构使用的7nm。

其中Bill Dally指出,在“317倍”这一成果中,制程工艺整体上发挥的作用不到2成,主要功臣是“架构的改进”。

“在摩尔定律消失之后,我们还有‘黄氏定律’来不断提高计算性能,因为我们未来需要利用更高的计算性能来完成许多工作。”

众所周知,摩尔定律的关键是基于先进工艺在特定体积内放入更多的晶体管,还是容易理解的。至于黄氏定律的“架构改进”,具体怎么实现?针对这个问题,Bill Dally也在演讲中做出了解答。

如何实现黄氏定律?

针对这个问题,Bill Dally在演讲中用了三个项目进行解答。

首先是为了实现超高能效加速器的MAGNet工具。英伟达称,MAGNet生成的AI推理加速器在模拟测试中,能够达到每瓦 100 tera ops 的推理能力,比目前的商用芯片高出一个数量级。

之所以能够达到这样的成效,是因为MAGNet采用了一系列新技术来协调并控制通过设备的信息流,最大限度地减少数据传输,毕竟数据传输正是当今芯片中最耗能的环节。整个过程中,这一研究原型均以模组化实现,因此能够灵活扩展。

第二个项目的目标则是为了以更快速的光链路取代现有系统内的电器链路。Bill Dally表示:“我们可以将连接GPU的NVLink速度提高一倍,也许还会再翻番,但电子信号最终会消耗殆尽。”

目前,由Bill Dally带领的200人团队正在与哥伦比亚大学的研究人员密切合作,探讨如何利用电信供应商在其核心网络中所采用的技术,通过一条光纤来传输数十路信号。

据了解,这种名为“密集波分复用”的技术, 有望在仅一毫米大小的芯片上实现Tb/s级数据的传输,是如今互连密度的十倍以上。

值得注意的是,除了更大的吞吐量,光链路也有助于打造更为密集型的系统。针对这一点,Bill Dally举例展示了一个未来将搭载160多个GPU的NVIDIA DGX系统模型。

图 | 搭载160多个GPU的NVIDIA DGX系统模型

想要发挥光链路的全部潜能,还需要相应的软件,这也是Bill Dally分享的第三个项目——全新编程系统原型Legate。

Legate将一种新的编程速记融入了加速软件库和高级运行时环境Legion,借助Legate,开发者可在任何规模的系统上运行针对单一GPU编写的程序——甚至适用于诸如 Selene等搭载数千个GPU的巨型超级计算机。

目前,Legate正在美国国家实验室接受测试。

黄氏定律存在“天花板”吗?

一个定律的成立与延续,必然不是一家企业单打独斗能够做到的,需要更多上下游的合作伙伴一起来激发新需求和推进创新落地。

这方面,英伟达也正以GPU产品为中心,搭建自己的AI生态圈。以英伟达初创加速计划为例,在4年时间内,加入该计划的企业已经超过了7000家,遍布全球92个国家,其中仅在中国,得到英伟达扶持的企业就已经超过了800家。

在Bill Dally的演讲中,我们也见到了国内12家代表性AI创企的展示,其中包括自动驾驶明星创企图森未来、文远知行、卫星图像数据分析公司大地量子等等。

以图森未来为例,早在此前的一次采访中,他们就曾对外表示,采用英伟达AI芯片的系统,效能每年都增加一倍。站在落地商用的角度,从企业所表述的情况来看,“黄氏定律”显然正发挥作用、成为现实。

当然,参考当前摩尔定律正在失效的情况,人们也不可避免的开始担忧,黄氏定律也会有失效的一天吗?

不同于制程工艺的肉眼可见,架构的改进相对来讲是较为虚化的。针对这个问题,曾有人给出了一个“10年内”的可能答案。对于这个答案的准确与否,我们也不过多评判,不管“天花板”存在与否,我们目前可以确定的是,从过去8年的表现来判断,在未来一段十日内,黄氏定律仍然会继续发挥它“性能一年翻一倍”的优势,这一定律带来的最终成果还是很值得期待的。

(0)

相关推荐

  • 超越摩尔定律,NVIDIA再提黄氏定律:每10年GPU性能增长1000倍

    尽管英特尔口头上不承认摩尔定律失效,但现实就是摩尔定律已经不像之前那样有效了.没了摩尔定律,芯片行业该用什么来衡量变化趋势呢?NVIDIA联合创始人.CEO黄仁勋日前在欧洲GTC大会上再一次分享了他的 ...

  • 英伟达推出ARM架构CPU,意图何在?

    ⬆︎ 点蓝字关注 全球风口 丨 你的全球科技前哨侦察兵 你好,我是王煜全,这里是王煜全要闻评论. 4月13日,英伟达创始人黄仁勋在GTC2021,发布了三款基于ARM架构的处理器.尽管英伟达收购ARM ...

  • 2021 年将是“人工智能硬件年”

    在本文中,我将讨论专为机器学习 / 人工智能应用开发的硬件,以及该领域的机遇.并简要介绍英伟达是如何在机器学习硬件领域实现近乎垄断的地位,以及为什么几乎没有人能成功挑战它. 在过去的 10 年中,专用 ...

  • ​GPU越做越大,快到极限了怎么办?

    作者:黄烨锋 EET电子工程专辑原创 消费用户市场,普通用户都能用上16核甚至64核处理器的PC.这可不是单纯堆核心就完事儿的.以当前CPU核心的规模,和可接受的成本,消费电子设备上一颗芯片就达到这种 ...

  • 老黄发力CPU,剑指英特尔和AMD?

    雷科技数码3C组 编辑丨一位天明 在AMD Ryzen系列处理器发布前,我们AMD用户总是说「AMD造显卡比英特尔强,造CPU比英伟达强」.但很多人不知道的是,其实NVIDIA还真的有CPU业务,而且 ...

  • “黄氏定律”将成为GPU性能的全新指标:AI性能将逐年翻倍

    就在昨天,NVIDIA GTC 2020中国线上大会正式拉开序幕,NVIDIA研究院负责人Bill Dally了分享关于AI.计算机图形学.HPC.医疗.边缘计算.自动化机器和GPU集群加速等领域最新 ...

  • 为AI而生的IPU芯片,或挑战GPU的霸主位?

    在CPU芯片领域,延续至今的"摩尔定律"正在随着制程工艺逼近物理极限而有了延缓的趋势,甚至失效的可能.就在摩尔定律的增长放缓脚步的同时,半导体芯片的计算也正在从通用走向专用,其中A ...

  • 重启自研架构,三星和高通对ARM投下“不信任票”

    早几年前,当我们说起智能手机上的自研CPU架构时,除了苹果,大家还会提到高通和三星.毕竟在那个时候,高通基于Krait架构的骁龙600.骁龙800虽然已经老去,但口碑却依然优秀:更不要说三星靠着自研的 ...

  • 英伟达「黄氏定律」让未来的AI算力每年能够提升一倍

    今年的 GTC China 黄仁勋没有露面,但黄式定律无处不在. 从翻倍提高 TensorCore 计算效能的新技术,到下一代光通信技术,再到一行代码为所有模型提供 GPU 加速的软件工具,为了让未来 ...

  • 大人,时代变了!英伟达推出ARM架构CPU,性能10倍领先

    今天(4月13日)凌晨,NVIDIA创始人黄仁勋在GTC2021重磅发布了三款基于Arm IP打造的处理器--NVIDIA Grace.BlueField-3 DPU.NVIDIA DRIVE Atl ...