神经网络编译器：构建神经网络与芯片沟通的桥梁

2024-08-04 00:35:39

导读

与通用处理器不同，在神经网络芯片的开发模型通常面临一些硬件的限制，例如输入输出数据和权重参数的精度有限，计算规模的限制以及非线性函数的类型的限制。本文引入了一个神经网络编译器，将训练好的、没有约束的的NN模型转换为满足给定硬件约束的等效网络，可以将NN模型的开发与具体硬件解耦合。同时，我们提出了多种技术来使该编译流程能够适应于不同种类的NN芯片，并且编译流程在极端硬件约束下也是可靠的。

本文总字数1416，阅读约5分钟。

作者简介

季宇，计算机科学与技术系15级博士生，师从张悠慧教授，研究方向为类脑计算与体系结构。

1.主要问题

为了弥合NN模型开发的灵活性需求和NN芯片的精简、高性能需求之间的差异，我们可以将整个系统栈通过软件编程模型和硬件执行模型分层。其中，将软件编程模型转换为近似等效的硬件执行模型，主要遵循以下几个步骤：

[图片来源：参考文献]

图1 转化流程图，分为图重构和图微调两个步骤，图微调包含了三个子步骤来解决不同类型的硬件约束，其中权重微调又包含了三个阶段来适应不同类型的权重约束。

以下是转换的一个例子：

图2 转化实例 [图片来源：参考文献]

构建计算图，如图2（a）所示。基于输入的NN信息构建G =（V，E），NN信息包括训练后的参数、网络拓扑、顶点信息和训练数据。此外，还可以获得深度学习框架支持的操作集F。

图重构，如图2（b）。它构造了一个中间CG，Gˆ =（Vˆ，Eˆ）。相应的操作集Fˆ包含所有类似核心算子（乘加与非线性激活）的操作。这些操作与核心算子具有类似的形式，或者可以由核心算子轻松实现，但不包含这些硬件约束。

图微调，如图2（c）所示。我们进一步将Gˆ转换为G。每个顶点vˆ ∈Vˆ以Gˆ的拓扑顺序遍历，并在G中形成对应的顶点。该过程还包含如下子步骤：数据重编码、完全展开、权重微调。其中数据重编码可以通过自编码器以增大模型规模来提高模型冗余，从而保障在极端硬件约束下的准确率。

2.实验结果

我们测试了不同硬件约束下该方法的效果，其精确度如表1所示：

表1 各种神经网络模型参数[图片来源：参考文献]

2.1精度与微调粒度

权重微调可以以不同的粒度进行，通过实验探索准确性和微调粒度之间的关系，我们发现：逐层微调即可有效解决误差累积的问题。

2.2准确性与资源消耗

我们通过实验评估了数据重编码的效果，下图分别列示具有不同输入输出与权重转换前后的精度。结果表明，在极端约束下，该数据重编码策略可有效提高转换精度。

图3 不同转换策略下的精度比较 [图片来源：参考文献]

2.3权重编码方法的影响

我们评估了权重调整算法以及三种权重编码策略，下图结果显示了权重调整可以在以下三种情况下很好地设置权重参数：随着权重精度的提高（未引入任何其他约束），所有这些参数都可以达到上限精度。

图4 不同权重编码策略下的精确度和权重比较

[图片来源：参考文献]

接着，进一步给出了权重调整步骤的每个阶段效果（权重精度为2位，没有任何其他限制），如下表所示：

表2 权重调整效果

[图片来源：参考文献]

3.主要结论

我们提出了一种针对NN芯片的编译器解决方案，该方案可以将训练好的NN模型转换为满足硬件约束的等效模型，并提出了多种技术来减少转换误差和提高处理速度。评估表明，该转换方法非常有效，引入的误差可以忽略不计，编译转换耗费的时间也重新训练时间要快。

参考文献

【参考文献】

[1] Ji, Yu et al. “Bridge the Gap between Neural Networks and Neuromorphic Hardware with a Neural Network Compiler.” Proceedings of the Twenty-Third International Conference on Architectural Support for Programming Languages and Operating Systems (2018): n. pag.

文稿｜季　宇

排版｜于亿航

编辑｜寇方铖张宇轩

审核｜张可人

学术︱基于PSO-SNN的电动汽车充电站短期负荷预测模型研究

各位读者,中国电工技术学会定于2016年7月3~4日在北京铁道大厦举办"2016第十一届中国电工装备创新与发展论坛",主题为"电工行业十三五规划研究与解读".请 ...
新思路！商汤开源利用无标注数据大幅提高精度的人脸识别算法

人脸识别是最近几年计算机视觉领域取得长足进步的领域,这得益于不断进步的深度学习强大的模型拟合能力和有标注的大型数据集的建立,已经出现了用于人脸识别的有标注的百万量级的数据集. 但继续扩大规模数据集变得 ...
Hinton：我终于想明白大脑怎么工作了！神经学家花三十年，寻找反向传播的生物机制

作者:Anil Ananthaswamy 编译:梦佳「有一天晚上,我回家吃饭,激动地说『我终于想明白大脑是怎么工作的了!』我15岁的女儿对我说,怎么又来了,老爸.」 ...
想要训练人工智能？一台小小的4位计算机就够了

深度学习是一种低效的能源消耗.它需要海量的数据和丰富的计算资源,这导致了其耗电量呈爆炸性增长.在过去的几年里,该领域的整体研究趋势使这一问题愈加严重.庞大的比例模型需要对数十亿数据点进行许多天的训练, ...
基于博弈论赋权的光伏功率组合预测模型

许继电气股份有限公司的研究人员李贞.崔丽艳.陶颍军.邱俊宏.陈斌,在2017年第5期<电气技术>杂志上撰文,针对单一预测方法的局限性,采用物理方法和统计方法相结合的组合预测方法,建立光伏发 ...
【AutoML】强化学习如何用于模型量化？

大家好,欢迎来到专栏<AutoML>,在这个专栏中我们会讲述AutoML技术在深度学习中的应用,这一期讲述在模型量化中的应用. 作者&编辑 | 言有三上一期给大家介绍了AutoM ...
如何压缩模型大小，使得深度学习在廉价的嵌入式设备中工作

要理解我们如何缩小模型,就要先理解模型文件如何被压缩.如下图所示,一个常见的 DNN 模型由神经元和它们之间的连接构成,模型的大小主要就是由这些 weights 构成.一个简单的 CNN 都有上百万的 ...
登上更高峰！颜水成、程明明团队开源ViP，引入三维信息编码机制，无需卷积与注意力

作者丨Happy 审稿丨邓富城编辑丨极市平台极市导读本文从位置信息编码出发,引入了高-宽-通道三维信息编码机制.为进一步校正不同分支的作用,提出了加权融合方式.ViP在ImageNet上取得了8 ...
【神经网络】综合篇——人工神经网络、卷积神经网络、循环神经网络、生成对抗网络

前言本文综合整理常用的神经网络,包括生物神经网络.人工神经网络.卷积神经网络.循环神经网络.生成对抗网络:参考了许多高校的课程.论文.博客和视频等.文章的结构是先进行概念了解,然后结合图片.结构图. ...
2021中国医药创新生态大会:8月齐聚博鳌，构建创新生态主体沟通合作、价值交互平台！

2021年8月21-23日,2021中国医药创新生态大会CPIE(China Pharmaceutical Innovation Ecological conference,缩写CPIE)将在海南博鳌 ...
神经网络：递归神经网络的兴起

在本文中,我们将讨论深度学习中递归神经网络的基础.递归神经网络的兴起是为了克服我们在神经网络和卷积神经网络中看到的局限性. 涉及的主题: 神经网络和卷积神经网络的局限性 RNN的体系结构介绍 RNN的 ...
【教师随笔】架起沟通的桥梁构建美丽人生

当清晨第一缕阳光照射进教室,伴随着朗朗的阅读声,崭新的.充满希望的一天又开始了! 听,那一声声清脆悦耳的声音,时而高亢,时而低缓,那是阳光语言矫正培训学校的老师们在尽心尽力的辅导学员. ...
日记，心与心沟通的桥梁

周末布置了两篇日记,其中一篇是<我们学校变样了>.昨天批改周末的日记,看到薛兵的日记:"--上个学期,校长就吵吵着要盖楼--""吵吵着",这词儿也能 ...
人与人交往，沟通是桥梁

人与人交往,沟通是桥梁感悟人生精选2021-04-17 16:51:08 人与人交往,沟通是桥梁人与人交往,沟通是桥梁人与人交往,沟通是桥梁
早读｜肺癌术后随访，医患沟通的桥梁！

肺癌是发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤之一.近50年来许多国家都报道肺癌的发病率和死亡率均明显增高,男性肺癌发病率和死亡率均占所有恶性肿瘤的第一位,女性发病率占第二位,死亡率 ...
张德芬：和孩子架起沟通的桥梁

张德芬：和孩子架起沟通的桥梁
小小便签，架起师生沟通的桥梁

「您在教育上有任何问题,欢迎留言」点上方蓝标即可关注我们的公众号 ▽▽▽ 告读者本人才疏学浅,阴差阳错,成了一名教书匠.做一辈子班主任,成了我难登大雅的梦想.承蒙大家厚爱,粗糙的文字得到了近5万关 ...

神经网络编译器：构建神经网络与芯片沟通的桥梁

相关推荐