如何压缩模型大小，使得深度学习在廉价的嵌入式设备中工作

2024-04-28 01:19:40

要理解我们如何缩小模型，就要先理解模型文件如何被压缩。如下图所示，一个常见的 DNN 模型由神经元和它们之间的连接构成，模型的大小主要就是由这些 weights 构成。一个简单的 CNN 都有上百万的参数，我们知道训练的时候，它们的 dtype 都是 float 32，一个 float 32 占4个字节，上百万的参数往往就占据几十兆的空间大小。几十兆的模型？我们可能觉得这已经很小了，但是一个微型处理器就只有 256 Kb 的随机存储器。

为了把模型缩小到可以塞到这么小的处理器中，有以下几个框架：

AIMET from Qualcomm
TensorFlow Lite from Google
CoreML from Apple
PyTorch Mobile from Facebook

tensorflow 提供一个 python 库 tensorflow_model_optimization，这个库优化模型的延迟，大小。直观上，优化模型大小，一个就是优化参数的数量，另一个就是优化每个参数的大小。主要的方式就是以下几种。

Compression or Distillation

模型训练完成后，如何在准确率可接受的情况下压缩模型，最常见的方式就是剪枝和蒸馏。

剪枝-删除对输出影响较低或者可能会引起过拟合的weights，再剪枝后稀疏的神经网络需要重新被训练。蒸馏炼丹师都比较熟悉了，用小模型去学习打模型即可。

Quantisation

该方法用低精度的参数去学习一个同样效果的模型，这种方式提升了模型的处理能力和效率。这种方法主要是把 float 压缩到 int 8 上，如下图所示：

Quantisation Aware Training（QAT）这个方式是在模型训练过程中使用量化，如下图所示，该方法会带来噪声也会影响 loss，所以学到的模型更加鲁棒。

Post-Training Quantisation (PTQ) 该方法不用重训练模型，直接把float32量化到int8，这样直接把模型大小降低了4倍，预估性能也提升了两倍，精度也没有显著下降。

weight clustering 使用权重聚类/共享，降低了存储参数的数量，该方法把一层的参数聚成N个类，并共享索引，举例来说，如果我们把一层聚成8个类，每个参数都会只占 3bit（2^3 = 8）。从实验我们可以看到，使用该方法可以降低模型大小6倍，仅仅降低了0。6%的准确率。我们还可以通过 fine-tune 聚类的中心点，来提升模型精度。

Encoding

通过使用霍夫曼编码对模型进行压缩，使用01编码 weights，把最常出现的权重用较少的 bit 去编码，如下图所示，我们有已经被量化的权重矩阵:

每个权重占5bit(0~31)，如果使用霍夫曼编码，我们就会得到下面这颗树:

17会被编码成11，22编码为001，可以看到权重通过编码显著被压缩。

Compilation

剩下的就是工程上的优化了，如使用C++，相较于python更快更省内存。

参考文献

1.https://github.com/quic/aimet

2.https://www.tensorflow.org/lite

3.https://developer.apple.com/documentation/coreml

4.https://pytorch.org/mobile/home/

5.https://medium.com/marionete/tinyml-models-whats-happening-behind-the-scenes-5e61d1555be9

谷歌发布AdaNet，快速灵活的AutoML工具，帮助开发者构筑强大集成学习模型

集成学习可以有效利用不同机器学习算法,提高最终模型精确度,在Kaggle比赛中被广泛应用. 训练集成学习模型计算量浩大,参数众多,虽然随着GPU/TPU的出现一定程度上降低了问题的难度,但对开发者仍是 ...
【深度学习】收藏｜神经网络调试Checklist

前言作为一名每天与神经网络训练/测试打交道的同学,是否经常会遇到以下这几个问题,时常怀疑人生: 怎么肥事,训练正常着呢,咋效果这么差呢? 嗯..再等等是不是loss就更低了.啊?明明loss更低了呀 ...
高效深度学习：让模型更小、更快、更好！

自从 AlexNet 在 ImageNet 上大放异彩后,图像就进入了预训练时代,随后 VGGNet,Inception,ResNet 不断取得新的 SOTA,不过同时模型也越来越大.自然语言领域要从 ...
程序员门槛再被“神器”降低：只要会英文，就能写代码！

近日,OpenAI带着他们最新.最神自动编码神器Codex霸榜各大科技媒体头条,我们知道OpenAI是微软投资的通用人工智能平台,而GitHub是微软旗下的代码托管平台,这样微软出算力.OpenAI出 ...
OpenCV开发笔记（七十二）：红胖子8分钟带你使用opencv dnn tensorFlow识别物...

若该文为原创文章,转载请注明原文出处本文章博客地址:https://blog.csdn.net/qq21497936/article/details/109194717 各位读者,知识无穷而人力有穷 ...
当成像模型遇上深度学习！这名北大青年学者想突破“拍摄的极限”

本文转载自:AI科技评论作者 | 黄善清编辑 | 青暮 "除了专业人士,现在会背单反出外拍照的人已经越来越少了,其中最主要的原因是手机上的相机越来越好用了,这与计算摄像学的发展有一定关系 ...
【模型解读】深度学习网络只能有一个输入吗

继续我们之前的专栏<模型解读>,今天说多输入网络,很久没写了因为实在是有更重要的事情. 平常我们所见的深度学习模型,都是输入一个图像或者视频序列,输出分类,分割,目标检测等结果,但是还有一 ...
当成像模型遇上深度学习，这名北大青年学者想突破“拍摄的极限”

"除了专业人士,现在会背单反出外拍照的人已经越来越少了,其中最主要的原因是手机上的相机越来越好用了,这与计算摄像学的发展有一定关系." 无可否认,无论是苹果还是华为手机,如今相机性 ...
文/陈根机器学习是人工智能的一个重要分支，而深度学习则是机器学习发展到一定阶段的必然产物。深度学习就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接一起，形成神经网络“大脑”进行精准复

文/陈根机器学习是人工智能的一个重要分支,而深度学习则是机器学习发展到一定阶段的必然产物. 深度学习就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络"大脑 ...
【阿里云课程】深度学习在自然语言处理与推荐系统中的研究方向与典型应用

大家好,继续更新有三AI与阿里天池联合推出的深度学习系列课程,本次更新内容为第3课中的两节,介绍如下: 第1节:自然语言处理第1节课内容为:深度学习在自然语言处理中的应用与研究方向,包括文本分类与聚 ...
深度学习在图像超分辨率重建中的应用

超分辨率技术(Super-Resolution)是指从观测到的低分辨率图像重建出相应的高分辨率图像,在监控设备.卫星图像和医学影像等领域都有重要的应用价值.SR可分为两类:从多张低分辨率图像重建出高分 ...
真正落实深度学习，必须在课堂教学中做好五件事

本文共5865字,仔细阅读需15分钟深度学习到底深在哪儿? 近期,深度学习的热度较高,但在这个过程中我却比较忐忑,因为当深度学习逐渐发展成一种"运动"后,就存在走偏的危险. 其实 ...
详解NLP中的预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文...

NLP近几年非常火,且发展特别快.像BERT.GPT-3.图神经网络.知识图谱等技术应运而生. 我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准 ...
一个小问题：深度学习模型如何处理大小可变的输入

对于大小可变的输入,深度学习模型如何处理? 前几天在学习花书的时候,和小伙伴们讨论了"CNN如何处理可变大小的输入"这个问题.进一步引申到"对于大小可变的输入,深度学习模 ...

如何压缩模型大小，使得深度学习在廉价的嵌入式设备中工作

相关推荐