【每周CV论文推荐】初学高效率CNN模型设计应该读的文章

2024-08-02 13:03:54

欢迎来到《每周CV论文推荐》。在这个专栏里，还是本着有三AI一贯的原则，专注于让大家能够系统性完成学习，所以我们推荐的文章也必定是同一主题的。

高效率(紧凑)的CNN模型设计是深度学习在工业界落地的关键，今天给大家推荐初学者必读的一些文章。

作者&编辑 | 言有三

1 小卷积的使用

VGG很大，但它使用的卷积很小。在保证具有同样大小的输出和感受野的前提下，任何奇数的大卷积都可以使用多个3*3卷积来替代，

两个3*3的卷积能代替一个5*5的卷积；参数比例为3×3×2/(5×5)=0.72。三个3*3的卷积能代替一个7*7的卷积，参数比例为3×3×3/(7×7)=0.55，将近一倍的压缩，简单而有效。虽然VGG不是小卷积的初次实践者，但从它开始了解是很好的起点。

文章引用量：60000+

推荐指数：✦✦✦✦✦

[1] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[J]. arXiv preprint arXiv:1409.1556, 2014.

2 1*1卷积

1*1卷积就是将普通卷积核半径变为1的卷积，影响了之后几乎所有的模型，将这个1×1的特殊卷积用于通道的降维和升维，已经成为很多紧凑模型设计不可缺少的组件，毕竟模型的宽度(通道数)对计算量和参数量的贡献巨大。

文章引用量：4000+

推荐指数：✦✦✦✦✦

[2] Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv:1312.4400, 2013.

3 Inception/SqueezeNet

在VGG网络不能再通过加深得到进一步性能突破的时候，Inception[3]模型(又名GoogLeNet)使用了拥有不同感受野并行的多分支Inception结构，进一步加深了网络深度并有着更少的参数和更高的效率，成为当年的基准模型，其中起到关键作用的是1*1卷积。

随后，SqueezeNet[4]同样利用1*1卷积进行模型压缩，成为早期经典。

文章引用量：15000+

推荐指数：✦✦✦✦✦

[3] Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 1-9.

[4] Iandola F N, Han S, Moskewicz M W, et al. SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5 MB model size[J]. arXiv preprint arXiv:1602.07360, 2016.

4 Xception/MobileNet/ResNext

通道的分组是设计高效网络常见的思想，关于它的来源可有详见之前的文章，【AI不惑境】移动端高效网络，卷积拆分和分组的精髓。

通道分组卷积的第一次大规模应用在Xception[5]中，在Mobilenet[6]中进一步发挥到极致，在Resnext[7]中也取得了很好的效果。如果你想了解更多的分组卷积的应用，就参考上述往期文章和有三AI知识星球吧。

文章引用量：2000+

推荐指数：✦✦✦✦✦

[5] Chollet F. Xception: Deep learning with depthwise separable convolutions[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 1251-1258..

[6] Howard A G, Zhu M, Chen B, et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications[J]. arXiv preprint arXiv:1704.04861, 2017.

[7] Xie S, Girshick R, Dollár P, et al. Aggregated residual transformations for deep neural networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 1492-1500.

5 CReLU/DenseNet

卷积神经网络中的参数存在冗余，网络的宽度对于参数量和通道的贡献非常大，如何提高通道的利用率是一个很重要的课题。

CReLU[8]采用了非常简单的网络互补技巧，DenseNet[9]则使用了密集的通道互补策略，都是非常有效的方法。

文章引用量：5000+

推荐指数：✦✦✦✦✦

[8] Shang W, Sohn K, Almeida D, et al. Understanding and improving convolutional neural networks via concatenated rectified linear units[C]//international conference on machine learning. 2016: 2217-2225.

[9] Huang G, Liu Z, Van Der Maaten L, et al. Densely connected convolutional networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 4700-4708.

6 其他资料

因为是每周论文阅读，就不给大家推荐太多文章(每周10篇左右)。对于更高效(紧凑)的模型设计，这里给出的文章仅仅是冰山一角。如果你对模型优化感兴趣，有三AI知识星球中有更多的内容。

7 如何获取文章与交流

找到有三AI开源项目即可获取。

https://github.com/longpeng2008/yousan.ai

文章细节众多，阅读交流在有三AI知识星球中进行，感兴趣可以加入。

总结

以上就是初次了解高效率模型设计需要读的文章，这是非常重要的一个方向，希望大家认真对待。下一次，我们将开始推荐计算机视觉各个方向的文章。

有三AI夏季划

有三AI夏季划进行中，欢迎了解并加入，系统性成长为中级CV算法工程师。

转载文章请后台联系

侵权必究

ACL 2019论文| 为知识图谱添加注意力机制

注意力机制(Attention)是近些年来提出的一种改进神经网络的方法,在图像识别.自然语言处理和图网络表示等领域都取得了很好的效果,可以说注意力机制的加入极大地丰富了神经网络的表示能力. 论文原文: ...
使用OpenCV内置深度学习人脸模块，几行代码轻松完成人脸检测和识别

作者:冯远滔(OpenCV China),王成瑞(北京邮电大学),钟瑶瑶(北京邮电大学) 最新发布的OpenCV 4.5.4版本收录了一个基于深度学习神经网络的人脸模块(以下称"OpenCV ...
DL框架之MXNet ：深度学习框架之MXNet 的简介、安装、使用方法、应用案例之详细攻略

DL框架之MXNet :深度学习框架之MXNet 的简介.安装.使用方法.应用案例之详细攻略 MXNet 的简介 A flexible and efficient library for deep l ...
AI领域未来几年最引人瞩目的新方向是什么？

在调查近几年 AI 领域的过程中,我发现近几年对抗攻击的概念逐渐出现在全世界各国研究人员的视野中,我认为这将会是现在乃至未来几年最引人瞩目的新方向之一. 1.概述我在国内的两个著名的学术搜索网站 A ...
基于嵌入表示的网络实体对齐方法进展概述

网络实体对齐是指给定两个网络,把两个网络中等价的实体合并.实体对齐在很多领域都有重要应用,比如,跨平台社交网络的用户对齐可以用于用户画像.用户兴趣挖掘,跨语言知识图谱的实体对齐可以辅助机器翻译.跨语言 ...
人工智能与信息安全：新的革命与挑战

人工智能,是一种借鉴生物感知系统和神经系统来开发相应模拟算法的计算机技术,其主要特点是可从数据中学习特征并进行自我迭代训练. 通常,人工智能算法往往需要大量的数据以及庞大的计算资源作为支撑.随着计算机 ...
用户画像: 信息抽取方法概览

用户画像: 信息抽取方法概览
【每周CV论文推荐】深度学习人脸检测入门必读文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸图像是整个图像处理领域里面研究时间最长, ...
【每周CV论文推荐】初学深度学习单张图像三维人脸重建需要读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 基于图像的人脸三维重建在人脸分析与娱乐领域里 ...
【每周CV论文推荐】初学深度学习人脸属性分析必读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸属性分析在社交娱乐,人机交互等领域有重要 ...
【每周CV论文推荐】初学活体检测与伪造人脸检测必读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 活体检测在安防与金融等使用人脸识别技术的领域 ...
【每周CV论文推荐】初学深度学习人脸识别和验证必读文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸识别和验证是当前人脸图像在身份认证领域中 ...
【每周CV论文推荐】初学深度学习人脸关键点检测必读文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 人脸关键点检测是人脸图像中重要的基石,今天给 ...
【每周CV论文推荐】初学GAN必须要读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. GAN作为当前最有前途,也最烧钱的方向之一, ...
【每周CV论文推荐】初学深度学习图像分割必须要读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像分割作为计算机视觉的基础任务之一,应用非 ...
【每周CV论文推荐】初学目标检测必须要读的文章

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 目标检测作为计算机视觉的基础任务之一,应用非 ...

【每周CV论文推荐】 初学高效率CNN模型设计应该读的文章

相关推荐

【每周CV论文推荐】初学高效率CNN模型设计应该读的文章