经典的图像语义分割模型 2024-07-31 11:36:53 经典的基于 CNN 的图像语义分割模型有 FCN、SegNet、U-Net、PSPNet 和 DeepLab,主要针对 FCN、SegNet 和 DeepLab 三个经典模型进行简要介绍。FCN 之所以称为全卷积神经网络模型,是因为 FCN 去掉了图像分类网络中的全连接层,全连接层得到的是整张图像的分类结果,而图像语义分割是实现对每一个像素点的分类,因此去掉全连接层,且去掉全连接层后可使模型适应不同尺寸图像的输入,由于最后的特征图在提取特征过程中会丢失图像位置信息,即得到的特征图像素小于原图像,基于该问题,FCN 利用反卷积(Deconvolution)的方法对特征图进行上采样操作,将其恢复到原始图像尺寸,同时采用跳跃(Skip)结构对不同深度层的特征图进行融合,然后利用监督函数不断进行反向传播,调整学习参数,最后得到最优的参数模型。FCN 的网络结构图如下: SegNet 是在 FCN 的基础上进行的改进,同时引入了预训练模型 VGG-16 提取图像特征,SegNet 不同于 FCN,SegNet 采用的是对称的编码器-解码器结构,这种结构主要分为编码器和解码器两个部分,编码器采用 VGG-16 模型对图像进行特征提取,如上图所示,每个编码器包含多层卷积操作、BN、ReLU 以及池化层,其中卷积操作采用的是 same padding 方式,即图像大小不会发生改变,而池化层采用的是步长为 2 的2 × 2的最大池化,会降低图像分辨率,如图中所示,每一层编码器得到的特征图除了传入下一层编码器进行特征提取外,同时要传入对应层的解码器进行上采样,如此一来,有多少层编码器就会对应地有多少层解码器,最终解码器得到的特征图会输入到 SoftMax 分类器中,继而得到最后的预测图。 DeepLab 模型是图像语义分割领域中非常经典的一个模型,包括 DeepLab V1、V2和 V3 三个版本,由于 DeepLab V3 是在 DeepLab V2 的基础上进行的改进,因此,本小节只简单介绍 DeepLab V1 和 DeepLab V2。DeepLab V1 借鉴了 FCN 的核心思想,以 VGG-16 作为主干网络,去掉了最后的全连接层,同时也剪掉了两个池化层,池化层是的主要作用是快速地扩大感受野,最大程度地利用上下文信息,但池化层的缺点是会导致图像尺寸缩小,丢失空间位置信息,影响上采样过程中信息的恢复。为了解决这个问题,DeepLab V1 引入空洞卷积,总结来说就是空洞卷积可以在保证参数不增加的前提下扩大感受野,弥补了剪掉池化层导致的感受野变小的问题,同时 DeepLab V1 也引入了条件随机场来增加分割精准性。由于 ResNet 相对于 VGG-16 来说具有更好的表现力,因此 DeepLab V2 利用ResNet101 预训练模型替换了 DeepLab V1 中的 VGG-16 模型,同时提出了空洞空间金字塔池化(简称 ASPP),并将该结构融入到了 ResNet101 中,ASPP 的每个分支处设置了不同的空洞率,可以提取到一张图像中大小不同的同种目标。DeepLab V1 和 DeepLabV2 的主要模块分别是 Deep Lab-LargeFOV 和 DeepLab-ASPP,如下图所示。 赞 (0) 相关推荐 【每周CV论文推荐】 初学深度学习图像分割必须要读的文章 欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 图像分割作为计算机视觉的基础任务之一,应用非 ... 自动驾驶-使用fcn语义分割 上一章利用卷积神经网络处理分类问题,卷积神经网络在图像分类问题中取得了很高的精度,很好的解决了图像是什么的问题,然而其在处理过程中丢失了空间信息,无法回答目标物体在哪里的问题.本章介绍的全卷积神经网络 ... 找了好久,终于发现一款好用到炸的「图像分割」神器! 加个"星标",每天下午18:03,一起学技术 自动驾驶近些年简直火炸了天,小编大胆的预测这个拥有2021CVPR自动驾驶场景理解赛道冠军算法的项目马上要火爆业界! 而这个项目的St ... 【图像分割模型】编解码结构SegNet 这是专栏<图像分割模型>的第2篇文章.在这个专栏里,我们将共同探索解决分割问题的主流网络结构和设计思想. 上篇文章我们学习了分割网络鼻祖FCN,今天我们来看看用解码器踢馆的SegNet. ... 深度神经网络的图像语义分割研究综述 摘要 随着深度学习的迅速发展并广泛应用到语义分割领域,语义分割效果得到了显著的提 升.本文主要对基于深度神经网络的图像语义分割方法和研究现状进行了详细的综述.根据 网络训练方式的不同,将现有的方法分为 ... 2021CVPR顶会冠军带你解密图像分割 最近全球各大新势力造车公司简直不能再火!看着蹭蹭飙升的股价实在是眼红的不要不要的.而懂行的人都知道,以特斯拉为首,各大公司都采用计算机视觉作为自动驾驶的技术底座,而其中正是通过图像分割技术,汽车才能分 ... 用Transformer进行图像语义分割,性能超最先进的卷积方法! 重磅干货,第一时间送达 丰色 发自 凹非寺 报道 | 量子位 正如大家所知,在进行图像语义分割时,图像被编码成一系列补丁后往往很模糊,需要借助上下文信息才能被正确分割. 因此上下文建模对图像语义分割的 ... 零基础入门语义分割-Task5 模型训练与验证 一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上进行验证: 模型可以保存最优的权重,并读取权重: 记录下训练集和验证集的精度,便于调参. 5 模型训练与验证 为此本章 ... 精度高、模型小、速度快!梯形DenseNets结构实现语义分割新高度! 今天上午arXiv出现一篇非常值得参考的语义分割文章<Efficient Ladder-style DenseNets for Semantic Segmentation of Large Im ... CV之IS:利用pixellib库基于deeplabv3_xception模型对《庆余年》片段实现语义分割简单代码全实现 CV之IS:利用pixellib库基于deeplabv3_xception模型对<庆余年>片段实现语义分割简单代码全实现 利用pixellib库基于deeplabv3_xception模型 ... 【十大经典日内程序化交易的模型思路(一)】 【十大经典日内程序化交易的模型思路(一)】 基于自监督深度估计的领域自适应语义分割 重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ... 小学经典几何模型,鸟头模型,记住结论用处很大 小学经典几何模型,鸟头模型,记住结论用处很大 Transformer在语义分割上的应用 作者:晟沚 前 言 语义分割方法主要采用具有编码器-解码器体系结构的全卷积网络(FCN).编码器逐渐降低空间分辨率,并通过更大的感受野学习更多的抽象/语义视觉概念.由于上下文建模对于分割至关重要,因 ...