cv.dnn介绍及常用模块

2024-04-20 18:34:34

介绍

OpenCV中的深度学习模块（DNN）只提供了推理功能，不涉及模型的训练，即模型训练好了，进行预测，支持多种深度学习框架，比如TensorFlow，Caffe,Torch和Darknet。

OpenCV那为什么要实现深度学习模块？

轻量型。DNN模块只实现了推理功能，代码量及编译运行开销远小于其他深度学习模型框架。
使用方便。DNN模块提供了内建的CPU和GPU加速，无需依赖第三方库，若项目中之前使用了OpenCV，那么通过DNN模块可以很方便的为原项目添加深度学习的能力。
通用性。DNN模块支持多种网络模型格式，用户无需额外的进行网络模型的转换就可以直接使用，支持的网络结构涵盖了常用的目标分类，目标检测和图像分割的类别

DNN模块还有网络层面的优化

层融合:层融合通过对网络结构的分析，把多个层合并到一起，从而降低网络复杂度和减少运算量。
内存复用:第一种内存复用的方法是输入内存复用,即当前层的输出复用当前层的输入。第二种内存复用的方法是后续层复用前面层的输出。

常用模块

dnn.blobFromImage

blobFromImage(image,
scalefactor=None,
size=None,
mean=None,
swapRB=None,
crop=None,
ddepth=None):
#进行批量图片处理
blobFromImages(images,
scalefactor=None,
size=None, mean=None,
swapRB=None,
crop=None,
ddepth=None):

参数：

image:cv2.imread 读取的图片数据
scalefactor: 缩放像素值，如 [0, 255] - [0, 1]
size: 输出blob(图像)的尺寸，如 (netInWidth, netInHeight)，范围[0，255]
mean: 从各通道减均值. 如果输入 image 为 BGR 次序，且swapRB=True，则通道次序为 (mean-R, mean-G, mean-B).
swapRB: 交换 3 通道图片的第一个和最后一个通道，如 BGR - RGB
crop: 图像尺寸 resize 后是否裁剪. 如果crop=True，则，输入图片的尺寸调整resize后，一个边对应与 size 的一个维度，而另一个边的值大于等于 size 的另一个维度；然后从 resize 后的图片中心进行 crop. 如果crop=False，则无需 crop，只需保持图片的长宽比
ddepth: 输出 blob 的 Depth. 可选: CV_32F 或 CV_8U

import cv2
from cv2 import dnn
import numpy as np
import matplotlib.pyplot as plt
img_cv2 = cv2.imread("test.jpeg")
print("原图像大小: ", img_cv2.shape)
inWidth = 256
inHeight = 256
outBlob1 = cv2.dnn.blobFromImage(img_cv2,
scalefactor=1.0 / 255,
size=(inWidth, inHeight),
mean=(0, 0, 0),
swapRB=False,
crop=False)
print("未裁剪输出: ", outBlob1.shape)
#输出4维数组，图片是3维，第1维图片的个数，第2维通道数，第3，4维高度，宽度
outimg1 = np.transpose(outBlob1[0], (1, 2, 0))
outBlob2 = cv2.dnn.blobFromImage(img_cv2,
scalefactor=1.0 / 255,
size=(inWidth, inHeight),
mean=(0, 0, 0),
swapRB=False,
crop=True)
print("裁剪输出: ", outBlob2.shape)
outimg2 = np.transpose(outBlob2[0], (1, 2, 0))
plt.figure(figsize=[10, 10])
plt.subplot(1, 3, 1)
plt.title('输入图像', fontsize=16)
plt.imshow(cv2.cvtColor(img_cv2, cv2.COLOR_BGR2RGB))
plt.axis("off")
plt.subplot(1, 3, 2)
plt.title('输出图像 - 未裁剪', fontsize=16)
plt.imshow(cv2.cvtColor(outimg1, cv2.COLOR_BGR2RGB))
plt.axis("off")
plt.subplot(1, 3, 3)
plt.title('输出图像 - 裁剪', fontsize=16)
plt.imshow(cv2.cvtColor(outimg2, cv2.COLOR_BGR2RGB))
plt.axis("off")
plt.show()

`dnn.NMSBoxes`

作用：根据给定的检测boxes和对应的scores进行NMS（非极大值抑制）处理

NMSBoxes(bboxes,
scores,
score_threshold,
nms_threshold,
eta=None,
top_k=None)

参数：

boxes: 待处理的边界框 bounding boxes
scores: 对于于待处理边界框的 scores
score_threshold: 用于过滤 boxes 的 score 阈值
nms_threshold: NMS 用到的阈值
indices: NMS 处理后所保留的边界框的索引值
eta: 自适应阈值公式中的相关系数：

top_k: 如果 top_k>0，则保留最多 top_k 个边界框索引值.

`dnn.readNet`

作用：加载深度学习网络及其模型参数

readNet(model, config=None, framework=None)

参数：

model: 训练的权重参数的模型二值文件，支持的格式有：*.caffemodel(Caffe)、*.pb(TensorFlow)、*.t7 或 *.net(Torch)、 *.weights(Darknet)、*.bin(DLDT).
config: 包含网络配置的文本文件，支持的格式有：*.prototxt (Caffe)、*.pbtxt (TensorFlow)、*.cfg (Darknet)、*.xml (DLDT).
framework: 所支持格式的框架名

该函数自动检测训练模型所采用的深度框架，然后调用 readNetFromCaffe、readNetFromTensorflow、readNetFromTorch 或 readNetFromDarknet 中的某个函数完成深度学习网络模型及模型参数的加载。

特定框架的API：

Caffe

readNetFromCaffe(prototxt, caffeModel=None)

作用：加载采用Caffe的配置网络和训练的权重参数

Darknet

readNetFromDarknet(cfgFile, darknetModel=None)

作用：加载采用Darknet的配置网络和训练的权重参数

Tensorflow

readNetFromTensorflow(model, config=None)

作用：加载采用Tensorflow 的配置网络和训练的权重参数

参数：

model: .pb 文件

config: .pbtxt 文件

Torch

readNetFromTorch(model, isBinary=None)

作用：加载采用 Torch 的配置网络和训练的权重参数

参数：

model: 采用 torch.save()函数保存的文件

ONNX

readNetFromONNX(onnxFile)

作用：加载 .onnx 模型网络配置参数和权重参数

OpenCV开发笔记（七十三）：红胖子8分钟带你使用opencv dnn yolov3识别物体

若该文为原创文章,转载请注明原文出处本文章博客地址:https://blog.csdn.net/qq21497936/article/details/109201809 各位读者,知识无穷而人力有穷 ...
OpenCV调用Tensorflow训练好的.pb模型

" 做一个安静细微的人,于角落里自在开放,默默悦人,却始终不引起过分热闹的关注,保有独立而随意的品格,这就很好." 本博文使用opencv的dnn模块inference保 ...
Figure创建及其参数设置

上篇介绍的参数是plot函数的参数,但是很多参数是大部分图形都会用到的,比如图形,比如坐标轴,本篇介绍的是Figure的创建及其参数的设置. 1.创建figure 所有的图形是需要在画布(相当于白纸, ...
饼图

饼图,又名Pie Graph,常用于统计学模块. 本篇介绍用matplotlib.pyplot.pie来绘制饼图. 1.饼图如下图所示,是一个最简单的饼图,将1分为3:7,然后用饼图的方式表示出来. ...
使用OpenCV进行图像全景拼接

重磅干货,第一时间送达 def detectAndDescribe(image, method=None): """ Compute key points and fea ...
OpenCV开发笔记（七十二）：红胖子8分钟带你使用opencv dnn tensorFlow识别物...

若该文为原创文章,转载请注明原文出处本文章博客地址:https://blog.csdn.net/qq21497936/article/details/109194717 各位读者,知识无穷而人力有穷 ...
超详细！使用OpenCV深度学习模块在图像分类下的应用实践

加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
【从零学习OpenCV 4】深度神经网络应用实例

重磅干货,第一时间送达经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门书籍<OpenCV 4开发详解>.为了更让小伙伴更早的了解最新版的OpenCV 4,小白与出版社沟通 ...
opencv基于DNN的人脸检测

from:https://blog.csdn.net/minstyrain/article/details/78907425 opencv3.4 版之前自带的人脸检测器是基于Haar+Adaboost ...
参数量仅为原来1%，北邮等利用超分算法提出高性能视频传输方法

机器之心专栏北京邮电大学-模式识别与智能系统实验室来自北京邮电大学和英特尔中国研究院的研究团队创新性地利用超分辩率算法定义了网络视频传输任务,减小了网络视频传输的带宽压力. 互联网视频在过去几年发 ...
利用OpenCV实现基于深度学习的超分辨率处理

重磅干货,第一时间送达 OpenCV是一个非常强大的计算机视觉处理的工具库.很多小伙伴在入门图像处理时都需要学习OpenCV的使用.但是随着计算机视觉技术的发展,越来越多的算法涌现出来,人们逐渐觉得O ...
(10条消息) OpenCV之DNN模块，实现深度学习网络的推理加速

OpenCV是计算机视觉领域使用最为广泛的开源库,以功能全面使用方便著称.自3.3版本开始,OpenCV加入了对深度神经网络(DNN)推理运算的支持.在LiveVideoStack线上交流分享中英特尔 ...
千呼万唤始出来，OpenCV 4.0正式发布！

OpenCV 4.0 正式版来啦!虽然官网还没更新,但Github已经放出来了! 重回英特尔的OpenCV终于迎来一次大版本更新,增加了诸多新特性,快来一起看看吧- 因为OpenCV最开始开发时的语言 ...
MaskRCNN 基于OpenCV DNN的目标检测与实例分割

原文:MaskRCNN 基于OpenCV DNN的目标检测与实例分割 - AIUAI 这里主要记录基于 OpenCV 4.x DNN 模块和 TensorFlow MaskRCNN 开源模型的目标检测 ...
opencv调用yolov3模型来进行图像检测

之前使用了opencv来调用ssd的模型来检测物体,今天学了一下用opencv调用yolov3的模型来检测物体,二者在预测图形的部分,代码流程差不多,反正就是加载模型然后预测输出,但是对于输出结果的处 ...
(8条消息) opencv 使用DNN模块调用Tensorflow的Mask

文章目录环境准备利用opencv自带的工具生成对应的模型对应的描述文件 DNN模块使用 demo 效果环境准备 Python3 OpenCV 4.5.0 (4版本以上都可以) Mask-RCNN ...
OpenCV 3.4.11 cv::dnn::Net::forward()函数第一个参数的理解

问题来源使用OpenCV 3.4.11在C++下跑YOLOv4的时候对cv::dnn::Net::forward()函数的第一个参数产生了一些疑问,在此记录学习解惑的过程代码来源: https:/ ...

cv.dnn介绍及常用模块

介绍

常用模块

dnn.blobFromImage

dnn.NMSBoxes

dnn.readNet

相关推荐

`dnn.NMSBoxes`

`dnn.readNet`