YOLACT++：目前最热门的实时实例分割开源库

2024-07-31 02:15:25

YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法，近期该文作者又对此进行了扩展，提出YOLACT++：Better Real-time Instance Segmentation，其 resnet50 模型在Titan Xp 上运行速度达 33.5 fps，在COCO 的test-dev数据集上达到34.1 mAP，并开源了代码。

论文作者/代码开发者来自加州大学戴维斯分校。

下图为YOLACT/YOLACT++ 与其他实例分割算法速度和精度的比较：

可见 YOLACT 系列具有较大的速度优势，YOLACT++ 则又在 YOLACT基础上精度提高不少。

以下视频为该文作者在ICCV 2019 公布的实例分割Demo：

这些结果并非后期处理的，而是在GPU上实时运行出来的。

YOLACT 网络架构：

在COCO数据集上与其他算法更详细的比较结果：

YOLACT / YOLACT++ 取得了速度最快的同时，取得了不错的分割精度。

作者已经开源了多个模型：

并提供了代码，可以很方便在COCO数据集上评测性能：

# Display qualitative results on COCO. From here on I'll use a confidence threshold of 0.15.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

以及对图像和视频上跑实例分割：

# Display qualitative results on the specified image.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png# Process an image and save it to another file.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png# Process a whole folder of images.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder

# Display a video in real-time. "--video_multiframe" will process that many frames at once for improved performance.# If you want, use "--display_fps" to draw the FPS directly on the frame.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=my_video.mp4# Display a webcam feed in real-time. If you have multiple webcams pass the index of the webcam you want instead of 0.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=0# Process a video and save it to another file. This uses the same pipeline as the ones above now, so it's fast!python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=input_video.mp4:output_video.mp4

同时该代码也开放了训练程序，开发者可以很轻松在COCO 、Pascal SBD上训练模型，并添加多GPU 支持。

如果开发者想要在自己的数据集上训练实例分割，只需要有COCO风格的目标检测标注JSON数据即可。

以下是分割结果示例：

论文地址：

https://arxiv.org/pdf/1912.06218.pdf

开源地址：

https://github.com/dbolya/yolact

目前该代码已经获得 2K+ 颗星，是近期最热门的实例分割开源库。

Halcon图像分割

auto_threshold(Image : Regions : Sigma : )* 对单通道图像做自动阈值(灰度直方图确定)分割Sigma:灰度直方图高斯光滑核(标准差),光滑消除噪声,并且分割区 ...
4、Halcom区域分割和区域边缘膨胀、腐蚀

目录 1.全局阈值分割 2.动态阈值分割 3.其它阈值分割 4.形态学膨胀 5.形态学腐蚀 6.形态学开运算和闭运算 1.全局阈值分割阈值,字面意思是界限,又叫临界值.是指能够产生的最低值或最高值. ...
Halcon的OCR字符识别算法技巧总结

一.重要算子 OCR分类器其实有很多,如下图所示.但是通常mlp分类器效果较好,使用较多. 主要算子如下: ① append_ocr_trainf(Character, Image : : Class ...
OpenCV中使用模板匹配识别空闲的货架空间

重磅干货,第一时间送达假设你是一名在超市工作的员工,被要求在商店里四处走动,检查需要重新进货的货架.但是,超市有时会有多个区域来存放一种特定的产品,所以要跟踪购物者购买产品的确切位置并不容易.最重要 ...
超快速的端到端实例分割模型，手把手教你用opencv部署Yolact

作者丨nihate 审稿丨邓富城编辑丨极市平台极市导读作为ncnn推理框架里唯一一款做实例分割的模型,yolact也展现出了它的魅力,实现端到端一阶段完成实例分割且运行速度快.本文为作者上手编写 ...
机器视觉中Blob分析

一.概念在计算机视觉中的Blob(Binary large object)是指图像中的具有相似颜色.纹理等特征所组成的一块连通区域,一般来说,该区域就是图像中的前景. 举例来说,假如现在有一块刚生产 ...
【每周CV论文】初学实例分割需要读哪些文章？

欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 实例分割(Instance Segmenta ...
Py之pixellib：pixellib库的简介、安装、经典案例之详细攻略

Py之pixellib:pixellib库的简介.安装.经典案例之详细攻略 pixellib库的简介 pixellib是一个库执行图像分割.它支持两种主要类型的图像分割:语义分割和实例分割,只需几行代 ...
《HALCON机器视觉与算法原理编程实践》第6章图像分割

文章目录 6.1 阈值处理 6.1.1 全局阈值 6.1.2 基于直方图的自动阈值分割方法 6.1.3 自动全局阈值分割方法 6.1.4 局部阈值分割方法 6.1.4 其它阈值分割方法 6.2 区域生 ...
CVPR2020：Deep Snake 用于实时实例分割

重磅干货,第一时间送达源码:https://github.com/zju3dv/snake/ 本文的贡献 1) 提出了一种基于学习的用于实时实例分割的蛇算法,介绍了用于轮廓学习的圆形卷积. 2) 提 ...
PyTorch语义分割开源库semseg

今天跟大家介绍一款新出的基于PyTorch的语义分割开源库semseg: https://github.com/hszhao/semseg 其开发者为香港中文大学的博士生Hengshuang Zhao ...
韩国ETRI提出实时Anchor-Free实例分割算法CenterMask，代码将开源

今天来自韩国ETRI的一篇论文CenterMask : Real-Time Anchor-Free Instance Segmentation 很抢眼,作者称"CenterMask outp ...
遮挡视频实例分割

重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
用简单Mask分类实现语义分割、实例分割“大一统”！Facebook&UIUC开源MaskFormer

作者丨小马编辑丨极市平台极市导读不同的处理范式使得语义分割和实例分割存在很大的gap,极大了影响力图像分割领域一起发展.因此本文作者提出将实例分割任务和语义分割任务都用mask分类的范式来处理, ...
LaneAF | 利用Affinity Field聚类进行车道线实例分割

论文:https://arxiv.org/abs/2103.12040 开源代码:https://github.com/sel118/LaneAF 0 动机车道线检测对于辅助驾驶.自动驾驶至关重要. ...
RefineMask：实例分割，使用细粒度信息增强性能

标题:RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained Features 论文:https://arxi ...

YOLACT++：目前最热门的实时实例分割开源库

相关推荐