AdvancedEAST高效场景文本检测(附Github地址)
AdvancedEAST
AdvancedEAST是一种用于场景图像文本检测的算法,主要基于 EAST: An Efficient and Accurate Scene Text Detector,并且还进行了重大改进,使长文本预测更加准确。
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
优点
基于Keras,易于阅读和运行
基于EAST,一种先进的文本检测算法
易于训练模型
进行了重大改进,长文本预测更准确。(请参阅下面的“演示结果”部分,并注意激活图像,以黄色网格开头,以绿色网格结束。)
这份代码,本来是作者参加阿里巴巴的文本定位比赛时用到的,后来好心的作者开源了,不仅包括测试,还包括训练代码,请大家记得手动为这位大佬点赞!
在作者的实验中,AdvancedEast获得了比East更好的预测准确性,特别是在长文本上。这是因为原始East使用所有像素的预测顶点坐标的加权平均值计算最终顶点坐标,而从四边形的另一侧预测2个顶点太困难了。
network arch
AdvancedEast
EAST
检测示例:
项目地址:
https://github.com/huoyijie/AdvancedEAST
相关推荐
-
【OCR技术系列之五】自然场景文本检测技术综述(CTPN, SegLink, EAST)
文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别.今天我们首先来谈一下当今流行的文字检测技术有哪些. 文本检测不是一件简 ...
-
程序员必备工具包,请收藏!
回复"000"获取大量电子书 古人云:工欲善其事,必先利其器.工匠想要使他的工作做好,一定要先让工具锋利.比喻要做好一件事,准备工作非常重要. 我们做软件开发者,每天都要和各种工具 ...
-
听说你要接私活?Guide连夜整理了5个开源免费的Java项目快速开发脚手架。
大家好,我是 Guide 哥,一个三观比主角还正的技术人. 今天推荐几个 Java 项目快速开发脚手架,解放双手 ✋ 从现在开始. 以下推荐项目都是码云上的优质项目,并且都是项目快速开发脚手架,代码质 ...
-
AI配音专家105版:超强文字转语音软件!完全开源!
[软件简介] [软件特点] 1.本软件采用Electron + vue + ElementUI + js开发: 2.采用了阿里语音合成引擎,效果非常好,语言种类齐全! [使用须知] 1.软件里面的ke ...
-
CVPR 2021 论文大盘点-文本图像篇
OpenCV中文网 OpenCV技术布道,CV实用教程,业界前沿资讯 36篇原创内容 公众号 本文收集文本检测与识别相关论文,包含任意形状文本检测.场景文本识别.手写文本识别.文本分割.文本图像检索. ...
-
推荐几款好用的文本编辑器
Sublime Text Sublime Text 是一个轻量.简洁.高效.跨平台的编辑器. Sublime Text的特色功能: 良好的扩展功能,官方称之为安装包(Package). 右边没有滚动条 ...
-
炸了!这个GitHub开源项目绝对要火!涵盖OCR功能、语音合成!
重磅干货,第一时间送达 今天小编为大家推荐一个相当牛逼的项目, 粗略估计,这个项目价值超过百万 当前star 1.9k,但是大胆预判, 这个项目肯定要火,未来Star数应该可以到10k甚至20k! 着 ...
-
这个项目在 GitHub 火了!一周暴涨 3000 Star!!!
大家好,我是小 G. 今天为大家推荐一个相当牛逼的项目. 粗略估计,这个项目价值超过百万! 当前 star 5.1k,但是大胆预判,这个项目肯定要火,未来 Star 数应该可以到 10k 甚至 20k ...
-
GitHub 又一 OCR 神器面世!让你快速告别「复制 粘贴」!
来自机器之心 对很多人来说,将 PDF 转换为可编辑的文本是个刚需,却苦于没有简单方法.在本文介绍的项目中,来自 K1 Digital 的高级机器学习工程师 Lucas Soares,尝试使用 OCR ...
-
ECCV18 | 如何正确使用样本扩充改进目标检测性能(附Github地址)
在大多数视觉任务中,对图像进行颜色改变或是增加随机噪声等这些通用数据增广操作,都会改进模型预测能力,但如果能利用特定任务的先验知识则往往会获得更大的性能改进.比如在目标检测的任务中,将目标的图像随机复 ...
-
MT:用于场景文本检测的多视角特征学习网络
重磅干货,第一时间送达 小黑导读 论文是学术研究的精华和未来发展的明灯.小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
-
尺度不变网络提升人群计数性能(附Github地址)
文章来自几天前arXiv新上论文<Stacked Pooling: Improving Crowd Counting by Boosting Scale Invariance>,作者信息: ...
-
ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)
来自巴西阿雷格里港大学的学者发表于ECCV2018的论文<License Plate Detection and Recognition in Unconstrained Scenarios&g ...
-
BMVC18|无监督深度关联学习大幅提高行人重识别性能(附Github地址)
本文选自BMVC2018的论文<Deep Association Learning for Unsupervised Video Person Re-identification>,使用无 ...
-
使用Bootstrap框架仿星巴克网站、附github地址。
本案例制作一个咖啡销售网站,通过网站呈现自己的理念和咖啡文化,页面布局设计独特,采用两栏的布局形式:页面风格设计简洁,为浏览者提供一个简单.时尚的页面,浏览时让人心情舒畅. 1.网站概述 网站的设计思 ...
-
豆瓣9.5,这6部神级纪录片,让孩子深入认识那些课本中高频出现的伟大人物(附观看地址)
小语说: 有这样一群人,在我们从小到大的课本中反复出现,有着每一个中国孩子都应该铭记于心的名字.他们身上还有一种魅力,影响着几代国人,让孩子读懂他们,就是一笔沉甸甸的精神宝藏.[文尾有免费观看地址,别 ...
-
北京27家老字号馆子,您全吃过吗?(附最新地址)
今儿个, 咱先来看段视频. 保准让您哈喇子直往 看完视频, 您是不是也开始流口水了? 又一顺的它似蜜, 萃华楼的酱爆桃仁鸡...... 那些咱们割舍不下的味道, 如今都在何处. 小编这就为您一网打尽 ...