【学术论文】基于深度学习的智能路牌识别系统设计

摘要: 提出了一种基于机器视觉和深度学习的智能路牌识别系统。采用嵌入式的ARM9作为前端采集系统,在服务器上采用图像处理算法先对前端采集的路牌图像进行文字区域的提取和分割,然后用训练好的卷积神经网络对分割的文字进行识别,最后将识别信息以语音的形式反馈给使用者。使用前端硬件在高速公路上采集路牌图像并在服务器的CAFFE框架上进行测试,结果表明该系统能实时准确地将路牌信息以语音的方式播报给使用者。

0 引言

随着社会的快速发展,现今的生活中,汽车已经成为主要的交通工具,路牌也成为一种重要的导航工具。无论是高速公路还是国道、省道,到处都树立着路牌。然而,由于路牌常常被竖立在路的两边,当司机需要了解路旁路牌的信息时,注意力很容易被分散,当驾驶者对自己所在道路不熟悉的时候,前方路况和各种标志的路牌会让驾驶者的心里压力变大,驾驶者由于减速观看路牌很容易发生交通堵塞和交通事故,使得交通状况变得更加恶劣。对此,国内外一些研究学者对路牌的识别进行了研究[1],但效果不是很理想,将路牌识别系统实现的更是少之又少。智能路牌识别系统能有效地提取路牌信息,帮助驾驶者理解路牌的信息,对于安全驾驶有着极其重要意义,对将来智能驾驶战略也将做出突出的贡献。

1 智能路牌识别控制系统的总体设计

本系统由基于嵌入式技术的前端采集、通信传输系统和远程云服务器识别系统组成。前端采集传输采用基于三星Cortex-A9架构的核心板,配备一千万像素摄像头、语音播报模块和4G通信模块构建智能路牌识别系统的硬件平台。摄像头采集含有路牌的图像,由主控芯片对图像进行压缩,压缩后的图像在4G模块下通过SOCKET程序传送到云服务器上。采用云平台服务器作为智能路牌识别器的数据处理中心,在服务器上通过深度学习算法训练文字识别网络,将分割后的图像在训练好的网络上进行识别,然后将得到的结果传输到前端,通过语音模块播报给使用者。智能路牌识别器的总体设计如图1所示。

2 智能路牌识别控制系统的硬件设计

2.1 主控单元模块

该模块采用ARM9核心的处理器作为中央控制单元模块,用它实现对前端采集系统各个单元模块所采集的数据信息进行汇总分析和处理,对各个功能模块发出控制指令,协调整个系统稳定运行。中央控制单元完成图像采集,根据预先板载的压缩算法程序完成图像压缩,通常可达到6:1的压缩率,并发给云服务器,减小了传输时间,保证了信息传输的实时性。中央控制单元同时接收来自云服务器发送的识别结果,并将结果通过语音模块反馈给使用者。

2.2 前端采集模块

前端采集采用的是一千万像素的CMOS高清摄像头,它能够清晰地拍摄前方场景信息,用于智能路牌识别系统对路牌信息的采集。得到的高清图片存储在中央控制单元,并由中央控制单元对其进行处理。

2.3 无线通信模块

无线通信模块由外围电路和4G通信芯片构成,使用SOCKET通信和4G通信技术,完成智能路牌识别系统和云端服务器的相互连接。在中央处理器模块的控制下,前端采集压缩的图片在无线通信模块的作用下发送给云端服务器,同时云端服务器将处理完成的信息通过无线传输模块发送给中央控制单元,把结果实时反馈给使用者。

2.4 语音文字播报模块

语音播报模块主要作用是将云端服务器处理的路牌文字信息以语音播报的形式展现给驾驶者,使得驾驶者不用因环顾四周的路牌文字而分心。该模块主要采用SYN6288中文语音合成芯片实现对语音文字的播报,把云端服务器发送的文本文字转化为音频信息。SYN6288语音芯片采用UART和SPI两种通信方式,实现文本智能分析处理、多音字处理功能。该模块的电路如图2所示。

3 智能路牌识别控制系统的软件设计

本系统软件的设计由两部分组成。一部分是前端ARM9加载Linux系统的设计,完成前端信息的采集压缩、云端服务器通信和语音播报的功能。前端采集程序流程图如图3所示。

另一部分是在云端服务器上实现对采集图像的预处理、检测、分割和分类识别功能。云端服务器首先对前端发送的图像解压缩、预处理,利用支持向量机(SVM)算法检测是否含有路牌。检测到路牌之后对路牌区域进行提取,对提取后的路牌进行图像处理,然后利用投影法对文字进行分割,最后进行文字识别。其中文字识别部分采用的是目前流行的深度学习框架——CAFFE框架,主要采用C++/CUDA高级语言来实现对深度学习网络的训练和文字的识别。云端服务器程序流程图如图4所示。

4 基于卷积神经网络的文字识别算法

卷积神经网络(CNN)是深度学习领域的一个重要算法,在很多应用上表现出卓越的效果[2-3]。目前字符识别算法有很多种,但对汉字的识别,特别是自然场景的文字识别都有一定的局限[4-5]。将多种文档字符识别算法与CNN比较,会发现CNN算法比其他算法的效果都好。在本文的智能路牌识别系统中,主要利用CNN对日常生活中常见的3 000个汉字进行训练然后识别。CNN是在BP神经网络的结构上改进得到的,它们都是采用了向前传播计算网络的输出值,通过误差计算公式,向后传播修正权重和偏置的值。与传统的特征提取方法相比,CNN最大的改进就是卷积神经网络是利用卷积核进行特征提取,相邻层之间不是全连接,而只是部分进行连接,从而得到局部特征。在一个特征平面采用权值共享机制,很大程度上减少了权值的数量。

本文设计的网络结构如图5所示,输入的数据为一张40×40像素的图片,第一层为卷积层,由64个3×3卷积核组成,每个卷积核都各自提取不同的一种特征,通过输入与卷积核运算来提取图像的局部特征。然后进入池化层,在2×2的窗口中选取最大值作为一个输出值,从而降低了数据维度。以此类推,计算第二层128个卷积核和第三层256个卷积核的卷积运算。全连接层分别采用4 096和3 000个1×1的卷积核进行全连接来提取图片文字的全局特征进行分类。然后根据误差输出公式进行误差计算,反向进行权值和偏置更新。为了防止过拟合,采用dropout对网络权值和偏置进行部分更新。反复进行计算多次实现对网络参数进行训练的目的。

在智能路牌识别系统中,挑选日常常用的3 000个汉字进行了训练,基于国家标准规定——道路路牌采用方正黑体格式汉字,实验中通过计算机生成了相应图像数据。利用C#语言生成40像素×40像素的汉字图片作为测试集和训练集,如图6所示。

考虑到前端采集模块在实际采集图片时会出现各种干扰,如硬件发热、外界环境干扰、光线的亮暗等因素的影响,使得图像带有噪声点、图片模糊、字迹不清或者产生旋转和扭曲等状况,因此,需将生成的每个汉字图像进行图像处理,分别对其进行各种随机的噪声点生成、腐蚀膨胀以及不同角度的旋转和扭曲。这样对每一个汉字图片产生300张不同的图片,获得了更多的数据量,这样测试集和训练集一共有900 000个数据。通过图5所示的卷积神经网络进行训练。

5 系统的测试与分析

由于现在路牌场景种类繁多,测试实验中采用比较规范、应用比较多、文字方向从左自右的路牌进行实验。如图7(a)所示,对前端发送到服务器的图像,先通过Canny算子边缘检测粗定位和MSER算法细定位,使用SVM算法来判断是否含有路牌,判断出路牌标识后对图像进行路牌区域提取。

路牌区域提取采用基于HSI颜色空间的方法。基于我国以绿底和蓝底作为路牌的背景,采用HSI空间中的H分量将路牌区域提取出来。本实验将H参数设定在[150,190]区间,得出实验结果如图7(b)所示。

在文字检测部分,采用Canny算子进行边缘检测[6],提取汉字的边缘,然后用形态学对汉字进行处理,将文字与文字分开同时将文字的各个部分进行连接,以便于进行文字分割。在文字分割部分,采用投影法,根据像素值的特征进行分割。首先对路牌进行二值化处理,先进行水平投影像素值相加,进行行分割,分割效果如图8所示。

然后竖直方向投影进行像素值相加,进行竖直方向分割,分割效果如图9所示。通过连通区域算法分析得到各个文字区域,最后归一化为40像素×40像素图像,送入深度学习卷积神经网络进行分类识别。

采用本实验设计的网络结构,将数据集的800 000个数据作为训练集,100 000个数据集作为测试集,在云服务器上迭代8 000次,得到99%的准确率,测试的准确率和损失值如图10所示,当迭代次数达到900次左右时,准确率趋于平稳,由此可见CNN在路牌汉字识别上具有优势和潜在的应用价值。

6 结论

本文完成了智能路牌识别系统从硬件到软件的设计,实现了硬件的图像采集压缩和软件的图像处理、区域检测和文字分割,最后通过语音模块播报给使用者的功能。该系统对驾驶者有十分重要的作用,并可运用在无人驾驶领域,对新世纪的智能交通也将做出突出的贡献。本文系统未考虑前端动态拍摄时的模糊图像处理问题,即当车辆行驶太快情况下,前端采集的图像可能会不清晰,这也是下一步将努力的方向。

参考文献

[1] GONZALEZ A,BERGASA L M,YEBES J J.Text detection and recognition on traffic panels from street-level imagery using visual appearance[J].IEEE Transaction on Intelligent Transportation Systems,2014,15(1):228-238.

[2] 王恺,靳简明,史广顺,等.基于特征点的汉字字体识别研究[J].电子与信息学报,2008,30(2):272-276.

[3] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175-184.

[4] 孙彩虹.自然场景中路牌汉字识别技术研究[D].南京:南京理工大学,2014.

[5] 刘居锋.自然场景中交通标志文字检测算法研究[D].北京:北京理工大学,2014.

[6] 曾俊.图像边缘检测技术及其应用研究[D].武汉:华中科技大学,2011.

作者信息:

林付春,刘宇红,张达峰,张荣芬

(贵州大学 大数据与信息工程学院,贵州 贵阳550025)

 

(0)

相关推荐

  • 百度又一神器面世!网友:牛逼炸了...

    Python爱好者社区 2021-10-31 00:49 自动驾驶.泛电商.互联网金融认证等这些全球最火爆的产业成功背后的关键技术是什么?各大厂攻城狮们年薪百万的秘籍又是什么?而我们又如何能在&quo ...

  • ​有内味!上厕所用纸也要刷脸

    人脸识别应用已经司空见惯,刷脸支付.刷脸住宿登记.刷脸登机--这些或许可以接受,但如果上个厕所.健个身.进动物园也要刷脸,你接受吗? 事实是,越来越多的地方都在索取我们的脸,上海有的公厕需要刷脸才能取 ...

  • 应用图像识别技术的GIS开关触头位置监测系统

    征稿通知 第四届轨道交通电气与信息技术国际学术会议 阅读征文通知,请戳上面标题  ▲ 联合主办 中国电工技术学会 北京交通大学轨道交通控制与安全国家重点实验室 联合承办 中国电工技术学会轨道交通电气设 ...

  • Uber测试车撞人致死,无人驾驶技术离我们有多远?

    科幻电影里的自动驾驶技术让大家心驰神往,近几年,随着人工智能的技术提升,无人驾驶汽车从我们的幻想成为了现实.车企.互联网企业纷纷涌入这个全新领域. 刚结束的两会,百度董事长李彦宏乐观地表示明年,百度和 ...

  • 基于FPGA和DSP的高速实时轨道巡检图像采集处理系统

    随着我国铁路高速发展,高铁总里程已跃居世界第1位,维修养护压力也日益凸显.在高速铁路的日常维护中,线路上的钢轨.扣件.应答器.轨腰塞钉等轨道设施需要大量的人工进行检测.然而,由于人工巡道作业存在检测条 ...

  • 【学术论文】深度学习中的卷积神经网络系统设计及硬件实现

    摘要 针对目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢.耗时长的问题,采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统.该系统采用修正线性单元(ReLU) ...

  • 【学术论文】基于深度学习的人体行为识别算法

    摘要: 为改善人体行为识别任务中准确率低的问题,提出了一种基于批归一化的卷积神经网络(CNN)与长短期记忆(LSTM)神经网络结合的神经网络.CNN部分引入批归一化思想,将输入网络的训练样本进行小批量 ...

  • 一种基于深度学习的青铜器铭文识别方法

    摘要:考古出土的青铜器铭文是非常宝贵的文字材料,准确.快速地了解其释义和字形演变源流对考古学.历史学和语言学研究均有重要意义.青铜器铭文的辨识需要综合文字的形.音.义进行研究,其中第一步也是最重要的一 ...

  • 【每周CV论文】深度学习文本检测与识别入门必读文章

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 文本检测和识别是计算机视觉的一个非常重要的应 ...

  • 【学术论文】基于深度学习的复杂分拣图像快速识别方法研究

       摘 要 : 训练速度更快.识别精准度更高的图像识别技术一直是智能技术的研究热点及前沿.针对物流分拣仓库环境复杂.照明度不高以及快递外包装区别不明显的特点,对基于深度学习的分拣图像快速识别进行了研 ...

  • 【学术论文】基于深度学习的图像分类搜索系统

    摘要: 图像分类是根据图像的信息将不同类别的图像区分开来,是计算机视觉中重要的基本问题,也是图像检测.图像分割.物体跟踪.行为分析等其他高层视觉任务的基础.深度学习是机器学习研究中的一个新的领域,其动 ...

  • 【学术论文】基于深度学习的人脸活体检测算法

    摘要: 身份认证技术有了很大的发展,随之不断出现的是各种伪造合法用户信息的欺诈手段.针对这一问题,提出一种基于深度学习人脸活体检测算法,分析了真实人脸和欺诈人脸之间的区别,将真实人脸和照片进行数据去中 ...

  • 【学术论文】基于深度学习的胸部X光影像分析系统

    摘要 提出一种应用嵌入式技术和深度学习技术实现对胸部X光影像分析的设计方案.采用NIVIDIA公司生产的Jetson TX2作为核心板,配备以太网模块.WiFi模块等功能模块搭建该分析系统的硬件平台. ...

  • 【学术论文】基于深度学习的烟雾识别研究

    摘要 基于Google第二代人工智能学习系统TensorFlow构建神经网络对烟雾图像进行识别检测,通过改进的运动检测算法截取疑似烟雾区域图像,并结合PCA降维算法和Inception Resnet ...