银行OCR识别处理技术的研究与开发
一、立项依据
㈠ 国内外现状、水平和发展趋势
OCR是Optical Character Recongnition的缩写,就是光学字符识别技术。
在高速的信息化过程中,电脑芯片级别越来越高,运算能力也越来越强。工作流程的不断优化,计算机网络遍及信息化建设的方方面面,这些都让银行信息化在软件和硬件两个方面起到了突飞猛进的发展。
信息化的飞速发展造成各行各业的竞争更加的激烈,对于银行业更是如此。对于银行来说,每日营业大厅的柜台前端受理的业务,不仅种类繁多,并且业务量也非常大,因此,银行的信息输入输入速度直接决定了其信息化程度,也直接影响了银行的工作效率,间接影响银行整体形象。
银行业为应对行业信息化的发展,以及面临更加严峻的竞争环境,必须通过改革,对业务方式,信息化建设等工作,提高自己的竞争力,这也是银行业接下来的发展方向。
㈡ 项目研究开发目的和意义
由于信息化的发展,和行业的发展,业务量的不断增加,依靠传统的工作方式和流程已经逐渐的不满足需要。由于社会发展,银行业务的不断扩充,造成业务量也在大幅度的不断增加,传统的工作模式造成业务办理时间过长,信息录入繁琐,失误或者错误率高等原因,导致工作效率低下,客户的意见大等后果。
根据现在的种种情况和不足,我们企业为了提高银行业的业务处理能力,提高竞争力,以及应对外资银行进入国内市场的冲击,采取多种措施,并且开发各样的新业务,为储户提供更加便捷的新服务,建议改善营业大厅的硬件设施,引进开发OCR光学字符识别技术,提高银行业的工作效率。人们只要在银行柜台上按照业务类型填写统一的表格,然后银行就可以利用OCR开发的票据表格字符识别系统,可对所采集的信息进行识别、录入、存储以及分类管理。通过改革作业方式,开发新的系统不断提高了工作效率,大大降低数据输入的失误或者错误率,更是提高了银行自身的综合竞争能力。
㈢ 项目达到的技术水平及市场前景
1、该系统实现字符、图像的识别;通过光学仪器后成为位图存于计算机中;进行影像的预处理,包括二值化、腐蚀、膨胀中值滤波等;
2、文字特征提取功能,用EXCEL统计特征,并根据字符特点,在不同区域采集数据;
3、对比识别,结果输出,根据不同区域的结果比较,找出最相近的字符;将相近的字符所对应的识别结果输出;
经过这项系统的研究开发可以促进银行业的发展,银行日常工作效率能够翻倍提高。实现银行业的信息化管理,促进行业的发展,为行业发展起到借鉴作用。
二、研究开发内容和目标
㈠ 项目主要内容及关键技术
本项目是基于中国银行OCR识别处理要求的需要进行设计,在设计初期完成系统功能模块的设计,同时要求银行进行协助,完善各模块的功能设计,使用户可以更简便、快捷的进行操作。在系统开发过程中,还需进行基础数据准备工作。对所有票据进行数据整理,准备数据导入。在系统测试阶段,需试运行主要业务模块。同时根据行业的特殊要求,对系统各模块功能再做相应修改或者扩充。
项目关键技术:
系统采用B/S(Browse/Server)方式,J2EE架构,客户端只需要安装浏览器(IE6.0以上)即可,其他客户端组件可以从应服务器自动安装,服务器(SERVER)有应用服务器,WEB服务器,数据库服务器,文档服务器,其中应用服务器与WEB服务器是合为一体的。客户端本地资源应用全部在浏览器内以PLUGIN方式进行。
㈡ 技术创新点:
1、通过光学扫描仪和计算机的配合,OCR软件将图象数据进行运算分类后,将图象数据转化为计算机内码。可以极大地减轻数据录入工作的强度、提高数据录入的速度。
2、通过扫描模块实现适合OCR的每一张票据的要素识别,产生识别结果和不可信数据,并写入索引服务器作为初步的主件索引以供后续处理。OCR的识别对象主要是机打数据、手写体数据及条码,包括账号、金额、机构号、日期、柜员号、交易代码等要素。识别出来的数据不仅作为凭证索引信息存入数据库,支持日后查询;而且生成后督流水与前台流水进行流水比对,是事后监督的数据来源。
3、系统基于参数化设计,对于用户新的需求,部分可由银行相关人员经授权后自行修改。如银行新增凭证可设置识别方法;对于凭证要素的增加、删减,可由系统管理员自行修改参数,以增加识别内容或减少识别内容,无须公司人员修改,同时系统保证原有凭证影像的查询和使用。
㈢ 主要技术指标或经济指标:
1、系统从整体上分为表现层、应用层、服务层、Domain层和持久层五层。
1)、表现层:表现层主要包括系统和用户交互的页面,使用的技术包括Jsp/Html/Applet以及jsp 标签库等。
2)、应用层:应用层用来控制表现层和服务层的交互以及UI的显示流程。使用的技术包括Servlet和javaBean。
3)、服务层:服务层是应用层访问业务逻辑的接口层,用来完成对业务流程、事务的封装。使用的技术包括:Session Bean.
4)、Domain层:Domain层是真正的业务实体,它封装实体以及实体间的关系。使用的技术包括:BMB,CMB。
5)、持久层:持久层控制对数据的存储,对于CMB,我们不用关心这一层,但对于BMP以及一些需要直接操作数据库的操作,需要进行访问的封装。例如:对于大量的只有查询没有操作的档案信息,考虑到效率,我们可能需要直接对数据集进行读取,就需要进行DAO封装。
2、在流水与影像建立对应关系的过程中,系统根据不同业务及其交易特点,充分利用系统内在查询进行影像匹配,最大限度减少人工参与。
本项目提供的技术方技术方案能够推助国内银行实现国际化模式,以科学的流程,先进的系统技术,简化繁复、分散的人工操作流程,进行集中管理,统一平台,减少人工,减少流程环节,实现模规效益,并且达到降低风险、提高效率、降低成本的社会及经济效益。
三、研究开发方法及技术路线
根据中行的需要以及实际的情况,我们银雁公司给予需要进行合作开发这项工艺系统,适应中行的管理。这项工作主要是我们进行自主进行研发,按照国家和行业的标准实现系统的自主开发,在确保中行的需要的前提下,并且具备很好适用性,保证与各个系统的匹配性和通用性。
1、根据现在行业发展的现状,以及中行信用卡业务发展的需要;结合本公司的实际情况和能力,承接中行信用卡影像的项目。并且根据需要进行该项目的需求分析,并且进行市场的调查,结合实际进行研讨分析,最终提出系统设计方案;
2、进行系统开发,并且进行测试,在开发测试过程中,根据客户需要再进行实际的调整和完善;在这个时期需要进行反复的调整和测试,客户需要收集当前使用的一些数据进行反馈实际测试的效果,并配合进行完善,最终达到使用的目标要求;这个设计测试过程需要将所有的数据进行记录,积累运行的原始数据;
3、根据系统的特点,对客户进行人才的培训,主要就是操作和日常维护的培训,并且输出人才;配合系统的维护和管理,并且反馈实际使用情况和效果,进行统计分析,再对系统进行长期的测试;
4、进行系统的试运行,并且进行长期的测试和投入使用,过程关注系统使用情况,及时解决客户关注的问题;运行达到要求并无异常后安排验收,并且进行周期的管理和维护;最终将系统设计、测试、运行等所有的数据进行整理,形成技术规范。