一种人民币冠字号自动识别方法技术

技术编号：16271182 阅读：194 留言：0更新日期：2017-09-22 22:45

本发明专利技术公开了一种人民币冠字号自动识别方法，其通过对人民币图像结构布局的深刻认识，设计实现了一套能准确识别人民币边缘、朝向和冠字号区域的算法。本发明专利技术通过高效的算法实现和精心设计的处理步骤，借助成熟OCR引擎的功能，大大提升了冠字号识别的速度；通过对OCR引擎识别效果科学的统计分析和对冠字号模式的认识，综合利用多个引擎的优势，成功的将成熟的开源OCR引擎应用于冠字号识别这一特定领域，并且保证了冠字号识别的准确率，提供了极高的识别速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种人民币冠字号自动识别方法
本专利技术属于金融OCR(OpticalCharacterRecognition，光学字符识别)
，具体涉及一种人民币冠字号自动识别方法。
技术介绍
OCR是利用光学技术对文字和字符进行扫描，获取文字和字符的图像信息，利用各种模式识别算法对文字形态特征进行分析，获取文字及版面特征信息的过程。随着OCR技术的逐渐成熟，OCR技术开始应用于各个领域，如证件识别、车牌识别、票据识别、银行卡识别、文档识别等，在银行、保险、金融、物流、审计、税务、海关、公安、边检等众多行业都已经形成了成熟的OCR产品。OCR技术的应用减少了设备的配置，降低了人力成本，提高了工作效率。随着中国经济的发展，人民币的监测和管理工作面临越来越大的压力，而人民币的监测和管理关键在于冠字号的管理。冠字号码是用于统计钞票印制数量、标记钞票唯一性的一种符号，由冠字和号码两部分组成，表示钞票的印制数量。人民币一般实行“一票一号”，冠字号码代表着每张钞票独一无二的身份，成了每张人民币的身份证。利用冠字号码的唯一性，在自动柜员机配钞过程中，把这些纸币的冠字号码采集、记录下来，就可以进行查询和统计。因此，在出现假币纠纷时，只要在管理平台中核对一下交易时钞票的冠字号码，就可以证明假币是否来自自动柜员机。随着光学字符识别技术的广泛应用，人民币冠字号识别和追踪已经成为金融领域一种防止经济犯罪的重要手段。根据央行营业管理部要求，银行的ATM和存取款一体机都必须实现人民币冠字号记录功能。目前银行ATM机、存取款循环一体机、金融机构柜台付出的100元面额人民币冠字号码都必须可查询。...
一种人民币冠字号自动识别方法

【技术保护点】
一种人民币冠字号自动识别方法，包括如下步骤：(1)首先采集人民币的灰度图像，进而对该灰度图像进行纸币边缘识别得到人民币的四边形轮廓；(2)基于透视变换对人民币的四边形轮廓进行裁剪及矫正，以得到人民币的矩形图像；(3)基于颜色分布情况对人民币矩形图像的朝向进行识别及矫正，以得到正面朝上的人民币矩形图像，对于反面的人民币矩形图像则直接丢弃；(4)对正面朝上的人民币矩形图像进行冠字号区域边界探测，以定位得到所要识别的冠字号区域；(5)对冠字号区域图像进行预处理，依次包括图像二值化、字符切割、直方图拉伸以及连通分量分析，得到冠字号的各个字符图像；(6)针对人民币冠字号字符利用开源的OCR引擎Tesseract提供的训练工具进行训练，得到用于识别冠字号字符的专有引擎；(7)利用所述专有引擎以及OCR引擎Tesseract中自带识别拉丁字符的原生引擎对步骤(5)中得到的各个字符图像进行识别，以得到各字符图像所对应的候选字符列表及各候选字符的置信度；(8)根据冠字号的组合特点以及置信度，从候选字符列表为各字符图像选取一个字符作为其识别结果。

【技术特征摘要】
1.一种人民币冠字号自动识别方法，包括如下步骤：(1)首先采集人民币的灰度图像，进而对该灰度图像进行纸币边缘识别得到人民币的四边形轮廓；(2)基于透视变换对人民币的四边形轮廓进行裁剪及矫正，以得到人民币的矩形图像；(3)基于颜色分布情况对人民币矩形图像的朝向进行识别及矫正，以得到正面朝上的人民币矩形图像，对于反面的人民币矩形图像则直接丢弃；(4)对正面朝上的人民币矩形图像进行冠字号区域边界探测，以定位得到所要识别的冠字号区域；(5)对冠字号区域图像进行预处理，依次包括图像二值化、字符切割、直方图拉伸以及连通分量分析，得到冠字号的各个字符图像；(6)针对人民币冠字号字符利用开源的OCR引擎Tesseract提供的训练工具进行训练，得到用于识别冠字号字符的专有引擎；(7)利用所述专有引擎以及OCR引擎Tesseract中自带识别拉丁字符的原生引擎对步骤(5)中得到的各个字符图像进行识别，以得到各字符图像所对应的候选字符列表及各候选字符的置信度；(8)根据冠字号的组合特点以及置信度，从候选字符列表为各字符图像选取一个字符作为其识别结果。2.根据权利要求1所述的人民币冠字号自动识别方法，其特征在于：所述步骤(1)中对人民币的灰度图像进行纸币边缘识别，具体过程如下：1.1对人民币的灰度图像进行中值滤波处理；1.2将滤波后的灰度图像进行膨胀处理；1.3将膨胀后的灰度图像进行二值化处理；1.4对二值化图像采用Suzuki85算法进行轮廓识别，得到图像中面积最大的外部轮廓；1.5利用道格拉斯-普克算法对该外部轮廓进行四边形近似或检测其最小外接矩形，从而得到人民币的四边形轮廓。3.根据权利要求1所述的人民币冠字号自动识别方法，其特征在于：所述步骤(4)中对人民币矩形图像进行冠字号区域边界探测，具体过程如下：4.1按照465×231的尺寸对人民币矩形图像进行重采样得到其缩略图；4.2选定缩略图中第5列第168行像素点为冠字号区域的左上顶点，以该顶点为基准选定高为33宽为116的区域为RO...

【专利技术属性】
技术研发人员：尹建伟，赵景晨，岑超，邓水光，李莹，吴健，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人