一种带污损票据的字符识别方法及系统技术方案

技术编号:17813177 阅读:30 留言:0更新日期:2018-04-28 05:45
本发明专利技术公开了一种带污损票据的字符识别方法及系统。该方法包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。

【技术实现步骤摘要】
一种带污损票据的字符识别方法及系统
本专利技术涉及字符识别
,尤其涉及一种带污损票据的字符识别方法及系统。
技术介绍
票据文件在采集图像的过程中,图像经常会带有污损,也容易出现倾斜,污损和倾斜都会对票据文件中字符号码的识别造成一定的干扰,降低票据文件中字符号码识别的准确性。
技术实现思路
本专利技术提供了一种带污损票据的字符识别方法及系统,该方法及系统可以排除污损对字符识别的干扰,准确识别字符的轮廓,提高字符识别的准确率。为实现上述设计,本专利技术采用以下技术方案:一方面,提供了一种带污损票据的字符识别方法,包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。其中,所述根据所述质心纵坐标和周长识别字符的轮廓,包括:根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;根据所述聚类分析的结果识别字符的轮廓。其中,所述根据所述字符的轮廓对所述字符进行识别,包括:根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。其中,所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。其中,所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。其中,所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:其中,所述θ表示倾斜角,p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,表示字符的重心坐标。其中,所述获取带污损的字符票据图像的所有轮廓,包括:对带污损的字符票据图像进行滤波;获取滤波后的字符票据图像的所有轮廓。另一方面,提供了一种带污损票据的字符识别系统,包括:第一获取单元,用于获取带污损的字符票据图像的所有轮廓;第一计算单元,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;第一识别单元,用于根据所述质心纵坐标和周长识别字符的轮廓;第二识别单元,用于根据所述字符的轮廓对所述字符进行识别。其中,所述第一获取单元包括:滤波单元,用于对带污损的字符票据图像进行滤波;第二获取单元,用于获取滤波后的字符票据图像的所有轮廓;所述第一识别单元包括:聚类分析单元,用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;第三识别单元,用于根据所述聚类分析的结果识别字符的轮廓;所述第二识别单元包括:第二计算单元,用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;矫正单元,用于根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。其中,所述矫正单元包括:直接识别单元,用于当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;矫正识别单元,用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;结束识别单元,用于当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作;所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:其中,所述θ表示倾斜角,p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,表示字符的重心坐标;所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。本专利技术的有益效果为:本专利技术实施例通过获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。图2是本专利技术具体实施方式中提供的一种带污损票据的字符识别方法的第二实施例的方法流程图。图3是本专利技术具体实施方式中提供的一种带污损票据的字符识别系统的第一实施例的结构方框图。图4是本专利技术具体实施方式中提供的一种带污损票据的字符识别系统的第二实施例的结构方框图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其是本专利技术具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。如图所示,该方法包括:步骤101:获取带污损的字符票据图像的所有轮廓。所述获取带污损的字符票据图像的所有轮廓,包括:对带污损的字符票据图像进行滤波;获取滤波后的字符票据图像的所有轮廓。对带污损的字符票据图像进行滤波,能有效消除图像上的噪声。可选地,对带污损的字符票据图像进行滤波,具体为:对带污损的字符票据图像采用高斯滤波方法进行滤波;对带污损的字符票据图像进行滤波的滤波方法还可以为:均值滤波、中值滤波、低通滤波、高通滤波和最大均匀性平滑滤波等。可选地,获取滤波后的字符票据图像的所有轮廓,具体为:采用边缘检测算法获取滤波后的字符票据图像的所有轮廓;获取滤波后的字符票据图像的所有轮廓的方法还可以为:分水岭算法、先验知识法、数学形态法等。通过图像滤波、边缘检测能有效去除图像的污损干扰。步骤102:计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。步骤103:根据所述质心纵坐标和周长识别字符的轮廓。所述根据所述质心纵坐标和周长识别字符的轮廓,包括:根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;根据所述聚类分析的结果识别字符的轮廓。字符票据图像中,字符的轮廓具有一定的特征,例如:一组字符通常排成一行,因此即使图像中的字符出现倾斜,这组字符轮廓的质心纵坐标基本成直线分布;字符轮廓的周长在一个长度范围内,且通常情况下,字符轮廓的周长相对污损轮廓的周长较长。当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征,且周长满足字符轮廓的周长长度时,则识别出这个轮廓属于字符轮廓;否则这个轮廓不属于字符的轮廓,属于污损聚类;从而就可以识别出所有轮廓中属于字符的轮廓。步骤104:根据所述字符的轮廓对所述字符进行识别。所述根据所述字符的轮廓对所述字符进行本文档来自技高网...
一种带污损票据的字符识别方法及系统

【技术保护点】
一种带污损票据的字符识别方法,其特征在于,包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。

【技术特征摘要】
1.一种带污损票据的字符识别方法,其特征在于,包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。2.根据权利要求1所述的方法,其特征在于,所述根据所述质心纵坐标和周长识别字符的轮廓,包括:根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;根据所述聚类分析的结果识别字符的轮廓。3.根据权利要求1所述的方法,其特征在于,所述根据所述字符的轮廓对所述字符进行识别,包括:根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。4.根据权利要求3所述的方法,其特征在于,所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。5.根据权利要求4所述的方法,其特征在于,所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。6.根据权利要求3所述的方法,其特征在于,所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:其中,所述θ表示倾斜角,p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,表示字符的重心坐标。7.根据权利要求1所述的方法,其特征在于,所述获取带污损的字符票据图像的所有轮廓,包括:对带污损的字符票据图像进行滤波;获取...

【专利技术属性】
技术研发人员:翟云龙
申请(专利权)人:深圳怡化电脑股份有限公司深圳市怡化时代科技有限公司深圳市怡化金融智能研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1