用于票据文档定位格的手写体标记符号检测方法技术

技术编号:7917898 阅读:503 留言:0更新日期:2012-10-25 02:54
本发明专利技术涉及一种用于票据文档定位格的手写体标记符号检测方法,其包括如下步骤:a、获取票据文档的图像;b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;c、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。本发明专利技术操作方便,检测精度高,具有较好的通用性及鲁棒性。

【技术实现步骤摘要】

本专利技术涉及一种符号检测方法,尤其是一种,属于图像处理的

技术介绍
在各类社会活动中,利用模式识别技术对各种票据进行自动分析、验证、检索和识另IJ,对于确保相关业务安全、提高工作效率、增加处理准确性都具有非常重要的现实意义。票据自动处理技术以其较高的学术价值和应用价值近年来受到国内外众多研究机构以及学者的广泛重视,该技术主要包含了两方面的内容,第一,票据图像版面的预处理,它是各类票据图像内容理解和识别的前提和基础;第二,对预处理后的图像内容进行分析和识别,它是检验票据自动处理技术性能好坏的标准。 表格型票据是一种结构化的特殊文档,输入的信息被规范在预先印制好的表格框线所指示的区域内,这些框线为票据文档要素区域的定位和识别提供了重要的辅助信息。然而在实际应用中,如何动态检测指定区域内容并获取特殊字符的识别结果,是表格型图像处理工作的难点。实际票据图像的扫描位置、背景、票面受污染程度等情况会造成许多干扰因素,这对于票据系统后期的自动识别处理产生较大的影响,因此准确可靠的框线检测结果,是票据处理方法的基础。票据图像的框线检测主要用到直线检测技术,目前常用的直线检测方法主要有基于Hough变换的方法、连通域分析法、矢量化方法以及通过对笔画和框线交叠处的局部图像区域进行分析从而完成框线检测等。以上方法具有定义简单,物理意义明确,易于检测、存储和处理等优点,在一定条件下可以快速、准确地提取直线。然而在上述传统方法的处理中,部分重要的局部边缘等细节特征难以被有效表达,以致复杂噪声背景下的框线检测工作时常失效。
技术实现思路
本专利技术的目的是克服现有技术中存在的不足,提供一种,其操作方便,检测精度高,具有较好的通用性及鲁棒性。按照本专利技术提供的技术方案,一种,包括如下步骤a、获取票据文档的图像;b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;C、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。所述步骤a中,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像。所述步骤b中,包括如下步骤bl、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理;b2、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像;b3、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换; b4、对上述离散脊波反变换后的图像进行闭运算处理;b5、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。所述步骤c中,包括如下步骤Cl、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为SIN_T = sin (iXO. I XPI/180), C0S_T = cos (iXO. 1XPI/180),其中,PI为圆周率,i表示投影角,i G (-Angle, Angle);c2、在投影角度(-Angle,Angle)的范围内,根据投影公式C0S_T XBuffX+SIN_T XBuffY计算投影值并记为 Proj_idx,同时对计数数组Projline 进行累加;c3、取投影轴中点Proj_mid,在投影轴中点Projjnid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Pro j_Nul lZero_L和左侧最大投影值Pro j_NullZero_LMax ;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Pro j_NullZero_RMax ;c4、当 Pro j_Nul lZero_L 等于 int (C0S_T X BuffX +SIN_T XBuffY)时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R 等于 int(C0S_TXBuffX+SIN_TXBuffY))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值Dl ;c5、将本次投影角度i下最佳边界点之间的跨度值Dl与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值Dl最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;c6、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。所述步骤d中,包括如下步骤dl、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;d2、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;d3、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;d4、提取出票据文档图像中打勾定位格区域。 所述步骤e包括如下步骤el、对提取的打勾定位格区域进行闭运算;e2、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;e3、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮 廓,并对所述最大面积轮廓进行标记、存储;e4、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。"0 0 0 0 0" '0 110] 0 0 2 0 0所述卷积模板为 p I Ol ^ 0 2 2 0或A=O 2 4 2 O。 A= 020、— 0220 0 0 2 0 0 0I OJ 1_0 I I O」 = sin (i X0. I XPI/180), C0S_T = cos (i X0. I XPI/180),其中,PI为圆周率,i表示投影角,i G (-Angle,Angle);此处,投影角度范围为(-Angle,Angle),投影角度范围可以票据文档图像进行确定,一般为(-20°,20° );c2、在投影角度(-Angle,Angle)的范围内,根据投影公式C0S_、T XBuffX+SIN_T XBuffY计算投影值并记为 Proj_idx,同时对计数数组Pr0jline进行累加;投影时,投影角度i在投影角度范围内遍历,投影角度i的遍历步长可以根据需要进行设置,步长较小时会增大计算量;此处,本文档来自技高网...

【技术保护点】
一种用于票据文档定位格的手写体标记符号检测方法,其特征是,所述手写体标记符号检测方法包括如下步骤:(a)、获取票据文档的图像;(b)、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;(c)、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;(d)、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;(e)、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。

【技术特征摘要】

【专利技术属性】
技术研发人员:沈志明宋晓宁刘梓
申请(专利权)人:江苏尚博信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1