当前位置: 首页 > 专利查询>北京大学专利>正文

圆形印章的印鉴图像检索方法技术

技术编号:2926849 阅读:297 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种圆形印章的印鉴图像检索方法,属于印章图像自动检索技术领域。该方法包括印章主文字区域提取,对印章主文字进行分割,提取印章主文字中单个文字的特征,利用印章主文字信息建立参考章数据库,以及输入印章图像与参考章数据库中的参考章匹配,自动检索到与输入印章图像相对应的参考章。本发明专利技术解决了传统印章鉴别系统的瓶颈问题,即由不可避免的手工输入ID阶段所造成的人工和时间损耗。同时,本发明专利技术所涉及的汉字识别方法不受汉字模糊不全的影响,可以得到很高的正确率结果。

【技术实现步骤摘要】

本专利技术属于印章图像自动检索
,具体涉及一种。
技术介绍
在很多东方国家,每天都有数以万计的印章图像需要鉴别。在这些鉴别过程中,系统 通过比较一个输入的印章图像和它的参考章,来鉴别输入印章图像的真伪性。但是,在这 个过程之前,输入印章图像的对应参考章通常是通过手工找到的,每一个参考章都配有一 个很长的ID,将这些ID号一个一个地输入来获取所需的参考章需要很长时间。而这一手 动过程恰恰成为自动印鉴鉴别系统的技术瓶颈。
技术实现思路
本专利技术的目的是提供一种,采用该方法可以自动而快速 地检索出与输入印章相对应的参考章。本专利技术的
技术实现思路
一种,其歩骤包括-1) 印章主文字区域提取,该歩骤的具体操作为a) 首先将二值化后的圆形印章图像沿一半径展开成矩形;b) 去除矩形图像中由于印章边界构成的噪声,得到括印章主文字的区域; C)将矩形图像中的印章主文字按照顺序从左到右排列;2) 印章文字间分割和文字特征提取,该歩骤的具体操作为a) 根据相关性原理,将矩形图像中的印章主文字按单字分开;b) 利用汉字识别方法,定义印章主文字的单字特征,并提取每个单字信息,得到印章主文字信息;3) 输入参考章,按照上述歩骤l)和2),得到每个参考章的印章主文字信息,建立参 考章数据库;4) 输入印章图像和参考章数据库中的参考章匹配,该步骤的具体操作为a) 执行上述歩骤l)和2),按照与参考章一致的单字特征提取输入印章的主文字信息;b) 比较输入印章与参考章的主文字字数是否一致,字数一致为匹配必要条件; C)搜索与输入印章图像最匹配的参考章,定为输出结果。所述歩骤l)中,生成的矩形图像的h ^像素与圆形印章图像中X、少像素的关系为<formula>formula see original document page 5</formula>,其中,Xfl、,是圆形印章的中心坐标,r是其半径,~如圆形印章中还包括一直线排布的文字,该文字为非主要文字,在所述步骤l中,需 进一歩去除矩形图像中的上述4-主要文字区域。另,去除矩形图像中的非主要文字区域,得到印章主文字区域的具体操作为1) 对矩形图像进行横向扫描,标记所有没有W景像素的列;2) 将相邻的前景像素的列合在一起,得到一组空白区域,同时找到一个或两个空白区 域,分别定义为区域a和区域b。3) 比较区域a和区域b,确定较宽的一个部分为印章的主文字区域;4) 保存印章的主文字区域。所述去除矩形图像屮由于印章边界构成的噪声的具体操作为1) 对矩形图像的上半部分进行纵向扫描,依次计算其每一行的前景像素个数;2) 将具有最少前景像素个数的行进行标记;3) 将所述标记行以上的所有前景像素更改为背景像素。所述歩骤2中,将矩形图像中的卬章主文字按单字分开的相关性函数为.A./) = 5>(f)x"(/+/),其中,i (i=l,2,...,I)代表主文字区域图像中的列号,1是总共的列数。a(i)代表每--列前景像素的个数。f(j)是相关性变换的结果。函数f(j)如下图所示, j=l,2,3,...,l/2。所述歩骤2中,汉字识别方法分为结构模式识别方法、统计模式识别方法、统计与结 构相结合的识别方法以及人工神经网络方法。所述印章主文字的巾.字特征是字的横向和纵向的甜景像素个数最多,次多,次少,最 少的行。所述与输入印章图像最匹配的参考章是指,两个印章图像相似度的权重值最大,即一的权重,每-一个特征的权重按大小分为3类,,可以分别取值为a" &或者A (a/〉化〉"》, ^,(/=1,2;/=1,2...8)來自位置码pc,Z代表不同的印章,y代表不同的特征,^,&和^为实验得到的类别分界线(~</72<&)。"<formula>formula see original document page 5</formula>之 本专利技术的技术效果本专利技术解决了传统印章鉴别系统的瓶颈问题,即由不可避免的手工输入ID阶段所造 成的人工和时间损耗。同时,本专利技术所涉及的汉字识别方法不受汉字模糊不全的影响(因 为印章图像的特殊性,其中汉字经常因为印章加盖力度,油墨等原因造成模糊现象),对 于加盖模糊的印章图像,本专利技术仍然可以得到正确率很高的结果。 附图说明下面结合附图,对本专利技术做出详细描述。图1为本专利技术的流程图;图2为二值化圆形印章图像;其中,(a)为带有直线排布文字的圆形印章图像;(b) 为普通的圆形印章图像;图3为圆形印章图像转换为矩形图像示意图,(a)为圆形印章图像;(b)转换后的矩 形图像-,图4为图1转换为矩形图像的示意图; 图5为图1的印章主文字区域示意图;图6为印章主文字间分割方法中计算的单字宽度示意图;图7为印章主文字的单字分割示意图; 图8为本专利技术实施例中定义的单字特征。具体实施方式参考图1,本专利技术包括如下歩骤 1、印章主文字区域提取。圆形常规印章可分为2类,如图2所示, 一类为除主文字区域外还有其余汉字的印章 (a),图中"实验专用章"为非主文字区域,不进入下一处理阶段。 一类为印章上所有汉 字都属于主文字区域(b)。圆形常规印章受形状所限,并不利丁直接进入下一歩处理,本专利技术的第一步是将二值化后的圆形印章图像沿一条半径展开成矩形。对于得到的矩形图形,还需要利用圆形常规印章的主文字排布特征,去除掉其中由印章边界构成的噪声或其他非主要文字区域,并将主文字按顺序从左到右排好。 具体需要以下歩骤来完成纵向上,主要的目的是去除一些由印章边界构成的干扰前景像素。借助在主文字和干 扰像素之间的 -条明显空白区域,具体实施为对于矩形图像的上半部分,依次计算每一 行的前景像素个数,并将具有最少前景像素个数的行标记。接下来,将标记行以上的所有前景像素更改为背景像素,这样就完成了纵向阶段。在图4中可以看到,对于(a)印章,主文字区域位于纵向最宽的两个空白区域之间, 向对于(b)印章,主文字区域是从纵向最宽区域的尾部到它的头部。横向处理过程如下1) 在纵向处理过程后,对矩形图像的每一列像素进行扫描,标记所有的空白列(即 没有前景像素的列)。2) 将相邻的空白列合在一起,这样得到一组空白区域,同时找到最宽及次宽的两个 宁白区域,分别定义为区域a和区域b。3) 如果区域a和区域b的宽度差小于 -个阈值t,这个印章为普通圆形印章,进入步 骤4,否则,印章归为带有直线排布文字的圆形印章图像,进入步骤5。4) 在区域a和区域b之间有两个部分,较宽的一个部分即为印章的主文字区域,得 到它后,进入歩骤6。5) 主文字区域的获得只需借助区域a,它从区域a的尾部一直持续到区域a的头部。6) 保存所得到的主文字区域。需要注意的是,尽管圆形印章已经被转换为矩形图像,矩形图形的最左侧和最右侧最 初是连接到一起的,也就是说,当必要的时候,将矩形图像的最右侧和最左侧作为一个整 体处理,如图5所示。针对如何展开问题如图3和下面公式所示,所生成的矩形图像有m像素宽,n像素高(^0,1,2,...,&1; 0=0,0.5,1,1.5,2,2.5,...,359.5), (x",^)是圆形印章的中心坐标,r是其半径。在这里r, =r/2, r2本文档来自技高网...

【技术保护点】
一种圆形印章的印鉴图像检索方法,其步骤包括:1)印章主文字区域提取,该步骤的具体操作为:a)首先将二值化后的圆形印章图像沿一半径展开成矩形;b)去除矩形图像中由于印章边界构成的噪声,得到包括印章主文字的区域;c)将矩形图像中的印章主文字按照顺序从左到右排列;2)印章文字间分割和文字特征提取,该步骤的具体操作为:a)根据相关性原理,将矩形图像中的印章主文字按单字分开;b)利用汉字识别方法,定义印章主文字的单字特征,并提取每个单字信息,得到印章主文字信息;3)输入参考章,按照上述步骤1)和2),得到每个参考章的印章主文字信息,建立参考章数据库;4)输入印章图像和参考章数据库中的参考章匹配,该步骤的具体操作为:a)执行上述步骤1)和2),按照与参考章一致的单字特征提取输入印章的主文字信息;b)比较输入印章与参考章的主文字字数是否一致,字数一致为匹配必要条件;c)搜索与输入印章图像最匹配的参考章,定为输出结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘宏陆叶吴奇刘凡
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1