一种文字图像特征差异的快速计算方法技术

技术编号:9434799 阅读:105 留言:0更新日期:2013-12-12 00:48
本发明专利技术公开了一种文字图像特征差异的快速计算方法,首先基于几何形状特征的多样性,采用前景像素个数、文字大小、长宽比和占空比四个特征对差异较大的文字对进行初步筛选,这样从整体上对各种文字进行有效描述,同时减少图像失真带来的负面影响;在初步筛选之后,对剩下的配对进行精细特征描述,并采用修正的模板匹配方法,该方法通过在图像中滑动给定模板获取与模板相匹配的目标。经过粗特征筛选进入到精细模板匹配的文字块,彼此的大小差异受到粗特征中文字大小的制约,从而大大降低了匹配过程中的比较次数。进一步,提出了一种查找表联合位存储的加速方法,该方法根据相似性度量特点,通过预先建立文字块与数据的对应关系实现了性能提升。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,首先基于几何形状特征的多样性,采用前景像素个数、文字大小、长宽比和占空比四个特征对差异较大的文字对进行初步筛选,这样从整体上对各种文字进行有效描述,同时减少图像失真带来的负面影响;在初步筛选之后,对剩下的配对进行精细特征描述,并采用修正的模板匹配方法,该方法通过在图像中滑动给定模板获取与模板相匹配的目标。经过粗特征筛选进入到精细模板匹配的文字块,彼此的大小差异受到粗特征中文字大小的制约,从而大大降低了匹配过程中的比较次数。进一步,提出了一种查找表联合位存储的加速方法,该方法根据相似性度量特点,通过预先建立文字块与数据的对应关系实现了性能提升。【专利说明】
本专利技术属于计算机视觉和图像处理领域,涉及。
技术介绍
现有技术中针对大数据量特征的相似性度量方法,主要有以下几个方面:I)基于小波变换和相似性度量的视频文字识别,计算机工程与设计,2008,杨强,程玉昆,马森。该方法的处理对象为视频中的字幕,主要研究视频中字幕的提取与识别,用相似性度量的方法来识别视频字幕。首先对待匹配的字符图像和模板库中的字符图像分别作N级分解,并保留各级分解后的低频部分,接着用误差累加式粗略查找可能匹配的视频字符,重复上面的步骤直到找到误差最小的前10个字符,最后分别计算这10个字符的相关度,求得相关度最大的字符为所要匹配字符。2)基于二叉树相似性检测的变形文字识别研究.计算机工程与应用,2005,叶庆卫,汪同庆。该方法处理对象为艺术字,主要研究文字的变形处理不会改变文字内在的框架情况下的识别。首先利用最小生成树获得文字图像所对应的树型结构,然后约简非分叉节点,应用无序无标签二叉树之间的相似测度计算方法,与原文字图像所对应的约简树进行相关度分析,得到相似性度量结果。3)Text image matching without language model using a Hausdorffdistance.1nformation Processing&Management.Toni M.Rath and R.Manmatha该方法主要用于文字图像的检索,模板图像为目标图像的一个部分。首先对目标图像和模板图像进行归一化,然后分别提取它们的特征,得到特征向量,最后运用Hausdorff的距离度量方法从目标图像中检索到模板图像。4)Word image matching using dynamic time warping.CVPR2003.Hwa-JeongSon,Soo-Hyung Kimj J1-Soo Kim该方法主要是处理手写的扫描历史原稿,运用Dynamic Time Warping(DTW)算法进行模板匹配,得到需要查找的文字。虽然现有方法提出了许多相似性度量的方法,但没有针对大量扫描文字图像之间的相似性度量。
技术实现思路
本专利技术解决的问题在于提供,大量扫描文字图像之间相似性,并通过查找表联合位存储的加速算法来进行快速计算。本专利技术是通过以下技术方案来实现:,包括以下操作:I)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对;2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤:首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分;在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展;模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少;3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。所述的四个特征的提取方法为:前景像素个数,前景像素反映文字图像文字块的点阵分布,对于不同字号以及不同字形,前景像素的个数不同;文字大小,文字的长度和宽度是对文字大小最直接的刻画,如果两个文字在长度或者宽度上差异明显,则直接将其滤除; 长宽比,长宽比从整体上对文字形状进行刻画;占空比,占空比描述文字内部形状,为在二维图像中定义为前景像素在文字块中所占的比例,基于前景像素总数及文字大小,占空比通过下式得到:Drat=S/ (WXH)其中,S为前景像素总数,W为文字图像块的宽度,H为文字图像块的高度。所述通过占空比对相同语种下占空比差异较大的文字对进行剔除,同时也保证了对多语种文字对的可区分性。所述剔除一部分差异显著的文字配对的方法为:对于待比较的两个文字图像块,分别提取二者的前景像素个数、文字大小、长宽比以及占空比四个特征,选取数值较小的描述子作为1,较大的描述子作为2,并通过式(3)中的判断条件决定两个文字图像块是否存在较大差异;如果条件满足,则认为差异较大,将该文字图像对的相似性值赋为0,反之,将其采用模板匹配方法进行处理;W1-W2≥ 5 U H1-H2 ≥ 5U (S1ZSthr)U (Aratl/Arat2<thr)U (Dratl/Drat2<thr)(3)其中,H1和W1' H2和W2, S1和S2, Aratl和Arat2、Dratl和Drat2分别为指定文字图像块和候选文字图像块高度、宽度、前景像素总数、长宽比、及占空比,thr为设定的阈值。所述的阈值thr设定为0.5。所述的模板的选择为:设定H1和WpH2和W2分别为文字图像Partl和文字图像Part2的高度和宽度,则比较模板选择判定如下:【权利要求】1.,其特征在于,包括以下操作: 1)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对; 2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤: 首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分; 在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展; 模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少; 3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。2.如权利要求1所述的文字图像特征差异的快速计算方法,其特征在于,所述的四个特征的提取方法为: 前景像素个数,前景像素反映文字图像文字块的点阵分布,对于不同字号以及不同字形,前景像素的个数不同; 文字大小,文字的长度和宽度是对文字大小最直接的刻画,如果两个文字在长度或者宽度上差异明显,则直本文档来自技高网
...

【技术保护点】
一种文字图像特征差异的快速计算方法,其特征在于,包括以下操作:1)对于待比较的指定文字图像块和候选文字图像块,分别提取其前景像素个数、文字大小、长宽比和占空比四个特征,比较提取的四个特征后进行初步筛选,剔除一部分差异显著的文字配对;2)对剩下的部分采用模板匹配方法得到归一化匹配值,所述的模板匹配方法包括以下步骤:首先从待比较的指定文字图像块和候选文字图像块中选择大小参数较小的部分作为模板的组成部分;在获取模板后,按照匹配过程在模板移动中寻找最优匹配位置,并对判定为非模板的文字图像块在边界处加入一个像素的扩展;模板在文字图像块中的每个位置都会得到一个匹配结果;对文字图像对中匹配的前景像素总数进行统计,在文字图像块比较中,如果模板与文字图像块对应前景像素匹配总数最大,则认为该位置为最优匹配位置,将不同文字图像块间的匹配结果直接归一化;两个文字图像块越相似,则匹配数目就会越多,对应未匹配数目就会越少;3)完成文字图像块的特征提取后,通过这些特征度量文字图像块的相似性,构建相似性矩阵。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋永红张元林雍旭东孟泉刘跃虎陈晓
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1