名片图像倾斜角度的测量方法和装置制造方法及图纸

技术编号:4382118 阅读:390 留言:0更新日期:2012-04-11 18:40
本发明专利技术名片图像倾斜角度的测量方法和装置,属于OCR技术领域。本方法首先提取名片图像的边缘图像,然后在边缘图像中搜索名片的四周边框直线,根据边框直线的倾斜程度判断图像是否存在倾斜,对于存在倾斜的图片,判断其文字的编辑方向,并沿着文字编辑方向投影,利用投影特征计算图像的倾斜角度。通过采集图像的边框直线的方式对图像进行倾斜判定,可快速将图像分为倾斜和无倾斜两类,并分别处理。通过比较图像水平和竖直两个方向上投影直方图的特征来快速判断文字的编辑方向,确定文字编辑方向对于投影计算倾斜角度和名片图像的版面分析都具有很大的指导作用。

【技术实现步骤摘要】

本专利技术属于数字图像处理技术及0CR(光学字符识别)
,特别涉及一种名 片图像倾斜角度的测量方法和装置。
技术介绍
在当今的商务活动中,名片已经是商业合作伙伴、客户等的重要信息载体,面对大 量的名片,公司和个人都需要有一种方法进行自动、准确地信息采集和处理,目前一般采用 0CR(0ptical Character Recognition)系统完成此功能。在名片OCR系统中,输入的名片 图像可能存在一定角度倾斜(一般小于5。),这种倾斜会对名片的版面分析、字符切分及 字符识别产生不良影响,需要进行倾斜角度检测,然后根据角度进行图像校正。 现有的针对文档图像的倾斜检测方法,基本上都是基于二值图像的,主要可分为4 类基于投影的方法、基于HOUGH变换的方法、K-最近邻簇方法和基于交叉相关性的方法。 对于名片图像,其特点是文字行(列)较少,通常只有几行(列)或十几行(列), 文字个数较少,排版样式多变。K-最近邻簇方法需要较多的文字连通域才能计算出可靠的 结果,不适合名片图像;基于交叉相关性的方法的前提是文本具有一致的排版格式,也不适 合名片图像;基于HOUGH变换的方法计算量较大。所以上述四类用于文档图像倾斜检测的 方法中,基于投影的方法比较适合名片图像的倾斜检测。 申请号为200410080505. X的专利公开了一种图像处理方法,通过在图像中搜索 直线并根据直线的倾斜情况计算图像倾斜角度,在图像处理的过程中需要依赖于图像中的 直线。申请号为200710176208. 9的专利针对复杂文档图像,通过文本区域及非文本区域提 取连通区域的边界段作为倾斜特征计算倾斜角度,需要图像中存在较多的连通区域。这两 种方法对于名片图像,这两种方法适用性较差,而且都是直接计算图像的倾斜角度,而没有 预先自动判断图像是否需要计算倾斜角度。对于不存在倾斜的图像而言,倾斜角度为零,则 不需要进行倾斜角度计算。 文献《灰度名片图像快速倾斜检测和校正方法》(《中文信息学报》2004年01期, 63-70页)提出一种根据扫描名片图像中名片的四条边框直线进行倾斜角度检测的方法, 该方法简单快速,但是对于名片图像不存在边缘直线的情况则无能为力,而且仅仅根据边 缘直线计算出的角度精度不是很高。 利用投影方法计算名片图像的倾斜角度,计算结果准确,但是对于不存在倾斜的 名片图像进行计算,是一种浪费;利用图像中名片边框直线计算倾斜角度的方法,简单快 速,但是对于边框直线缺失的情况,其失去作用,对于边框直线受噪声污染的情况,其计算 结果不够准确。
技术实现思路
本专利技术提出了一种名片图像倾斜角度的测量方法和装置,本方法首先提取名片图 像的边缘图像,然后在边缘图像中搜索名片的四周边框直线,根据边框直线的倾斜程度判4断图像是否存在倾斜,对于存在倾斜的图片,判断其文字的编辑方向,并沿着文字编辑方向 投影,利用投影特征计算图像的倾斜角度,既能自动区分名片图像倾斜与非倾斜,又能计算 出精确的倾斜角度。 名片图像倾斜角度的测量方法,包括如下步骤 步骤1 :输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像边缘作 为处理的基本内容。 步骤2:搜索名片图像四周的边框直线。自外向内在四个方向上对图像依次按行 列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不大 于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段。如果其中最长的线段长 度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在边框直 线。 步骤3 :根据搜索到的边框直线判断图像是否倾斜。如果边框直线数大于等于2, 并且标定为倾斜的边框直线数大于搜索到的边框直线数的0. 7倍,则该图像倾斜;否则,图 像不存在倾斜,本方法结束。 步骤4 :对标记倾斜的图像,判断图像中文字的编辑方向。分别在图像的竖直和水 平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定宽 度的投影数目之和;将投影数目较大的方向作为文字的编辑方向。步骤5 :利用投影方法计算图像的倾斜角度。在图像的文字编辑方向上,在_5度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。 所述步骤2中按行列逐像素搜索时,搜索范围为该方向上图像的边缘至该图像的 所述步骤2的既定阈值的取值范围为整个图像对应宽度的;~ ;。 所述步骤3中进行倾斜判定,分别取最长线段起止端的相同数目的坐标点的平均 坐标值,如果计算所得倾斜角度大于倾斜阈值,则将该线段所在的边框直线标记为倾斜;否 则标记为非倾斜;没有搜索到边框直线的边,直接标记该边为倾斜。 所述步骤4中的既定宽度范围根据图像中字符的行高进行调整;投影区间以水平 和竖直投影直方图的最大投影值中较小者和其1/3为上下限。 所述步骤4中判定文字编辑方向时,如果竖直和水平两个方向上的投影数目相 等,则文字编辑方向为两投影直方图的投影值平方和大的方向。 所述步骤5中对图像进行投影时,如果图像的文字编辑方向为水平方向,将图像 等分成一系列竖条图像,并对各竖条图像按照0°投影,将得到的各投影直方图合成一个该 投影方向上的整体投影直方图;如果图像的文字编辑方向为竖直方向,则将图像旋转90° 再进行上述处理。 所述步骤5中将图像划分时,竖条图像的宽度w为 其中,L为图像的宽度,a为投影的角度。 名片图像倾斜角度的测量装置,由以下模块组成 图像输入模块,输入并提取输入的名片图像的边缘。输入名片图像,提取灰度图像 边缘作为处理的基本内容。 边框搜索模块,搜索名片图像四周的边框直线;自外向内在四个方向上对图像依 次按行列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置 差不大于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段。如果其中最长的 线段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在 边框直线。 倾斜判定模块,根据搜索到的边框直线判断图像是否倾斜。如果边框直线数大于 等于2,并且标定为倾斜的边框直线数大于搜索到的边框直线数的0. 7倍,则该图像倾斜; 否则,图像不存在倾斜,本装置处理过程结束。 文字方向判定模块,对标记倾斜的图像,判断图像中文字的编辑方向。分别在图像的竖直和水平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向。 角度计算模块,利用投影方法计算图像的倾斜角度。在图像的文字编辑方向上,在_5度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。 本专利技术名片图像倾斜角度的测量方法和装置,与现有技术相比优点在于 1、本专利技术通过采集图像的边框直线的方式对图像进行倾斜判定,可快速将图像分为倾斜和无倾斜两类,对于无倾斜的图像,不再进行倾斜角度的计算步骤,对于倾斜图像,再利用其他方法计算精确的倾斜角度; 2、本专利技术通过比较图像水平和竖直两个方向上投影直方图的特征来快速判断文 字的编辑方向本文档来自技高网
...

【技术保护点】
一种名片图像倾斜角度的测量方法,其特征在于,包括如下步骤:步骤一:输入并提取输入的名片图像的边缘;输入名片图像,提取灰度图像边缘作为处理的基本内容;步骤二:搜索名片图像四周的边框直线;自外向内在四个方向上对图像依次按行列逐像素搜索,如果相邻行列记录到的第一个黑像素点的坐标在搜索方向上的位置差不大于2个像素,则这两个黑像素点位于同一线段上,否则,新建线段;如果其中最长的线段长度超过既定阈值,则该线段所在直线为此方向上的边框直线,否则,此方向上不存在边框直线;步骤三:根据搜索到的边框直线判断图像是否倾斜;如果边框直线数大于等于2,并且标定为倾斜的边框直线数大于搜索到的边框直线数的0.7倍,则该图像倾斜;否则,图像不存在倾斜,本方法结束;步骤四:对标记倾斜的图像,判断图像中文字的编辑方向;分别在图像的竖直和水平投影直方图内,以相同投影值区间和投影值间隔划定直线,分别计算直线穿过的既定宽度的投影数目之和;将投影数目较大的方向作为文字的编辑方向;步骤五:利用投影方法计算图像的倾斜角度;在图像的文字编辑方向上,在-5度到+5度之间,按相等的角度间隔分别对图像进行投影,计算所得的每个投影直方图投影值的平方和,图像的倾斜角度为投影平方和值最大的投影直方图的对应的投影角度。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李永彬朱军民
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1