【技术实现步骤摘要】
一种基于分段投影的扫描文档图像倾斜校正方法
[0001]本专利技术涉及文档图像纠偏
,具体涉及一种基于分段投影的扫描文档图像倾斜校正方法。
技术介绍
[0002]文档图像的倾斜角检测是文档图像处理中非常重要的环节,是图像识别、机器视觉的基础工作。目前的倾斜检测常采用投影法,投影法分为水平投影与垂直投影,水平投影是指二维图像按照行方向将前景像素点进行和运算,垂直投影是指二维图像按照列方向将前景像素点进行和运算,最后利用文档图像投影后的峰值来判断文档图像的倾斜程度。
[0003]如名称为“一种文档图像倾斜检测的方法和装置”(公开号为“CN109784332A”)的专利文献,采用投影法,通过图像特征的信号能量检测倾斜角度,而该方法在旋转角度的间隔设置过小时,倾斜角度的计算时间很长。又如名称为“一种扫描文档图像纠偏方法”(公开号为“CN106097254B”)的专利文献,同样采用投影法,通过扫描文档图像的直方图,计算文本行在水平方向和垂直方向的投影值,构造合适的特征函数,将特征函数极值对应的角度作为扫描文档图像的倾斜角 ...
【技术保护点】
【技术特征摘要】
1.一种基于分段投影的扫描文档图像倾斜校正方法,其特征在于,该方法包括以下步骤:(1)扫描文档图像预处理;将扫描文档图像I转换为灰度图像I
g
,随后采用图像二值化算法对灰度图像I
g
进行图像二值化操作,得到第一二值图像I
b1
;(2)判定扫描文档图像的书写方向;采用直线检测算法对第一二值图像I
b1
进行直线检测,得到第一线段集合L,根据第一线段集合L对扫描文档图像I进行文本行的书写方向判断;(3)提取扫描文档图像的骨架;根据扫描文档图像I的文字方向,设定矩形结构元S;根据矩形结构元S对第一二值图像I
b1
进行图像膨胀,得到图像膨胀后的第二二值图像I
b2
;最后采用骨架提取算法对第二二值图像I
b2
进行骨架提取,得到骨架图像I
s
;(4)采用直线检测算法与直线斜率平均法计算第一倾斜角度;采用直线检测算法检测骨架图像I
s
,得到第二线段集合L
*
;根据第二线段集合L
*
的斜率,采用直线斜率平均法计算第一倾斜角度θ1,之后以第一倾斜角度θ1对第一二值图像I
b1
进行旋转校正,得到第三二值图像I
b3
;(5)采用旋转投影法与统计区域内前景点法计算第二倾斜角度;以a为第一旋转角度的间隔,[θ
s
,θ
e
]为第一旋转角度范围,利用旋转投影法对第三二值图像I
b3
进行g次旋转投影,得到第一投影图像集合P={P1,P2,
…
,P
j
,
…
,P
g
},其中P
j
为第j次旋转的投影图像,j=1,2,
…
,g;通过统计区域内前景点法计算第一投影图像集合P中投影图像P
j
的区域前景点个数V
j
,利用第一投影图像集合P中投影图像P
j
的区域前景点个数V
j
计算第二旋转角度范围再以a
*
=a/10为第二旋转角度的间隔,为第二旋转角度范围,利用旋转投影法对第三二值图像I
b3
进行g
*
次旋转投影,得到第二投影图像集合其中P
y
为第y次旋转的投影图像,j=1,2,
…
,g
*
;通过统计区域内前景点法计算第二投影图像集合P
*
中投影图像P
y*
的区域前景点个数V
y*
,利用第二投影图像集合P中投影图像P
y*
的区域前景点个数V
y*
计算第二倾斜角度θ2;(6)根据第一倾斜角度与第二倾斜角度对扫描文档图像旋转校正;将第一倾斜角度θ1和第二倾斜角度θ2相加,得到倾斜角度θ;以扫描文档图像I的中心点为原点,扫描文档图像I绕原点旋转θ角度,获得校正后的扫描文档图像I
*
。2.根据权利要求1所述的一种基于分段投影的扫描文档图像倾斜校正方法,其特征在于,步骤(2)中所述根据第一线段集合L对扫描文档图像I进行文本行的书写方向判断,具体方法如下:(2.1)设定k
thr
为线段斜率阈值,设置垂直线段数量n
v
和水平线段数量n
h
的初始值为0;(2.2)对第一线段集合L中的每一条线段l
i
,其中i=1,2,
…
,d,d为第一线段集合L内的线段总数,采用以下公式计算斜率k
i
:其中,分别是线段l
i
的起始点横坐标和纵坐标,分别是线段l
i
的结束点横坐标和纵坐标;
(2.3)当斜率k
i
大于等于线段斜率阈值k
thr
时,垂直线段数量n
v
增加1;否则,水平线段数量n
h
增加1;(2.4)若垂直线段数量n
v
大于水平线段数量n
h
,则标记扫描文档图像I的文字方向为垂直方向;否则,标记扫描文档图像I的文字方向为水平方向。3.根据权利要求2所述的一种基于分段投影的扫描文档图像倾斜校正方法,其特征在于,步骤(3)中所述根据扫描文档图像I的文字方向,设定矩形结构元S,具体方法如下:(3.1)设定一个大小为M
×
N的矩形结构元S;(3.2)若扫描文档图像I的文字方向为水平方向,则在设置M和N的数值时,M大于N;若扫描文档图像I的文字方向为垂直方向,则在设置M和N的数值时,M小于N。4.根据权利要求3所述的一种基于分段投影的扫描文档图像倾斜校正方法,其特征在于,步骤(4)中所述根据第二线段集合L
*
的斜率,采用直线斜率平均法计算第一倾斜角度θ1,具体方法如下:(4.1)对第二线段集合L
*
中的每一条线段其中m=1,2,
…
,u,u为第二线段集合L
*
内的线段总数,根据公式(1)计算斜率(4.2)根据第二线段集合L
*
中的每一条线段的斜率计算第二线段集合L
*
的平均斜率计算公式如下:(4.3)将平均斜率转换为角度,得到第一倾斜角度θ1,计算公式如下:(4.4)将第一二值图像I
b1
旋转θ1角度,得到第三二值图像I
b3
。5.根据权利要求4所述的一种基于分段投影的扫描文档图像倾斜校正方法,其特征在于,上述步骤(5)中所述利用旋转投影法对第三二值图像I
b3
进行g次旋转投影,具体方法如下:(5.1.1)获取扫描文档图像I的宽度w与高度h;(5.1.2)以θ
s
为起始旋转角度,将第三二值图像I
b3
沿顺时针方向旋转g次,其中第j次的旋转角度为j
×
a(j=1,2,
…
,g),得到旋转图像I
j
,将旋转图像I
j
归为第一旋转图像集合I
f
中,具体g的计算公式如下:(5.1.3)针对第一旋转图像集合I
f
中的每一幅旋转图像I
j
,创建一幅与旋转图像I
j
大小相同的空白图像I
j*
,其中空白图像I
j*
中所有像素点的初始值为255;若扫描文档图像I的书写方向为垂直方向,则先对旋转图像I
j
进行垂直投影,即统计旋转图像I
j
中第t列的前景点个数M
t
,其中t=1,2,
…
,w,w为扫描文档图像I的宽度,前景点是像素值为0的像素点,将空白图像I
j*
中第t列的第一行至第...
【专利技术属性】
技术研发人员:鲍吴智达,曾梦洁,杨词慧,邹伟军,
申请(专利权)人:南昌航空大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。