基于局部信息的文档图像校正方法技术

技术编号:9382205 阅读:122 留言:0更新日期:2013-11-28 00:33
基于局部信息的文档图像校正方法,首先通过文档图像的平均梯度值确定文本行的尺度,然后通过空白行的自相似性进行文本行跟踪,得到文本行的上、下边界,再通过文字笔画间距确定竖直笔画边界,完成对文本行的分割处理,处理完后,得到以一个以上、下边界和竖直边界划分得到的四边形,该四边形所包围的图像内容就是一个文字块处理单元;最后针对每个文字块处理单元,依次进行倾斜形变校正以及局部双线性插值校正,即完成对整幅文档图像的校正;本方法综合考虑了处理速度及扭曲文档图像的复杂情况,具有校正过程速度较快、校正效果好的特点。

【技术实现步骤摘要】

【技术保护点】
基于局部信息的文档图像校正方法,其特征在于:首先通过文档图像的平均梯度值确定文本行的尺度,然后通过空白行的自相似性进行文本行跟踪,得到文本行的上、下边界,再通过文字笔画间距确定竖直笔画边界,完成对文本行的分割处理,处理完后,得到以一个以上、下边界和竖直边界划分得到的四边形,该四边形所包围的图像内容就是一个文字块处理单元;最后针对每个文字块处理单元,依次进行倾斜形变校正以及局部双线性插值校正,即完成对整幅文档图像的校正;所述通过空白行的自相似性进行文本行跟踪的具体方法为:通过文档图像的平均梯度值确定了文本行的尺度,进而能够确定矩形追踪窗口的大小,要求该窗口内只包含背景点,若不符合要求,则微调窗口的位置,直到符合要求为止,考虑图像可能存在的随机噪声及估算的窗口大小误差,规定窗口中的背景像素数比窗口面积大于等于规定阈值即符合要求;窗口选定后,以该窗口中心为原点x0,选定半径s与角度步长θi,通过归一化相关系数为度量,搜索并记录与该窗口最相似的邻近窗口,判断若搜索到的最相似的邻近窗口不是边界窗口,则以该最相似的邻近窗口为当前窗口重复窗口搜索过程,直到其最相似的邻近窗口为边界窗口时,停止搜索,即完成了通过空白行的自相似性进行文本行跟踪的过程。所述局部双线性插值校正的具体方法为:文本行在扭曲形变后大小和形状都会有改变,但不同行列的文字形变并不一定相同,因此再将待处理窗口划分成更小的子窗口进行恢复,对待处理窗口进行水平分割,认为分割后的子窗口为标准矩形窗口,且子窗口中所有形变完全一致;同时,根据待处理窗口的大小,能够估算出其被校正后的矩形窗口的大小和位置;最后,针对每个子窗口 依次进行双线性插值,将子窗口中的失真内容恢复到其对应的校正后的矩形窗口中,形成多个文字块窗口,依次对每个文字块窗口进行处理,直到所有的文字块窗口都被处理完后,完成输入文档图像的校正过程。...

【技术特征摘要】

【专利技术属性】
技术研发人员:宋永红张云张元林
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1