用于检测文档图像的歪斜的方法和设备技术

技术编号:2930720 阅读:297 留言:0更新日期:2012-04-11 18:40
本申请涉及用于检测文档图像的歪斜的方法、设备和存储介质。为了提高处理速度和鲁棒性,降低能耗,本发明专利技术提供了一种估计二值文档图像的歪斜角的方法,包括:在水平和竖直方向用不相等的压缩比压缩图像,获得水平和竖直压缩图像;在水平压缩图像上沿竖直方向填充黑像素之间的较短的白游程,在竖直压缩图像上沿着水平方向填充黑像素之间的较短的白游程;在水平压缩图像中过滤掉沿着竖直方向较长的黑游程,在竖直压缩图像中过滤掉沿着水平方向较长的黑游程;在每一个压缩图像中抽取剩下的黑游程的端点,作为用于处理的数据点;找到所述压缩图像上的歪斜角;根据压缩比计算输入的二值图像的歪斜角。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】

本申请涉及文档图像的歪斜检测,具体地,涉及用于检测文档图像的歪斜的方法、设备和存储介质。
技术介绍
文档歪斜是在扫描或者复制文档时经常发生的畸变,或者是文档布局中的设计特征。文档的歪斜主要涉及文档行的取向取决于语言,当零歪斜时,行是水平的或者竖直的。文档歪斜是一种不可避免的现象,在许多情况下对OCR中的页面分割/分类以及字符识别的精确度有负面影响,因为在应用OCR之前,常常要求正确地对齐图像。歪斜估计是这样的一个过程,其目标在于检测文档取向相对于水平或者竖直方向的偏差。根据R.Cattoni,T.Coianiz,S.Messelodi,C.M.Modena,Geometric Layout Analysis Techniques for Document ImageUnderstandinga Review,根据所采用的基本方法,大多数歪斜估计技术可以分为以下主要类别(1)分析投影分布图;(2)Hough变换;(3)连通域聚类;以及(4)线之间的相关性。还基于梯度分析、傅立叶频谱、形态变换或者子空间线检测的使用提出了其它的技术。多数现有方法,例如分布图分析方法,处理的文档具有明确本文档来自技高网...

【技术保护点】
一种估计二值文档图像的歪斜角的方法,包括下列步骤:在水平方向和竖直方向用不相等的压缩比压缩图像,获得两个分辨率降低的图像:水平压缩图像和竖直压缩图像;在水平压缩图像上,沿着竖直方向,填充黑像素之间的短于第一预定游程长度的白游 程,并且,在竖直压缩图像上,沿着水平方向,填充黑像素之间的短于第二预定游程长度的白游程;在水平压缩图像中,过滤掉沿着竖直方向长于第三预定游程长度的黑游程,并且在竖直压缩图像中,过滤掉沿着水平方向长于第四预定游程长度的黑游程; 在每一个压缩图像中,抽取剩下的黑游程的端点,作为用于处理的数据点;找到所述压缩图像上的歪...

【技术特征摘要】

【专利技术属性】
技术研发人员:胥立丰
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1