【技术实现步骤摘要】
本申请涉及文档图像的歪斜检测,具体地,涉及用于检测文档图像的歪斜的方法、设备和存储介质。
技术介绍
文档歪斜是在扫描或者复制文档时经常发生的畸变,或者是文档布局中的设计特征。文档的歪斜主要涉及文档行的取向取决于语言,当零歪斜时,行是水平的或者竖直的。文档歪斜是一种不可避免的现象,在许多情况下对OCR中的页面分割/分类以及字符识别的精确度有负面影响,因为在应用OCR之前,常常要求正确地对齐图像。歪斜估计是这样的一个过程,其目标在于检测文档取向相对于水平或者竖直方向的偏差。根据R.Cattoni,T.Coianiz,S.Messelodi,C.M.Modena,Geometric Layout Analysis Techniques for Document ImageUnderstandinga Review,根据所采用的基本方法,大多数歪斜估计技术可以分为以下主要类别(1)分析投影分布图;(2)Hough变换;(3)连通域聚类;以及(4)线之间的相关性。还基于梯度分析、傅立叶频谱、形态变换或者子空间线检测的使用提出了其它的技术。多数现有方法,例如分布图分析方法 ...
【技术保护点】
一种估计二值文档图像的歪斜角的方法,包括下列步骤:在水平方向和竖直方向用不相等的压缩比压缩图像,获得两个分辨率降低的图像:水平压缩图像和竖直压缩图像;在水平压缩图像上,沿着竖直方向,填充黑像素之间的短于第一预定游程长度的白游 程,并且,在竖直压缩图像上,沿着水平方向,填充黑像素之间的短于第二预定游程长度的白游程;在水平压缩图像中,过滤掉沿着竖直方向长于第三预定游程长度的黑游程,并且在竖直压缩图像中,过滤掉沿着水平方向长于第四预定游程长度的黑游程; 在每一个压缩图像中,抽取剩下的黑游程的端点,作为用于处理的数据点;找 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。