【技术实现步骤摘要】
-种扫描文档图像的倾斜角自动检测方法
本专利技术属于图像处理
,具体涉及一种扫描文档图像的倾斜角自动检测方 法。
技术介绍
随着数字图像处理技术的快速发展,文字识别、图像识别、图像复原等处理已成为 非常重要的技术手段,而他们的处理对象大多数是通过扫描文档得到的数字图像。但是纸 质文档通过图像获取设备(如数码相机、扫描仪等)转化为数字文档图像过程中,由于人为 因素或扫描仪误差的影响,通过扫描得到的图像通常都会有一定的倾斜度。这种倾斜对后 期图像处理带来不同程度的困难,如影响版面分析与理解,使对文字区、图形区和图像区的 分割产生误差;使字符分割发生困难;引起字符明显变形,使得文字识别率降低。因此,倾 斜角自动检测是一项重要的文档图像预处理技术。 目前常用的检测文档倾斜角方法有:霍夫变换、投影法、平行四边形法、交叉相关 法、无最近邻法等。用霍夫变换变换来发现直线的过程是将图像上的一个点映射为参数空间 上的一条直线,然后统计参数空间上直线相交次数最多的点坐标,即为原图像上直线参数, 是一对多的过程。因此,存在计算量大的问题,且参数空间的量化间隔影响直线角度的 检测精度。量化间隔越小,计算量越大,需要内存越多,不适用于批量处理。且不适合于文 本中存在横、纵、斜等多种书写方向(比如报纸)。投影法利用投影图在不同方向的某些特性 来提取角度,只适合于纯文本图像的倾斜角检测。平行四边形法利用在不同方向上具有不 同的平行四边形数量的特性来提取角度,对噪声敏感,不适合于文档中存在图表和噪声的 情形。交叉相关法利用平行线上的像素点建立相关 ...
【技术保护点】
一种扫描文档图像的倾斜角自动检测方法,其特征在于包括以下步骤:(1).通过扫描仪获取纸质文档的数字化扫描图像,对扫描图像进行二值化及截边处理;(2).对二值图像进行迭代行程处理、区域边缘提取及文档书写方向判断,获取恰当的区域边缘图像;(3).对步骤(2)获得的区域边缘进行区域增长、区域特征提取及直线有效性判断,获取有效直线;(4).对步骤(3)获取的各条直线特征进行分析,提取扫描文档的倾斜度。
【技术特征摘要】
1. 一种扫描文档图像的倾斜角自动检测方法,其特征在于包括w下步骤: (1) .通过扫描仪获取纸质文档的数字化扫描图像,对扫描图像进行二值化及截边处 理; (2) .对二值图像进行迭代行程处理、区域边缘提取及文档书写方向判断,获取恰当的 区域边缘图像; (3) .对步骤(2)获得的区域边缘进行区域增长、区域特征提取及直线有效性判断,获 取有效直线; (4) .对步骤(3)获取的各条直线特征进行分析,提取扫描文档的倾斜度。2. 如权利要求1所述的倾斜角自动检测方法,其特征是;步骤(1)中,采用二值化阔值 为130,采用扫描行或列的方法,计算每行或每列的像素均值和方差,通过设定阔值来找出 文档图像中具有图像或文字的前景区域。3. 如权利要求1或2所述的倾斜角自动检测方法,其特征是;步骤(2)中,迭代行程处 理由水平行程处理和垂直行程处理两个步骤组成,通过循环迭代,使得经处理后的图像不...
【专利技术属性】
技术研发人员:文志强,曾志高,朱文球,
申请(专利权)人:湖南工业大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。