一种基于傅里叶变换的文本图像纠偏方法技术

技术编号:18138966 阅读:78 留言:0更新日期:2018-06-06 12:09
本发明专利技术公开了一种基于傅里叶变换的文本图像纠偏方法,主要是通过离散傅里叶变换从文本图像的频域分析角度偏转值,从而实现将文本图像纠正偏转的方法。

【技术实现步骤摘要】
一种基于傅里叶变换的文本图像纠偏方法
本专利技术涉及电子信息领域,尤其涉及一种基于傅里叶变换的文本图像纠偏方法。
技术介绍
数字化时代的推进,许多传统的纸质读物正在逐步电子化,而信息电子化的一项重要技术,就是OCR技术。但是OCR这项技术本身并不完善,当我们对纸质文档扫描或拍照都不可避免会产生文本图像倾斜的现象,这种现象会直接降低OCR的识别率和准确度,因此,我们需要一项其他的技术加以辅助才能有效提高其识别率,而从中衍生出的就是本文将提及到的图像纠偏技术。目前较为广泛使用的有基于特征点的最小矩离拟合的文档纠偏技术,基于Hough变换的纠偏技术以及基于Radon变换的检测纠偏技术。
技术实现思路
本专利技术公开了一种基于傅里叶变换的文本图像纠偏方法,主要是通过离散傅里叶变换从文本图像的频域分析角度偏转值,从而实现将文本图像纠正偏转的方法。离散傅里叶变换核心流程如下:s1.通过中值滤波法对图像进行处理;s2.图像的dft和二值化;s3.Hough直线检测;s4.角度计算和图像角度校正。傅里叶变换是一种信号分析的基本方法,运用它可以将信号从时间域变换到频率域,进而研究信号的频谱结构和变化规律。根据原信号的不同类型,可以把傅里叶变换分为四种类别:傅里叶变换、傅里叶级数、离散时间傅里叶变换、离散傅里叶变换。在实际工程应用中,由于计算机只能处理离散、有限长度的信号数据,因此只有离散傅里叶变换适合实际的工程应用。离散傅里叶变换(discreteFouriertransform),是傅里叶变换在时域和频域都呈现出离散的形式,将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。对于一幅图像使用离散傅里叶变换实际上就是将它分解成正弦和余弦两部分,也就是将图像从空间域(spatialdomain)转换到频域(frequencydomain)。二维图像的傅里叶变换可以用以下数学公式表达:eix=cosx+isinx式中f是空间域值,F是频域值。转换之后频域值是复数,因此,显示傅里叶变换之后的结果需要使用实数图像(realimage)加虚数图像(compleximage),或者幅度图像(magitudeimage)加相位图像(phaseimage)。在实际的图像处理过程中,仅仅使用了幅度图像,因为幅度图像包含了原图像的几乎所有我们需要的几何信息。本专利技术技术方案带来的有益效果:本专利技术技术方案带来的有益效果是在实际工程应用中,如交通违章车牌识别、图书电子化归档、身份证扫描识别、网络审计图片涉密等领域,能够针对在扫描或拍摄过程中产生的具有一定噪声干扰和偏转的图像,通过算法高效检测出偏转并加以纠正,进而在后续的OCR中有效地提高识别率和准确率,带来实际的工程应用价值。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术流程图;图2是本专利技术通过中值滤波法对图像进行处理中带有噪音附图;图3是本专利技术通过中值滤波法对图像进行处理后附图;图4是本专利技术图像的dft和二值化处理后附图;图5,图6是本专利技术Hough直线检测附图;图7是本专利技术角度计算和图像角度校正附图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。(1)中值滤波法对图像预处理工程应用中,对于纯文本行图像而言,每行文字的大小和间距都是确定的,所以沿着垂直于文字行的方向来看,文本图像呈现出周期性特征;而对于噪声而言,由于其存在着随机性特征,所以可以通过数字信号处理技术将其滤除,再对消除噪声干扰的文档图像进行后续处理。执行这一个步骤是为了提高后续步骤得到的结果的精确度,主要做的是图像的平滑处理,图像平滑是为了消除图像采集过程中的高频噪声,目前主流方法有邻域平均法、中值滤波法和选择式掩膜平滑法等,经过实验结果对比,本文选用的是适用于去除椒盐噪声的中值滤波法。参照图2,图3带有噪声的图片进行中值滤波后的效果对比。经过对比,可以发现预处理后的图像噪声明显得到抑制,虽然字体也在一定程度上平滑而显得模糊,但并不影响后续对倾斜角度的检测,而且有效降低了其对最终结果的干扰。(2)图像的dft和二值化对经过预处理的图像进行dft,在频域里面,在分析图像信号的频率特性时,对于一幅图像,直流分量表示预想的平均灰度,低频分量代表了大面积背景区域和缓慢变化部分,高频部分代表了它的边缘,细节,跳跃部分以及颗粒噪声。参照图4,实际上图像上某一点与邻域点差异的强弱,即梯度的大小,也即该点的频率的大小(图像中的低频部分指低梯度的点,高频部分相反)。一般来讲,梯度大则该点的亮度强,否则该点亮度弱。通过观察傅立叶变换后的频谱图,即功率图,首先就可以看出,图像的能量分布,如果频谱图中暗的点数更多,那么实际图像是比较柔和的(因为各点与邻域差异都不大,梯度相对较小);反之,如果频谱图中亮的点数多,那么实际图像一定是尖锐的,边界分明且边界两边像素差异较大的。对频谱移频到原点以后,可以看出图像的频率分布是以原点为圆心,对称分布的。原图中因为文字和背景的之间的梯度较大,所以经过dft之后,亮点部分会集中反映出了文字的走向。二值化图像可以有效反映图像的整体和局部特征,选择一个适当的阈值可以将文档图像较好地转化为二值图像。常用的二值化方法有全局阈值法、自适应阈值法和局部自适应阈值法等。本文由于主要用于处理单一的黑白文本图像,所以选用了全局阈值法,通过阈值的反复实验,可以选定一个在工程应用中广泛适用的阈值。(3)Hough直线检测采用了Hough变换,Hough变换寻找直线与圆的方法相比与其它方法可以更好的减少噪声干扰,在直线检测中,每个像素坐标点经过变换都变成对直线特质有贡献的统一度量,假设直线为:x*cos(theta)+〖y*sin〗(theta)=r参照图5,r为原点到直线的垂直距离,theta为r与x轴之间的夹角,我们可以根据r或theta推算出直线上的任意点p(x,y)。Hough变换的原理则是反过来将图像从笛卡尔坐标系转换到极坐标Hough空间系,从点到曲线的变换。变换通过量化Hough参数空间有限个值间隔等分或者累加格子。当Hough变换算法开始,每个像素坐标点P(x,y)被转换到(r,theta)的曲线点上面,累加到对应的格子数据点,当一个波峰出现时候,说明有直线存在。图6是二值化图像经过Hough直线检测后所叠加绘制的图。(4)角度计算和图像角度校正由于dft的特点,只有输入图像是正方形时,检测到的角度值才是文本真正旋转的角度。但是实际上我们使用的图像不一定是正方形的,所以要根据图像的长宽比改变这个角度。经过简单的几何运算,可以得到真实的倾斜值并将图像旋转回去。详见图7。以上对本专利技术实施例所提供的一种基于傅里叶变换的文本图像纠偏方法进行了详细介绍,本文中应用了具体个例本文档来自技高网...
一种基于傅里叶变换的文本图像纠偏方法

【技术保护点】
一种基于傅里叶变换的文本图像纠偏方法,通过离散傅里叶变换从文本图像的频域分析角度偏转值,从而实现将文本图像纠正偏转的方法。具体包含:s1.通过中值滤波法对图像进行处理;s2.图像的dft和二值化;s3.Hough直线检测;s4.角度计算和图像角度校正。

【技术特征摘要】
1.一种基于傅里叶变换的文本图像纠偏方法,通过离散傅里叶变换从文本图像的频域分析角度偏转值,从而实现将文本图像纠正偏转的方法。具体包含:s1.通过中值滤波法对图像进行处理;s2.图像的dft和二值化;s3.Hough直线检测;s4.角度计算和图像角度校正。2.根据权利要求1所述的方法,其特征在于,采用中值滤波法对图像进行处理,通过数字信号处理技术将噪音滤除,再对消除噪声干扰的文档图像进行后续处理,处理后的图像噪声明显得到抑制,虽然字体也在一定程度上平滑而显得模糊,但并不影响后续对倾斜角度的检测。3.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:杨育斌张彦峰柯宗贵
申请(专利权)人:蓝盾信息安全技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1