一种图像预处理方法及装置制造方法及图纸

技术编号:13284437 阅读:53 留言:0更新日期:2016-07-09 01:17
本申请公开了一种图像预处理方法及装置,该方法采集原始图像,根据原始图像的像素位置信息和像素灰度值信息,对原始图像进行滤波处理,生成滤波图像,然后根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像,再根据所述增强图像,生成类梯度图,并对所述类梯度图进行二值化处理,生成二值图像。通过上述方法,由于对原始图像进行了以上的预处理操作,在抑制图像噪声的同时,增强了原始图像中包含的文字信息的清晰度和对比度,因此,后续可对预处理后的二值图像中包含的文字信息进行图像识别,提高了识别正确率。

【技术实现步骤摘要】
一种图像预处理方法及装置
本申请涉及计算机
,尤其涉及一种图像预处理方法及装置。
技术介绍
随着计算机技术和图像处理技术的发展,图像识别技术也迅速发展,并可以在各种终端上实现图像识别技术。其中,对图像中包含的文字信息的识别,也即,光学字符识别(OpticalCharacterRecognition,OCR),是图像识别技术最常见的应用场景之一。目前,若图像中包含的文字信息比较清晰,且图像受到图像噪声的干扰较小,则后续终端对图像中包含的文字信息进行图像识别时,可以达到较高的识别正确率。但是,在实际应用中,图像中包含的文字信息也有可能不清晰,原因既可能是在采集图像时,与该文字信息对应的、被拍摄的原始文字本身就不清晰,也有可能是图像在采集过程中受到了各种图像噪声的干扰,在这种情况下,后续终端对图像中包含的文字信息进行图像识别时,识别正确率较低。例如,在统计多张票据的金额时,由于人工录入比较费时费力,则可以对票据上记录事由、金额等信息的文字区域进行拍照,则拍出的照片即为待识别的图像,进而可对照片进行图像识别,也即,对照片中包含的票据对应的事由、金额等文字信息进行图像识别,并在后续进行自动录入。但是,很多票据上打印的文字不清晰,而且随着保存时间的变长,这些打印的文字由于磨损或是氧化等原因会越来越不清晰,对这类票据进行图像采集时,采集到的图像中包含的文字信息显然也是不清晰的,因此,在这类应用场景下,后续终端对照片中包含的文字信息进行图像识别时,识别正确率较低。
技术实现思路
本申请实施例提供一种图像预处理方法及装置,用以解决现有技术中目前当图像中包含的文字信息不清晰时,后续终端对该文字信息进行图像识别时,识别正确率较低的问题。本申请实施例提供的一种图像预处理方法,包括:采集原始图像;根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,生成滤波图像;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。本申请实施例提供的一种图像预处理装置,包括:采集模块,用于采集原始图像;滤波模块,用于根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,生成滤波图像;增强模块,用于根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;二值化模块,用于根据所述增强图像,生成类梯度图,并对所述类梯度图进行二值化处理,生成二值图像。本申请实施例提供一种图像预处理方法及装置,该方法采集原始图像,根据原始图像的像素位置信息和像素灰度值信息,对原始图像进行滤波处理,生成滤波图像,然后根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像,再根据所述增强图像,生成类梯度图,并对所述类梯度图进行二值化处理,生成二值图像。通过上述方法,由于对原始图像进行了以上的预处理操作,在抑制图像噪声的同时,增强了原始图像中包含的文字信息的清晰度和对比度,因此,后续可对预处理后的二值图像中包含的文字信息进行图像识别,提高了识别正确率。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例提供的图像预处理过程;图2为在本申请实施例提供的图像预处理过程中,在坐标系中表示图像的示意图;图3为在本申请实施例提供的图像预处理过程中,滤波处理这一步骤的详细过程;图4为在坐标系中表示的、大小为2×2的图像及其积分图;图5为在本申请实施例提供的图像预处理过程中,在增强处理时,为像素确定出的指定邻域的示意图;图6为在本申请实施例提供的图像预处理过程中,增强处理这一步骤的详细过程;图7为在本申请实施例提供的图像预处理过程中,生成梯度图时所使用的坐标系的示意图;图8为在本申请实施例提供的图像预处理过程中,生成类梯度图并进行二值化处理的步骤的详细过程;图9为使用本申请实施例提供的图像预处理方法,对某图片进行预处理的效果图;图10为本申请实施例提供的图像预处理装置结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请实施例提供的图像预处理过程,具体包括以下步骤:S101:采集原始图像。在本申请实施例中,可以用终端或服务器采集原始图像,以及对采集到的原始图像进行后续的处理过程。所述的原始图像为数字图像,由多个像素组成。其中,每个像素都包含有自身的灰度值,灰度值反应了像素的亮度,取值范围一般为0~255(0为最暗灰度值,对应于黑色,255为最亮灰度值,对应于白色)。一般的,对于数字图像的进行处理时,可将数字图像转换为灰度值图像,由于在灰度值图像中是用像素的灰度值表示该像素,因此,后续可很方便地基于灰度值对数字图像进行处理。S102:根据该原始图像的像素位置信息和像素灰度值信息,对该原始图像进行滤波处理,生成滤波图像。在本申请实施例中,采集到的原始图像可能会受到各种图像噪声的干扰,而对原始图像进行滤波处理则可以去除一部分噪声,提高该原始图像的质量,有利于后续处理。一般的,可以对原始图像进行高斯滤波。高斯滤波是一种根据原始图像的像素位置信息进行滤波的处理方法,具体的,高斯滤波的步骤是:生成高斯模板,然后采用该高斯模板对原始图像做卷积运算,其运算的结果是针对原始图像的每个像素,用该像素的既定邻域范围内所有像素的灰度值的加权均值代替了该像素原来的灰度值,从而可以使原始图像变得平滑,并滤除一部分图像噪声。其中,所述的高斯模板可根据预设的高斯函数和原始图像的像素位置信息生成,所述的像素位置信息是原始图像中像素与该像素既定邻域范围内其他像素之间的空间距离,所述的既定邻域范围是在该原始图像上,以该像素为中心,与高斯模板的大小和形状相同的区域,高斯模板确定了既定邻域范围内所有像素的灰度值的加权权重。但是,由于高斯滤波在滤除图像噪声的同时,也可能会模糊原始图像中前景(前景,如原始图像中包含的文字信息等)的边缘,从而影响后续的识别正确率。因此,在本申请实施例中,不仅根据原始图像的像素位置信息,同时还可根据原始图像的像素灰度值信息,对该原始图像进行滤波处理。其中,所述的像素灰度值信息可以是原始图像中的像素与该像素周围的像素之间灰度值的差分。具体的,可根据原始图像的像素灰度值信息,生成类似于高斯模板的灰度值差分模板,并用于本文档来自技高网...

【技术保护点】
一种图像预处理方法,其特征在于,包括:采集原始图像;根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,生成滤波图像;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。

【技术特征摘要】
1.一种图像预处理方法,其特征在于,包括:
采集原始图像;
根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,生成滤波图像;所述像素位置信息是所述原始图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述原始图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;
所述根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,具体包括:
根据所述原始图像的像素位置信息,生成高斯模板;根据所述原始图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述原始图像进行滤波处理;
根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;
根据所述增强图像,生成类梯度图;
对所述类梯度图进行二值化处理,生成二值图像;
其中,所述类梯度图是所述增强图像的离散函数。


2.如权利要求1所述的方法,其特征在于,根据所述原始图像的像素位置信息和像素灰度值信息,对所述原始图像进行滤波处理,生成滤波图像,具体包括:
根据所述原始图像的像素位置信息和像素灰度值信息,生成滤波系数模板;
使用所述滤波系数模板,对所述原始图像进行行滤波,并对行滤波结果进行列滤波,生成第一中间图像;
使用所述滤波系数模板,对所述原始图像进行列滤波,并对列滤波结果进行行滤波,生成第二中间图像;
根据所述第一中间图像和所述第二中间图像,生成滤波图像。


3.如权利要求2所述的方法,其特征在于,使用所述滤波系数模板,对所述原始图像进行行滤波,并对行滤波结果进行列滤波之前,所述方法还包括:
将所述滤波系数模板转换为行向量和列向量;
所述行滤波,具体包括:
采用所述行向量进行滤波;
所述列滤波,具体包括:
采用所述列向量进行滤波。


4.如权利要求3所述的方法,其特征在于,采用所述行向量进行滤波,具体包括:
将所述行向量中的各元素变换为整型数;
采用变换后的行向量进行滤波;
将滤波结果还原为浮点数;
采用所述列向量进行滤波,具体包括:
将所述列向量中的各元素变换为整型数;
采用变换后的列向量进行滤波;
将滤波结果还原为浮点数。


5.如权利要求2所述的方法,其特征在于,根据所述第一中间图像和所述第二中间图像,生成滤波图像,具体包括:
针对第一中间图像中的每个像素,确定该像素的灰度值与所述第二中间图像中对应位置的像素的灰度值的均值,将该均值作为生成的滤波图像中对应位置的像素的灰度值。


6.如权利要求1所述的方法,其特征在于,根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像,具体包括:
生成所述滤波图像的积分图;
根据所述积分图,确定所述滤波图像中各像素的灰度值的方差;
根据所述方差,确定最大增强系数;
根据所述滤波图像的局部像素信息和整体像素信息,以及所述最大增强系数,确定所述滤波图像中像素的实际增强系数;
根据所述实际增强系数,对所述滤波图像进行增强处理,生成增强图像。


7.如权利要求1所述的方法,其特征在于,对所述类梯度图进行二值化处理,生成二值图像,具体包括:
确定所述类梯度图的全局分割阈值;
根据所述全局分割阈值,确定第一子分割阈值和第二子分割阈值;
按照所述第一子分割阈值,对所述梯度图进行二值化处理,生成第四中间图像;
按照所述第二子分割阈值,对所述梯度图进行二值化处理,生成第五中间图像;
根据所述第四中间图像和所述第五中间图像,对所述第四中间图像进行膨胀运算,...

【专利技术属性】
技术研发人员:丁威
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1