一种图像预处理方法及装置制造方法及图纸

技术编号：13284437 阅读：53 留言：0更新日期：2016-07-09 01:17

本申请公开了一种图像预处理方法及装置，该方法采集原始图像，根据原始图像的像素位置信息和像素灰度值信息，对原始图像进行滤波处理，生成滤波图像，然后根据所述滤波图像的局部像素信息和整体像素信息，对所述滤波图像进行增强处理，生成增强图像，再根据所述增强图像，生成类梯度图，并对所述类梯度图进行二值化处理，生成二值图像。通过上述方法，由于对原始图像进行了以上的预处理操作，在抑制图像噪声的同时，增强了原始图像中包含的文字信息的清晰度和对比度，因此，后续可对预处理后的二值图像中包含的文字信息进行图像识别，提高了识别正确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像预处理方法及装置
本申请涉及计算机
，尤其涉及一种图像预处理方法及装置。
技术介绍
随着计算机技术和图像处理技术的发展，图像识别技术也迅速发展，并可以在各种终端上实现图像识别技术。其中，对图像中包含的文字信息的识别，也即，光学字符识别(OpticalCharacterRecognition，OCR)，是图像识别技术最常见的应用场景之一。目前，若图像中包含的文字信息比较清晰，且图像受到图像噪声的干扰较小，则后续终端对图像中包含的文字信息进行图像识别时，可以达到较高的识别正确率。但是，在实际应用中，图像中包含的文字信息也有可能不清晰，原因既可能是在采集图像时，与该文字信息对应的、被拍摄的原始文字本身就不清晰，也有可能是图像在采集过程中受到了各种图像噪声的干扰，在这种情况下，后续终端对图像中包含的文字信息进行图像识别时，识别正确率较低。例如，在统计多张票据的金额时，由于人工录入比较费时费力，则可以对票据上记录事由、金额等信息的文字区域进行拍照，则拍出的照片即为待识别的图像，进而可对照片进行图像识别，也即，对照片中包含的票据对应的事由、金额等文字信息进行图像识别，并在后续进行自动录入。但是，很多票据上打印的文字不清晰，而且随着保存时间的变长，这些打印的文字由于磨损或是氧化等原因会越来越不清晰，对这类票据进行图像采集时，采集到的图像中包含的文字信息显然也是不清晰的，因此，在这类应用场景下，后续终端对照片中包含的文字信息进行图像识别时，识别正确率较低。
技术实现思路
本申...

【技术保护点】
一种图像预处理方法，其特征在于，包括：采集原始图像；根据所述原始图像的像素位置信息和像素灰度值信息，对所述原始图像进行滤波处理，生成滤波图像；根据所述滤波图像的局部像素信息和整体像素信息，对所述滤波图像进行增强处理，生成增强图像；根据所述增强图像，生成类梯度图；对所述类梯度图进行二值化处理，生成二值图像。

【技术特征摘要】
1.一种图像预处理方法，其特征在于，包括：
采集原始图像；
根据所述原始图像的像素位置信息和像素灰度值信息，对所述原始图像进行滤波处理，生成滤波图像；所述像素位置信息是所述原始图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离；所述像素灰度值信息是所述原始图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分；
所述根据所述原始图像的像素位置信息和像素灰度值信息，对所述原始图像进行滤波处理，具体包括：
根据所述原始图像的像素位置信息，生成高斯模板；根据所述原始图像的像素灰度值信息，生成灰度值差分模板，其中，所述高斯模板与所述灰度值差分模板的大小相同；将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘，将乘积作为生成的滤波系数模板中对应位置的模板系数；使用所述滤波系数模板，对所述原始图像进行滤波处理；
根据所述滤波图像的局部像素信息和整体像素信息，对所述滤波图像进行增强处理，生成增强图像；
根据所述增强图像，生成类梯度图；
对所述类梯度图进行二值化处理，生成二值图像；
其中，所述类梯度图是所述增强图像的离散函数。

2.如权利要求1所述的方法，其特征在于，根据所述原始图像的像素位置信息和像素灰度值信息，对所述原始图像进行滤波处理，生成滤波图像，具体包括：
根据所述原始图像的像素位置信息和像素灰度值信息，生成滤波系数模板；
使用所述滤波系数模板，对所述原始图像进行行滤波，并对行滤波结果进行列滤波，生成第一中间图像；
使用所述滤波系数模板，对所述原始图像进行列滤波，并对列滤波结果进行行滤波，生成第二中间图像；
根据所述第一中间图像和所述第二中间图像，生成滤波图像。

3.如权利要求2所述的方法，其特征在于，使用所述滤波系数模板，对所述原始图像进行行滤波，并对行滤波结果进行列滤波之前，所述方法还包括：
将所述滤波系数模板转换为行向量和列向量；
所述行滤波，具体包括：
采用所述行向量进行滤波；
所述列滤波，具体包括：
采用所述列向量进行滤波。

4.如权利要求3所述的方法，其特征在于，采用所述行向量进行滤波，具体包括：
将所述行向量中的各元素变换为整型数；
采用变换后的行向量进行滤波；
将滤波结果还原为浮点数；
采用所述列向量进行滤波，具体包括：
将所述列向量中的各元素变换为整型数；
采用变换后的列向量进行滤波；
将滤波结果还原为浮点数。

5.如权利要求2所述的方法，其特征在于，根据所述第一中间图像和所述第二中间图像，生成滤波图像，具体包括：
针对第一中间图像中的每个像素，确定该像素的灰度值与所述第二中间图像中对应位置的像素的灰度值的均值，将该均值作为生成的滤波图像中对应位置的像素的灰度值。

6.如权利要求1所述的方法，其特征在于，根据所述滤波图像的局部像素信息和整体像素信息，对所述滤波图像进行增强处理，生成增强图像，具体包括：
生成所述滤波图像的积分图；
根据所述积分图，确定所述滤波图像中各像素的灰度值的方差；
根据所述方差，确定最大增强系数；
根据所述滤波图像的局部像素信息和整体像素信息，以及所述最大增强系数，确定所述滤波图像中像素的实际增强系数；
根据所述实际增强系数，对所述滤波图像进行增强处理，生成增强图像。

7.如权利要求1所述的方法，其特征在于，对所述类梯度图进行二值化处理，生成二值图像，具体包括：
确定所述类梯度图的全局分割阈值；
根据所述全局分割阈值，确定第一子分割阈值和第二子分割阈值；
按照所述第一子分割阈值，对所述梯度图进行二值化处理，生成第四中间图像；
按照所述第二子分割阈值，对所述梯度图进行二值化处理，生成第五中间图像；
根据所述第四中间图像和所述第五中间图像，对所述第四中间图像进行膨胀运算，...

【专利技术属性】
技术研发人员：丁威，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人