一种文本图像清晰度判断方法及系统技术方案

技术编号:22595845 阅读:50 留言:0更新日期:2019-11-20 11:39
本发明专利技术公开了一种文本图像清晰度判断方法及系统,该方案包括:对待判别图像进行图像预处理,得到预处理图像;采用二值化方法计算所述预处理图像的二值图像清晰度评价值;采用梯度方法计算所述预处理图像的梯度图像清晰度评价值;根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度。本发明专利技术本发明专利技术结合三个评价指标(二值图像清晰度评价值中的两个比值和梯度图像清晰度评价值)进行判断,提高了判断的准确性。本发明专利技术结合实际图像可能存在的噪声进行处理,对文本图像的清晰度判断性能更加稳定且具有通用性。

A method and system to judge the clarity of text image

The invention discloses a method and system for judging the sharpness of text image, which includes: image preprocessing for the image to be discriminated to obtain the preprocessed image; calculating the evaluation value of the binary image sharpness of the preprocessed image by the binary method; calculating the evaluation value of the gradient image sharpness of the preprocessed image by the gradient method; and calculating the evaluation value of the binary image clearness according to the binary image The degree evaluation value and the gradient image definition evaluation value determine the image definition and calculate the reliability of the definition judgment. The invention combines three evaluation indexes (two ratios in the evaluation value of binary image definition and the evaluation value of gradient image definition) to judge, so as to improve the accuracy of judgment. The method processes the noise that may exist in the actual image, and has a more stable and universal clearness judgment performance for the text image.

【技术实现步骤摘要】
一种文本图像清晰度判断方法及系统
本专利技术涉及图像处理
,特别是涉及一种文本图像清晰度判断方法及系统。
技术介绍
图像的清晰度是指影像上各细部影纹及其边界的清晰程度,边缘高频分量越多,图像越清晰,这与人眼的观察特性一致。在有参考图像的情况下,清晰图像的边缘高频分量较模糊图像多,这种方法在光学成像领域用的较多。无参考图像的情况下,需要对单张图像进行质量评价。随着计算机和数字采集技术的发展,数字化文档图像的应用范围越来越广,字符识别技术和文档图像处理技术日趋成熟,基于文档图像的信息办公自动化趋势显著。文档处理是办公自动化的一个重要的组成部分,在扫描输入过程中,文档图象由于各种原因不可避免的会引起倾斜及图像清晰度的下降。然而绝大多数的字符识别算法对文档图象的降质十分敏感。因此特别是在大规模文档图像扫描、处理过程中,清晰度的自动检测更加重要,给后续图像处理提供保证。受光学成像系统发展的推进,有参考的图像清晰度评价方法研究较多,且多数基于散焦原理,无参考的图像清晰度评价方法研究相对较少。另外,评价指标的数学模型通常需要根据具体的应用做相应的改进,在场景图像中性能良好的函数可能作用在文本图像上效果不理想。因此,如何提供一种通用性强且稳定性好的文本图像清晰度的判断方案成为本领域亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种文本图像清晰度判断方法及系统,以解决上述问题。为实现上述目的,本专利技术提供了一种文本图像清晰度判断方法,所述方法包括:对待判别图像进行图像预处理,得到预处理图像;采用二值化方法计算所述预处理图像的二值图像清晰度评价值;采用梯度方法计算所述预处理图像的梯度图像清晰度评价值;根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度。可选的,所述对待判别图像进行图像预处理,具体包括:检测所述待判别图像的边缘灰度值,剔除所述待判别图像中所述边缘灰度值大于白色亮点灰度阈值的点,得到噪声滤除图像;将所述噪声滤除图像放大或缩小到设定尺寸,得到预处理图像。可选的,所述采用二值化方法计算所述预处理图像的二值图像清晰度评价值,具体包括:对所述预处理图像按照设定模糊度进行模糊处理;选取不同第一边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第一边缘图像;根据所述边缘图像中的线条计算图像的旋转角度,并根据所述旋转角度计算仿射矩阵;依据所述仿射矩阵进行仿射变换使得含有表格的图像中的水平边框或含有的水平线的水平,得到旋转图像;对所述旋转图像进行二值化局部处理获得二值化图像;再滤除所述二值化图像中的线条和非文字区域,得到滤噪二值图像;选取不同于所述第一边缘阈值的多个不同的所述第二边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第二边缘图像;对所述第一边缘图像和所述第二边缘图像取反,得到参考图像;滤除所述第一边缘图像的非文字区域;结合所述参考图像修正所述第一边缘图像的边缘信息,得到修正图像;利用所述修正图像对所述滤噪二值图像的边缘信息进行修正,得到修正二值图像;对所述修正二值图像定位轮廓区域;对定位的轮廓区域,删除非文字区域,得到含有文字区域的二值化图像:遍历所述文字区域,分别以二值化阈值th+5、th和th-5采用OTSU算法对所述含有文字区域的二值化图像进行二值化处理,分别得到阈值二值化图像rect1、rect、rect2,统计所述阈值二值化图像rect1、rect2与所述阈值二值化图像rect不等的像素点数和零元个数;计算所述阈值二值化图像rect与所述阈值二值化图像rect1、rect2不等的像素点数与总像素数目的比值bw_delta2area,计算所述阈值二值化图像rect零元个数与总像素数目的比值bw_delta2bpc,得到二值图像清晰度评价值。可选的,所述采用梯度方法计算所述预处理图像的梯度图像清晰度评价值,具体包括:利用Sobel算子计算所述预处理图像中的像素点水平方向的水平梯度值和像素点垂直方向的垂直梯度值;计算水平梯度值的平方根与垂直梯度值的平方根的和的绝对值SMD_val,得到梯度图像清晰度评价值。可选的,所述根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度,具体包括:根据梯度图像清晰度评价阈值SMD_thresh和二值图像清晰度评价阈值bw_delta2area_thresh、bw_delta2bpc_thresh,判断是否满足图像清晰的条件:smd_val>SMD_thresh)||(bw_delta2area<bw_delta2area_thresh)||(bw_delta2bpc<bw_delta2bpc_thresh),得到清晰度判断结果;当所述清晰度判断结果表示是时,则判断所述待判别图像为清晰,并计算判断清晰可信度。当所述清晰度判断结果表示否时,则判断所述待判别图像为不清晰,计算判断不清晰可信度。本专利技术还提供了一种文本图像清晰度判断系统,所述系统包括:预处理单元,用于对待判别图像进行图像预处理,得到预处理图像;二值化单元,用于采用二值化方法计算所述预处理图像的二值图像清晰度评价值;梯度计算单元,用于采用梯度方法计算所述预处理图像的梯度图像清晰度评价值;清晰度判断单元,用于根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度。可选的,所述预处理单元具体包括:噪声滤除子单元,用于检测所述待判别图像的边缘灰度值,剔除所述待判别图像中所述边缘灰度值大于白色亮点灰度阈值的点,得到噪声滤除图像;缩放子单元,用于将所述噪声滤除图像放大或缩小到设定尺寸,得到预处理图像。可选的,所述二值化单元具体包括:模糊化子单元,用于对所述预处理图像按照设定模糊度进行模糊处理;第二边缘检测子单元,用于选取不同第一边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第一边缘图像;图像旋转子单元,用于根据所述边缘图像中的线条计算图像的旋转角度,并根据所述旋转角度计算仿射矩阵;依据所述仿射矩阵进行仿射变换使得含有表格的图像中的水平边框或含有的水平线的水平,得到旋转图像;二值滤噪子单元,用于对所述旋转图像进行二值化局部处理获得二值化图像;再滤除所述二值化图像中的线条和非文字区域,得到滤噪二值图像;第二边缘检测子单元,用于选取不同于所述第一边缘阈值的多个不同的所述第二边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第二边缘图像;取反子单元,用于对所述第一边缘图像和所述第二边缘图像取反,得到参考图像;边缘修正子单元,用于滤除所述第本文档来自技高网...

【技术保护点】
1.一种文本图像清晰度判断方法,其特征在于,所述方法包括:/n对待判别图像进行图像预处理,得到预处理图像;/n采用二值化方法计算所述预处理图像的二值图像清晰度评价值;/n采用梯度方法计算所述预处理图像的梯度图像清晰度评价值;/n根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度。/n

【技术特征摘要】
1.一种文本图像清晰度判断方法,其特征在于,所述方法包括:
对待判别图像进行图像预处理,得到预处理图像;
采用二值化方法计算所述预处理图像的二值图像清晰度评价值;
采用梯度方法计算所述预处理图像的梯度图像清晰度评价值;
根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度。


2.根据权利要求1所述的文本图像清晰度判断方法,其特征在于,所述对待判别图像进行图像预处理,具体包括:
检测所述待判别图像的边缘灰度值,剔除所述待判别图像中所述边缘灰度值大于白色亮点灰度阈值的点,得到噪声滤除图像;
将所述噪声滤除图像放大或缩小到设定尺寸,得到预处理图像。


3.根据权利要求1所述的文本图像清晰度判断方法,其特征在于,所述采用二值化方法计算所述预处理图像的二值图像清晰度评价值,具体包括:
对所述预处理图像按照设定模糊度进行模糊处理;
选取不同第一边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第一边缘图像;
根据所述边缘图像中的线条计算图像的旋转角度,并根据所述旋转角度计算仿射矩阵;依据所述仿射矩阵进行仿射变换使得含有表格的图像中的水平边框或含有的水平线的水平,得到旋转图像;
对所述旋转图像进行二值化局部处理获得二值化图像;再滤除所述二值化图像中的线条和非文字区域,得到滤噪二值图像;
选取不同于所述第一边缘阈值的多个不同的所述第二边缘阈值,根据边缘像素数目设定值,利用canny边缘检测算法提取所述待判别图像的边缘,得到第二边缘图像;
对所述第一边缘图像和所述第二边缘图像取反,得到参考图像;
滤除所述第一边缘图像的非文字区域;结合所述参考图像修正所述第一边缘图像的边缘信息,得到修正图像;
利用所述修正图像对所述滤噪二值图像的边缘信息进行修正,得到修正二值图像;
对所述修正二值图像定位轮廓区域;对定位的轮廓区域,删除非文字区域,得到含有文字区域的二值化图像:
遍历所述文字区域,分别以二值化阈值th+5、th和th-5采用OTSU算法对所述含有文字区域的二值化图像进行二值化处理,分别得到阈值二值化图像rect1、rect、rect2,统计所述阈值二值化图像rect1、rect2与所述阈值二值化图像rect不等的像素点数和零元个数;
计算所述阈值二值化图像rect与所述阈值二值化图像rect1、rect2不等的像素点数与总像素数目的比值bw_delta2area,计算所述阈值二值化图像rect零元个数与总像素数目的比值bw_delta2bpc,得到二值图像清晰度评价值。


4.根据权利要求3所述的文本图像清晰度判断方法,其特征在于,所述采用梯度方法计算所述预处理图像的梯度图像清晰度评价值,具体包括:
利用Sobel算子计算所述预处理图像中的像素点水平方向的水平梯度值和像素点垂直方向的垂直梯度值;
计算水平梯度值的平方根与垂直梯度值的平方根的和的绝对值SMD_val,得到梯度图像清晰度评价值。


5.根据权利要求4所述的文本图像清晰度判断方法,其特征在于,所述根据所述二值图像清晰度评价值和所述梯度图像清晰度评价值判断图像清晰度并计算清晰度判断的可信度,具体包括:
根据梯度图像清晰度评价阈值SMD_thresh和二值图像清晰度评价阈值bw_delta2area_thresh、bw_delta2bpc_thresh,判断是否满足图像清晰的条件:smd_val>SMD_thresh)||(bw_delta2area<bw_delta2area_thresh)||(bw_delta2bpc<bw_delta2bpc_thresh),得到清晰度判断结果;
当所述清晰度判断结果表示是时,则判断所述待判别图像为清晰,并计算判断清晰可信度。
当所述清晰度判断结果表示否时,则判断所述待判别图像为不清晰,计算判断不清晰可信度。


6.一种文本图像清晰度判断系统,其特征在于,所述系统包括:
预处理单元,用于对待判别图像进行图像预处理,得...

【专利技术属性】
技术研发人员:严京旗张成栋钱之越郭利敏戴文静
申请(专利权)人:南通使爱智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1