文本图像的清晰度识别方法技术

技术编号:29309720 阅读:27 留言:0更新日期:2021-07-17 02:09
本申请实施例提供了一种文本图像的清晰度识别方法,涉及图像识别技术领域,该方法包括将获取的文本图像进行归一化处理,得到归一化图像;以归一化图像中各像素点的像素值所构成的向量矩阵,作为预先训练的文字检测模型的输入进行运算,得到文字置信度特征图,文字置信度特征图中像素点的灰度值代表其所在区域为文字的置信度;对文字置信度特征图进行二值化处理,得到二值化图像;提取出二值化图像中的文字区域;计算文本图像中与文字区域对应的目标区域的纹理变化值;基于纹理变化值和/或文字区域的数量确定出文本图像的清晰度。本申请实施例提供的文本图像的清晰度识别方法可提高文本图像的清晰度识别效率。提高文本图像的清晰度识别效率。提高文本图像的清晰度识别效率。

【技术实现步骤摘要】
文本图像的清晰度识别方法


[0001]本申请涉及图像识别
,尤其涉及一种文本图像的清晰度识别方法。

技术介绍

[0002]在对文本图像进行识别过程中,常常需要对文本图像的清晰度进行识别。
[0003]目前,对于文本图像的清晰度识别,常用的方案是首先对全部文字进行检测定位,随后进行文字识别,最后对于已知特点字段的识别结果进行判定。然而,采用这样的方式,不仅对测试问题提出了多种要求,同时文字检测识别模型的运算对资源也提出了很高要求,导致识别的效率较低。
[0004]因此,如何提供一种有效的方案以提高文本图像的清晰度识别效率,已成为现有技术中一亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种文本图像的清晰度识别方法,用以解决现有技术存在的文本图像的清晰度识别效率较低的问题。
[0006]为解决上述技术问题,本申请实施例是这样实现的:
[0007]本申请实施例提供了一种文本图像的清晰度识别方法,包括:
[0008]将获取的文本图像进行归一化处理,得到归一化图像;
[0009]将依据所述归一化图像中各像素点的像素值所构建的向量矩阵,作为预先训练的文字检测模型的输入进行运算,得到与所述归一化图像对应的文字置信度特征图,其中,所述文字置信度特征图中各像素点的灰度值,表征所述归一化图像中与所述各像素点对应的像素点位于文本区域的置信度;
[0010]对所述文字置信度特征图进行二值化处理,得到二值化图像;
[0011]提取出所述二值化图像中灰度值为1的第一目标区域;
[0012]计算所述文本图像中与所述第一目标区域对应的第二目标区域的纹理变化值;
[0013]基于所述纹理变化值和所述第一目标区域的数量确定出所述文本图像的清晰度,或基于所述纹理变化值确定出所述文本图像的清晰度。
[0014]在一个可能的设计中,所述提取出所述二值化图像中灰度值为1的第一目标区域,包括:
[0015]通过连通域分析算法提取出所述二值化图像中的灰度值为1的至少一个备选区域;
[0016]将所述至少一个备选区域中宽度大于预设宽度、高度大于预设高度且宽高比例处于预设比例范围内的区域作为所述第一目标区域。
[0017]在一个可能的设计中,所述计算所述文本图像中与所述第一目标区域对应的第二目标区域的纹理变化值,包括:
[0018]计算所述第二目标区域中各像素点的图像纹理值;
[0019]基于所述第二目标区域中各像素点的图像纹理值,确定出所述第二目标区域中相邻像素点之间的纹理变化值;
[0020]将所有纹理变化值中数值大小处于预设排名的纹理变化值作为所述第二目标区域的纹理变化值。
[0021]在一个可能的设计中,所述方法还包括:
[0022]对所述第二目标区域进行模糊处理;
[0023]所述计算所述第二目标区域中各像素点的图像纹理值,包括:
[0024]计算模糊处理后的所述第二目标区域中各像素点的图像纹理值。
[0025]在一个可能的设计中,所述对所述第二目标区域进行模糊处理,包括:
[0026]通过高斯模糊算法或插值模糊算法对所述第二目标区域进行模糊处理。
[0027]在一个可能的设计中,计算所述第二目标区域中各像素点的图像纹理值所采用的算子为拉普拉斯算子或Canny算子。
[0028]在一个可能的设计中,将获取的文本图像进行归一化处理,包括:
[0029]将所述文本图像的图像通道顺序转换为指定顺序;
[0030]将图像通道顺序转换为指定顺序后的所述文本图像进行归一化处理。
[0031]在一个可能的设计中,在将获取的文本图像进行归一化处理之前,所述方法还包括:
[0032]将所述文本图像缩放至指定尺寸。
[0033]本申请实施例采用的上述技术方案能够达到以下有益效果:
[0034]通过将归一化处理后的文本图像中各像素点的像素值所构成的向量矩阵,作为文字检测模型的输入进行运算得到文字置信度特征图,并对文字置信度特征图进行二值化处理后提取出其中的文字区域,然后计算文本图像中与文字区域对应的目标区域的纹理变化值,并根据纹理变化值和第一目标区域的数量或者根据纹理变化值确定出文本图像的清晰度。如此,可降低文本图像的清晰度识别对资源的要求,提高文本图像的清晰度识别效率。
附图说明
[0035]此处所说明的附图用来提供对本文件的进一步理解,构成本文件的一部分,本文件的示意性实施例及其说明用于解释本文件,并不构成对本文件的不当限定。在附图中:
[0036]图1为本申请一个实施例提供的文本图像的清晰度识别方法的流程示意图。
[0037]图2为本申请一个实施例提供的电子设备的结构示意图。
[0038]图3为本申请一个实施例提供的文本图像的清晰度识别方法装置的结构示意图。
具体实施方式
[0039]为使本文件的目的、技术方案和优点更加清楚,下面将结合本文件具体实施例及相应的附图对本文件技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本文件一部分实施例,而不是全部的实施例。基于本文件中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
[0040]为了实现对文本图像的清晰度快速识别,本申请实施例提供了一种文本图像的清晰度识别方法,该文本图像的清晰度识别方法能够提高文本图像的清晰度识别效率。
[0041]下面将对本申请实施例提供的文本图像的清晰度识别方法进行详细说明。
[0042]本申请实施例提供的文本图像的清晰度识别方法可应用于用户终端,所述用户终端可以是,但不限于个人电脑、智能手机、平板电脑、膝上型便携计算机、个人数字助理等。
[0043]可以理解,所述执行主体并不构成对本申请实施例的限定。
[0044]可选地,该文本图像的清晰度识别方法的流程如图1所示,可以包括如下步骤:
[0045]步骤S101,将获取的文本图像进行归一化处理,得到归一化图像。
[0046]其中,所述文本图像可以是通过摄像机拍摄到的,也可以是从视频流中提取的一帧或多帧图像。文本图像的格式可以是,但不限于RGB、HSV格式等。本申请实施例中,文本图像的格式为RGB。
[0047]本申请实施例中,在将文本图像进行归一化处理之前,还可以将文本图像的图像通道顺序转换为指定顺序,该指定顺序与后续过程中的文字检测模型在训练时作为输入的图像的通道顺序相同,以确保文本图像清晰度识别的准确性,例如可以将文本图像的图像通道顺序转换为RGB、GRB或BGR等。
[0048]进一步的,在将获取的文本图像进行归一化处理之前,还可以将文本图像缩放至指定尺寸,该指定尺寸不宜过大,以避免运算量过大而导致清晰度识别的效率降低。
[0049]步骤S102,将依据归一化图像中各像素点的像素值所构建的向量矩阵,作为预先本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本图像的清晰度识别方法,其特征在于,包括:将获取的文本图像进行归一化处理,得到归一化图像;将依据所述归一化图像中各像素点的像素值所构建的向量矩阵,作为预先训练的文字检测模型的输入进行运算,得到与所述归一化图像对应的文字置信度特征图,其中,所述文字置信度特征图中各像素点的灰度值,表征所述归一化图像中与所述各像素点对应的像素点位于文本区域的置信度;对所述文字置信度特征图进行二值化处理,得到二值化图像;提取出所述二值化图像中灰度值为1的第一目标区域;计算所述文本图像中与所述第一目标区域对应的第二目标区域的纹理变化值;基于所述纹理变化值和所述第一目标区域的数量确定出所述文本图像的清晰度,或基于所述纹理变化值确定出所述文本图像的清晰度。2.根据权利要求1所述的方法,其特征在于,所述提取出所述二值化图像中灰度值为1的第一目标区域,包括:通过连通域分析算法提取出所述二值化图像中的灰度值为1的至少一个备选区域;将所述至少一个备选区域中宽度大于预设宽度、高度大于预设高度且宽高比例处于预设比例范围内的区域作为所述第一目标区域。3.根据权利要求1所述的方法,其特征在于,所述计算所述文本图像中与所述第一目标区域对应的第二目标区域的纹理...

【专利技术属性】
技术研发人员:唐天浩刘川贺汪明浩
申请(专利权)人:北京思图场景数据科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1