一种图像中文本区域的检测方法技术

技术编号：13773312 阅读：156 留言：0更新日期：2016-09-29 22:49

本发明专利技术公开一种图像中文本区域的检测方法，包括：将图像划分为多个子图像，所述多个子图像之间无重叠区域且所述多个子图像构成所述图像；基于预设的字符识别规则，确定各子图像的文本置信度；基于各子图像的文本置信度及预设的文本置信度门限，确定目标连通域，所述目标连通域用于确定所述图像中包含的各文本区域；基于预设的连通域确定规则，确定所述图像包含的各连通域；基于所述图像包含的各连通域以及所述目标连通域，确定所述图像中包含的各文本区域。相比现有技术，本发明专利技术提出的图像中文本区域的检测方法，通过划分图像为多个子图像，并确定各子图像的文本置信度来定位出背景相对复杂的图像中的文本区域，适用于具有复杂背景的图像。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，具体涉及一种图像中文本区域的检测方法。
技术介绍
目前常用的图像中文本区域的检测方法有基于连通域的方法、基于边缘特征的方法和基于纹理特征的方法。各方法的具体说明如下：基于连通域的方法，假设同一区域的字符具有相似的颜色和亮度，并且与背景区域的颜色存在较大差异的基础上，采用自底向上的方法从图像中提取连通区域，然后利用几何约束构造启发式规则进行连通域分析，将子区域合并得到最终的文本区域。基于边缘特征的方法，是利用文本区域具有丰富的边缘信息这一特点进行文本区域检测，首先采用某种边缘检测算子从原图像中检测出边缘，然后通过形态学方法将边缘连接成本块，过滤不符合规则的非文本区域，得到最终的文本区域。基于纹理的方法，把文本区域看作是一种可与背景区分开的特殊的纹理，通常采用Gabor变换、小波变换和傅里叶变换等方法检测图像中文本区域的纹理特征，并利用SVM从候选的文本区域中验证真实的文本区域，对于背景复杂的图像取得了较好的效果。但是，对于具有复杂背景的图像，因为复杂背景对图像中文本区域产生的干扰大，上述现有的图像中文本区域的检测方法均不适用。专利技...

【技术保护点】
一种图像中文本区域的检测方法，其特征在于，包括：将图像划分为多个子图像，所述多个子图像之间无重叠区域且所述多个子图像构成所述图像；基于预设的字符识别规则，确定各子图像的文本置信度；基于各子图像的文本置信度及预设的文本置信度门限，确定目标连通域，所述目标连通域用于确定所述图像中包含的各文本区域；基于预设的连通域确定规则，确定所述图像包含的各连通域；基于所述图像包含的各连通域以及所述目标连通域，确定所述图像中包含的各文本区域。

【技术特征摘要】
1.一种图像中文本区域的检测方法，其特征在于，包括：将图像划分为多个子图像，所述多个子图像之间无重叠区域且所述多个子图像构成所述图像；基于预设的字符识别规则，确定各子图像的文本置信度；基于各子图像的文本置信度及预设的文本置信度门限，确定目标连通域，所述目标连通域用于确定所述图像中包含的各文本区域；基于预设的连通域确定规则，确定所述图像包含的各连通域；基于所述图像包含的各连通域以及所述目标连通域，确定所述图像中包含的各文本区域。2.根据权利要求1所述的方法，其特征在于，所述将图像划分为多个子图像，包括：将图像划分为尺寸一致的多个子图像。3.根据权利要求1所述的方法，其特征在于，所述基于预设的字符识别规则，确定各子图像的文本置信度，包括：基于预设的字符识别规则，识别各子图像中的字符，并确定各子图像中各字符的置信度；基于所述各子图像中各字符的置信度，确定各子图像的文本置信度。4.根据权利要求3所述的方法，其特征在于，所述基于所述各子图像中各字符的置信度，确定各子图像的文本置信度，包括：基于所述各子图像中各字符的置信度，通过文本置信度计算式，确定各子图像的文本置信度；所述文本置信度计算式为： C ...

【专利技术属性】
技术研发人员：刘立，刘艳洋，吴诗展，
申请(专利权)人：北京好运到信息科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人