【技术实现步骤摘要】
本专利技术涉及图像处理
,具体涉及一种图像中文本区域的检测方法。
技术介绍
目前常用的图像中文本区域的检测方法有基于连通域的方法、基于边缘特征的方法和基于纹理特征的方法。各方法的具体说明如下:基于连通域的方法,假设同一区域的字符具有相似的颜色和亮度,并且与背景区域的颜色存在较大差异的基础上,采用自底向上的方法从图像中提取连通区域,然后利用几何约束构造启发式规则进行连通域分析,将子区域合并得到最终的文本区域。基于边缘特征的方法,是利用文本区域具有丰富的边缘信息这一特点进行文本区域检测,首先采用某种边缘检测算子从原图像中检测出边缘,然后通过形态学方法将边缘连接成本块,过滤不符合规则的非文本区域,得到最终的文本区域。基于纹理的方法,把文本区域看作是一种可与背景区分开的特殊的纹理,通常采用Gabor变换、小波变换和傅里叶变换等方法检测图像中文本区域的纹理特征,并利用SVM从候选的文本区域中验证真实的文本区域,对于背景复杂的图像取得了较好的效果。但是,对于具有复杂背景的图像,因为复杂背景对图像中文本区域产生的干扰大,上述现有的图像中文本区域的检测方法均不适用。专利技 ...
【技术保护点】
一种图像中文本区域的检测方法,其特征在于,包括:将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图像构成所述图像;基于预设的字符识别规则,确定各子图像的文本置信度;基于各子图像的文本置信度及预设的文本置信度门限,确定目标连通域,所述目标连通域用于确定所述图像中包含的各文本区域;基于预设的连通域确定规则,确定所述图像包含的各连通域;基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包含的各文本区域。
【技术特征摘要】
1.一种图像中文本区域的检测方法,其特征在于,包括:将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图像构成所述图像;基于预设的字符识别规则,确定各子图像的文本置信度;基于各子图像的文本置信度及预设的文本置信度门限,确定目标连通域,所述目标连通域用于确定所述图像中包含的各文本区域;基于预设的连通域确定规则,确定所述图像包含的各连通域;基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包含的各文本区域。2.根据权利要求1所述的方法,其特征在于,所述将图像划分为多个子图像,包括:将图像划分为尺寸一致的多个子图像。3.根据权利要求1所述的方法,其特征在于,所述基于预设的字符识别规则,确定各子图像的文本置信度,包括:基于预设的字符识别规则,识别各子图像中的字符,并确定各子图像中各字符的置信度;基于所述各子图像中各字符的置信度,确定各子图像的文本置信度。4.根据权利要求3所述的方法,其特征在于,所述基于所述各子图像中各字符的置信度,确定各子图像的文本置信度,包括:基于所述各子图像中各字符的置信度,通过文本置信度计算式,确定各子图像的文本置信度;所述文本置信度计算式为: C ...
【专利技术属性】
技术研发人员:刘立,刘艳洋,吴诗展,
申请(专利权)人:北京好运到信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。