一种文本行区域检测方法、装置、介质和电子设备制造方法及图纸

技术编号:20364295 阅读:29 留言:0更新日期:2019-02-16 17:09
本发明专利技术提供了一种文本行区域检测方法、装置、介质和电子设备,采用MSER算法和CTPN算法相结合的方式检测文本行区域,再结合非极大值抑制方法对MSER算法和CTPN算法检测结果的重合区域进行筛选得到文本行区域。可以看出,本发明专利技术采用由粗到细的相互校验策略检测文本行区域,在保证检测全面性的基础上提高检测准确性,最后通过非极大值抑制方法筛选得到文本行区域,进一步提高文本行区域检测的鲁棒性和准确性,从而缓解甚至避免字符漏检的问题。

【技术实现步骤摘要】
一种文本行区域检测方法、装置、介质和电子设备
本专利技术涉及图像处理
,更具体地说,涉及一种文本行区域检测方法、装置、介质和电子设备。
技术介绍
图像中的文本部分常包含图像的重要信息,对图像进行文本识别是实现图像内容理解的基础技术。而文本识别的前提则是检测图像中的文本区域。现阶段,常采用检测文本行的方式检测文本区域,具体将字符、字符的一部分或者多字符作为一个整体区域进行检测。但是,由于同一文本行区域内不同字符之间可能差异大、距离远,作为一个整体检测出来的难度很大,容易出现某些字符漏检的问题。
技术实现思路
有鉴于此,本专利技术提供一种文本行区域检测方法、装置、介质和电子设备,以解决现有文本行区域检测容易出现字符漏检的问题。技术方案如下:基于本专利技术实施例的一方面,本专利技术实施例提供一种文本行区域检测方法,包括:利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域;利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域;对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域。可选的,在所述利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域之前,所述方法还包括:从所述MSER区域中剔除不符合预设文本行区域确定规则的区域。可选的,所述预设文本行区域确定规则包括粗过滤规则和细过滤规则,所述从所述MSER区域中剔除不符合预设文本行区域确定规则的区域,包括:从所述MSER区域中剔除每两个所述MSER区域之间的中心距离不符合粗过滤规则的区域得到候选区域;从所述候选区域中剔除像素点和/或区域宽高比不符合细过滤规则的区域。可选的,在所述对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域之前,所述方法还包括:从所述MSER区域中剔除与所述第一CTPN区域的非重合区域。可选的,在所述对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域之后,所述方法还包括:利用所述CTPN算法对所述文本行区域与所述MSER区域的非重合区域进行文本行区域检测;如果在所述文本行区域与所述MSER区域的非重合区域中检测到第二CTPN区域,对所述第二CTPN区域和所述文本行区域与所述MSER区域的重合区域进行合并。可选的,所述利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域,包括:对待检测图像进行灰度转换得到灰度图像;对所述灰度图像进行二值化处理得到二值化图像;将所述二值化图像进行连通域分析得到MSER区域。可选的,所述对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域,包括:获取所述MSER区域和所述第一CTPN区域的重合区域的MSER检测分数和CTPN检测分数,其中,所述MSER检测分数用于表征所述MSER区域为文本行区域的可能性,所述CTPN检测分数用于表征所述第一CTPN区域为文本行区域的可能性;根据所述MSER检测分数和所述CTPN检测分数,计算所述MSER区域和所述第一CTPN区域的重合区域的综合分数;按照综合分数依次从所述MSER区域和所述第一CTPN区域的重合区域中选取作为抑制框的第一重合区域以及作为被抑制框的第二重合区域;其中,所述第一重合区域的综合分数大于所述第二重合区域的综合分数;计算所述第一重合区域和所述第二重合区域的重合面积比率;如果所述重合面积比率大于预设比率阈值,从所述MSER区域和所述第一CTPN区域的重合区域中剔除所述第二重合区域;将完成剔除操作的所述MSER区域和所述第一CTPN区域的重合区域确定为文本行区域。基于本专利技术实施例的再一方面,本专利技术实施例提供一种文本行区域检测装置,包括:第一检测模块,用于利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域;第二检测模块,用于利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域;抑制操作模块,用于对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域。基于本专利技术实施例的再一方面,本专利技术实施例提供一种存储介质,其上存储有程序,所述程序被处理器执行时实现前文所述文本行区域检测方法。基于本专利技术实施例的再一方面,本专利技术实施例提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行前文所述文本行区域检测方法。本专利技术实施例提供的文本行区域检测方法、装置、介质和电子设备,采用MSER算法和CTPN算法相结合的方式检测文本行区域,再结合非极大值抑制方法对MSER算法和CTPN算法检测结果的重合区域进行筛选得到文本行区域。可以看出,本专利技术采用由粗到细的相互校验策略检测文本行区域,在保证检测全面性的基础上提高检测准确性,最后通过非极大值抑制方法筛选得到文本行区域,进一步提高文本行区域检测的鲁棒性和准确性,从而缓解甚至避免字符漏检的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的文本行区域检测方法的方法流程图;图2为本专利技术实施例提供的文本行区域检测方法的部分方法流程图;图3为本专利技术实施例提供的文本行区域检测方法的另一部分方法流程图;图4a为居民身份证图像示例;图4b为利用MSER算法进行文本行区域检测后的居民身份证图像示例;图4c为利用CTPN算法进行文本行区域检测后的居民身份证图像示例;图4d为进行非极大值抑制操作后的居民身份证图像示例;图5为本专利技术实施例提供的文本行区域检测方法的另一方法流程图;图6为本专利技术实施例提供的文本行区域检测方法的再一方法流程图;图7为本专利技术实施例提供的文本行区域检测方法的又一方法流程图;图8为本专利技术实施例提供的文本行区域检测装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提出的文本行区域检测方法可以适用于检测场景图像中文本行区域的情况,可以由配置有摄像头的智能手机、平板电脑或者笔记本等设备来执行。如图1所示,其示出了本专利技术实施例提供的文本行区域检测方法的方法流程图,包括如下步骤:S10,利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域。以下对MSER(MaximallyStableExtrenalRegion,最大稳定极值)算法进行简单介绍:MSER算法是由Matas等人提出的一种仿射特征区域提取算法,其提取的MSER区域内部灰度几乎不变,但是可以和背景产生十分强烈的对比,并且该MSER区域能够在多重阈值下保持形状不变。一般文本内部的灰度变化本文档来自技高网...

【技术保护点】
1.一种文本行区域检测方法,其特征在于,包括:利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域;利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域;对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域。

【技术特征摘要】
1.一种文本行区域检测方法,其特征在于,包括:利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域;利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域;对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域。2.根据权利要求1所述的方法,其特征在于,在所述利用连接文字提议网络CTPN算法对所述MSER区域进行文本行区域检测得到第一CTPN区域之前,所述方法还包括:从所述MSER区域中剔除不符合预设文本行区域确定规则的区域。3.根据权利要求2所述的方法,其特征在于,所述预设文本行区域确定规则包括粗过滤规则和细过滤规则,所述从所述MSER区域中剔除不符合预设文本行区域确定规则的区域,包括:从所述MSER区域中剔除每两个所述MSER区域之间的中心距离不符合粗过滤规则的区域,得到候选区域;从所述候选区域中剔除像素点和/或区域宽高比不符合细过滤规则的区域。4.根据权利要求1-3其中之一所述的方法,其特征在于,在所述对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域之前,所述方法还包括:从所述MSER区域中剔除与所述第一CTPN区域的非重合区域。5.根据权利要求1所述的方法,其特征在于,在所述对所述MSER区域和所述第一CTPN区域的重合区域进行非极大值抑制操作得到文本行区域之后,所述方法还包括:利用所述CTPN算法对所述文本行区域与所述MSER区域的非重合区域进行文本行区域检测;如果在所述文本行区域与所述MSER区域的非重合区域中检测到第二CTPN区域,对所述第二CTPN区域和所述文本行区域与所述MSER区域的重合区域进行合并。6.根据权利要求1所述的方法,其特征在于,所述利用最大稳定极值MSER算法对待检测图像进行文本行区域检测得到MSER区域,包括:对待检测图像进行灰度转换得到灰度图像;对所述灰度图像进行二值...

【专利技术属性】
技术研发人员:马文伟刘设伟王强
申请(专利权)人:泰康保险集团股份有限公司泰康在线财产保险股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1