文本检测方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：24093634 阅读：18 留言：0更新日期：2020-05-09 09:13

本发明专利技术实施例公开了一种文本检测方法、装置、电子设备以及存储介质，其中，该文本检测方法包括：获取待检测图像，在待检测图像中构建每个文本元素对应的检测框，分别提取每个检测框对应区域的纹理特征和几何特征，并获取各检测框之间的关联关系，根据关联关系、纹理特征以及几何特征对检测框进行分类，得到分类后检测框，基于分类后检测框对待检测图像进行文本检测，该方案可以有效地提高文本检测的准确率。

Text detection method, device, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
文本检测方法、装置、电子设备以及存储介质
本专利技术涉及计算机
，具体涉及一种文本检测方法、装置、电子设备以及存储介质。
技术介绍
自然场景文本检测在现实生活中具有极其的重要的广泛应用，例如文本检索、路牌识别和试卷智能批改等。但是自然场景中各种不可控干扰因素，如光影遮蔽、拍摄角度、异物遮挡、以及文本自身的一些固有属性如艺术字、变形字或残缺字等的影响，使得自然场景文本检测依然是一项难度很大的任务。不过，随着近年来人工智能(AI，ArtificialIntelligence)技术的发展，基于深度学习算法的自然场景文本检测技术在性能上也取得了长足的进步。目前，较为常用的文本检测技术主要是“基于回归(regression-based)的方法”，但在对现有技术的研究和实践过程中，本专利技术的专利技术人发现，当前基于回归的方法仅能处理矩形文本行情况，当文本的形状为曲线形时，其预测的检测框无法准确的覆盖所有文本区域；另外，对于长文本行，一旦文本行的宽高比大于预设的预测阈值，也会出现丢框或者预测不完整问题，所以，现有的文本检测方案的检测效果并不佳。
技术实现思路
本专利技术实施例提供一种文本检测方法、装置、电子设备以及存储介质，可以提高文本检测的准确率。本专利技术实施例提供了一种文本检测方法，包括：获取待检测图像，所述待检测图像包括待检测文本，所述待检测文本包括多个文本元素；在所述待检测图像中构建每个文本元素对应的检测框；分别提取每个检测框对应区域的纹理特征和几何特征...

【技术保护点】
1.一种文本检测方法，其特征在于，包括：/n获取待检测图像，所述待检测图像包括待检测文本，所述待检测文本包括多个文本元素；/n在所述待检测图像中构建每个文本元素对应的检测框；/n分别提取每个检测框对应区域的纹理特征和几何特征，并获取各检测框之间的关联关系；/n根据关联关系、纹理特征以及几何特征对检测框进行分类，得到分类后检测框；/n基于分类后检测框对待检测图像进行文本检测。/n

【技术特征摘要】
1.一种文本检测方法，其特征在于，包括：
获取待检测图像，所述待检测图像包括待检测文本，所述待检测文本包括多个文本元素；
在所述待检测图像中构建每个文本元素对应的检测框；
分别提取每个检测框对应区域的纹理特征和几何特征，并获取各检测框之间的关联关系；
根据关联关系、纹理特征以及几何特征对检测框进行分类，得到分类后检测框；
基于分类后检测框对待检测图像进行文本检测。

2.根据权利要求1所述的方法，其特征在于，所述根据关联关系、纹理特征以及几何特征对检测框进行分类，得到分类后检测框，包括：
根据关联关系计算每个检测框对应的相似度函数；
基于纹理特征、几何特征以及相似度函数对检测框进行分类，得到分类后检测框。

3.根据权利要求2所述的方法，其特征在于，所述基于纹理特征、几何特征以及相似度函数对检测框进行分类，得到分类后检测框，包括：
根据纹理特征、几何特征以及相似度函数，分别构建待检测图像对应的纹理特征图以及待检测图像对应的几何特征图；
基于所述纹理特征图以及几何特征图对检测框进行分类，得到分类后检测框。

4.根据权利要求3所述的方法，其特征在于，所述根据纹理特征、几何特征以及相似度函数，分别构建待检测图像对应的纹理特征图以及待检测图像对应的几何特征图，包括：
通过纹理特征以及相似度函数计算待检测图像对应的纹理特征点；
基于所述纹理特征点构建待检测图像对应的纹理特征图；
通过几何特征以及相似度函数计算待检测图像对应的几何特征点；
基于所述几何特征点构建待检测图像对应的几何特征图。

5.根据权利要求3所述的方法，其特征在于，所述基于所述纹理特征图以及几何特征图对检测框进行分类，得到分类后检测框，包括：
对所述纹理特征图以及几何特征图进行融合，得到融合后特征图；
通过所述融合后特征图对检测框的所属类别进行预测；
基于预测结果对检测框进行分类，得到分类后检测框。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述基于分类后检测框对待检测图像进行文本检测，包括：
将属于同一类别的分类后检测框确定为一个同源组；
根据同源组中的分类后检测框构建用于文本检测的文本框；
基于所述文本框对待检测图像进行文本检测。

7.根据权利要求6所述的方法，其特征在于，所述根据同源组中的分类后检测框构建用于文本检测的文本框，包括：
确定同源组中每个分类后检测框对应的中心点；
获取同源组中每个分类后检测框对应的尺寸；
基于中心点以及尺寸构建用于文本检测的文本框。

...

【专利技术属性】
技术研发人员：刘皓，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人