一种文本检测方法和装置制造方法及图纸

技术编号：26971767 阅读：26 留言：0更新日期：2021-01-06 00:03

本申请公开了一种文本检测方法和装置，该方法包括：获取包含文本的图片；对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。在得到文本检测结果后，由于可以使用预先训练的分类模型对检测结果中的文本框和非文本框进行分类，因此，可以确定出检测结果中哪些是文本框，哪些是非文本框，从而可以过滤掉其中的非文本框，仅保留文本框，改善文本检测效果；进一步地，在后续进行文本识别时，可以仅基于检测结果中的文本框进行文本识别，从而可以减少文本识别的次数，提高整个文本检测识别过程的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本检测方法和装置
本申请涉及文本检测领域，尤其涉及一种文本检测方法和装置。
技术介绍
目前，在很多应用场景下，都需要对图片中的文本进行识别，以得到图片中包含的文本。一般地，在对图片中的文本进行识别时，可以基于OCR（OpticalCharacterRecognition，光学字符识别）实现。具体地，首先，可以对图片进行文本检测，得到包含文本的文本框，其次，对文本框进行文本识别，进而得到图片中包含的文本。然而，在实际应用中，在使用OCR对图片进行文本检测时，在图片中包括复杂背景的情况下，检测结果中会包含非文本框，导致文本检测的检测效果不佳，严重影响后续的文本识别。
技术实现思路
本申请实施例提供一种文本检测方法和装置，用于解决目前在使用OCR对包含复杂背景的图片进行文本检测时，检测效果不佳的问题。为解决上述技术问题，本申请实施例是这样实现的：第一方面，提出一种文本检测方法，包括：获取包含文本的图片；对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。第二方面，提出一种文本检测装置，包括：获取单元，获取包含文本的图片；文本检测单元，对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；分类单元，基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。第三方面...

【技术保护点】
1.一种文本检测方法，其特征在于，包括：/n获取包含文本的图片；/n对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；/n基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。/n

【技术特征摘要】
1.一种文本检测方法，其特征在于，包括：
获取包含文本的图片；
对所述图片进行文本检测，得到检测结果，所述检测结果中包括文本框和非文本框；
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，得到文本框和非文本框。

2.如权利要求1所述的方法，其特征在于，所述分类模型通过以下方式确定得到：
获取样本图片，所述样本图片中包括已标注的样本文本框和样本非文本框；
提取所述样本图片中的所述样本文本框和所述样本非文本框；
基于所述样本文本框和所述样本非文本框进行学习训练，得到所述分类模型。

3.如权利要求2所述的方法，其特征在于，在基于所述样本文本框和所述样本非文本框进行学习训练之前，所述方法还包括：
对所述样本文本框和所述样本非文本框进行标准化处理，得到具有相同大小的样本文本框和样本非文本框；
对标准化处理后得到的样本文本框和样本非文本框进行数据清洗，得到用于模型训练的样本文本框和样本非文本框。

4.如权利要求3所述的方法，其特征在于，基于所述样本文本框和所述样本非文本框进行学习训练，得到所述分类模型，包括：
构建神经网络模型，所述神经网络模型中包括卷积层、标准化层、池化层、丢弃层和全连接层；
基于所述神经网络模型对数据清洗后的样本文本框和样本非文本框进行学习训练，得到所述分类模型。

5.如权利要求1所述的方法，其特征在于，基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类，包括：
将所述检测结果中的文本框和非文本框进行标准化处理，得到具有相同大小的文本框和非文本框；
将标准化处理后得到的文本框和非文本框输入所述分类模型，得到输出结果；
基于所述输出结果对所述检测结果中的文本框和非文本框进行分类。

6.如权利要求5所述的...

【专利技术属性】
技术研发人员：谢春鸿，
申请(专利权)人：北京云测信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人