一种文本检测方法和装置制造方法及图纸

技术编号:26971767 阅读:26 留言:0更新日期:2021-01-06 00:03
本申请公开了一种文本检测方法和装置,该方法包括:获取包含文本的图片;对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。在得到文本检测结果后,由于可以使用预先训练的分类模型对检测结果中的文本框和非文本框进行分类,因此,可以确定出检测结果中哪些是文本框,哪些是非文本框,从而可以过滤掉其中的非文本框,仅保留文本框,改善文本检测效果;进一步地,在后续进行文本识别时,可以仅基于检测结果中的文本框进行文本识别,从而可以减少文本识别的次数,提高整个文本检测识别过程的效率。

【技术实现步骤摘要】
一种文本检测方法和装置
本申请涉及文本检测领域,尤其涉及一种文本检测方法和装置。
技术介绍
目前,在很多应用场景下,都需要对图片中的文本进行识别,以得到图片中包含的文本。一般地,在对图片中的文本进行识别时,可以基于OCR(OpticalCharacterRecognition,光学字符识别)实现。具体地,首先,可以对图片进行文本检测,得到包含文本的文本框,其次,对文本框进行文本识别,进而得到图片中包含的文本。然而,在实际应用中,在使用OCR对图片进行文本检测时,在图片中包括复杂背景的情况下,检测结果中会包含非文本框,导致文本检测的检测效果不佳,严重影响后续的文本识别。
技术实现思路
本申请实施例提供一种文本检测方法和装置,用于解决目前在使用OCR对包含复杂背景的图片进行文本检测时,检测效果不佳的问题。为解决上述技术问题,本申请实施例是这样实现的:第一方面,提出一种文本检测方法,包括:获取包含文本的图片;对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。第二方面,提出一种文本检测装置,包括:获取单元,获取包含文本的图片;文本检测单元,对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;分类单元,基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。第三方面,提出一种电子设备,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,该可执行指令在被执行时使该处理器执行以下操作:获取包含文本的图片;对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。第四方面,提出一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下方法:获取包含文本的图片;对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请实施例在进行文本检测之前,可以训练得到用于对文本框和非文本框进行分类的分类模型,这样,在进行文本检测并得到包括文本框和非文本框的检测结果后,可以使用分类模型对检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。由于在得到文本检测结果后,可以使用预先训练的分类模型对文本检测结果中的文本框和非文本框进行分类,因此,可以确定出检测结果中哪些是文本框,哪些是非文本框,从而可以过滤掉其中的非文本框,仅保留文本框,改善文本检测效果;进一步地,在后续进行文本识别时,由于可以仅基于其中的文本框进行文本识别,因此可以减少文本识别的次数,从而提高整个文本检测识别过程的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;图1是本申请的一个实施例文本检测方法的流程示意图;图2是本申请的一个实施例样本图片的示意图;图3是本申请的一个实施例样本文本框和样本非文本框的示意图;图4是本申请的一个实施例文本检测方法的流程示意图;图5是本申请的一个实施例电子设备的结构示意图;图6是本申请的一个实施例文本检测装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。图1是本申请的一个实施例文本检测方法的流程示意图。所述方法如下所述。S102:获取获取包含文本的图片。在对图片中的文本进行识别时,可以获取包含文本的图片。本实施例中,获取到的图片中还可以包括背景,其中,该背景可以文本背景(即文本位于背景所在的区域),也可以是非文本背景(即文本位于背景所在区域以外的其他区域),在后续对图片进行文本检测时,该背景会影响检测结果,使得检测结果中包括非文本框。在获取到包含文本的图片后,可以执行S104。S104:对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框。在对图片进行文本检测时,可以使用MSER(MaximallyStableExtremalRegions,最大极值稳定区域),或SWT(StrokeWidthTransform,笔画宽度变换)等计算机视觉算法,当然,也可以使用其他能够对图片进行文本检测的算法,这里不做具体限定。本实施例中,在对图片进行文本检测后,可以得到包括文本框和非文本框的检测结果。其中,文本框中包含文本,非文本框中不包含文本,需要说明的是,在得到的检测结果中,并不确定哪些是文本框,哪些是非文本框。在得到检测结果后,可以执行S106。S106:基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。本实施例中,预先训练的分类模型可以对S104中得到的检测结果进行分类,以确定出检测结果中哪些是文本框,哪些是非文本框。在一种实现方式中,上述分类模型可以通过以下方式训练得到:首先,获取样本图片。样本图片中可以包括文本和背景,如图2所示,图2所示的样本图片中包括文本和背景,其中,在图片顶部有浅灰色背景,在图片的中间区域没有背景,在图片底部有深灰色背景。应理解,图2所示的样本图片中的背景是一种示例,在其他实现方式中,样本图片中的背景还可以是其他更为复杂的背景,比如高楼、风景等,这里不再一一举例说明。样本图片中还可以包括已标注的样本文本框和样本非文本框,这些标注数据可以是可视化的数据。如图3所示,图3为对图2所示的样本图片进行可视化标注后得到的图片,图3中,文本框是已经标注的区域,非文本框可以是已经标注的区域以外的随机区域。其次,提取样本图片中包括的样本文本框和样本非文本框。样本文本框和样本非文本框均可以视为样本图片中的一部分图片,在样本图片中已标注样本文本框和样本非文本框的情况下,可以提取得到其中的样本文本框和样本非文本本文档来自技高网
...

【技术保护点】
1.一种文本检测方法,其特征在于,包括:/n获取包含文本的图片;/n对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;/n基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。/n

【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:
获取包含文本的图片;
对所述图片进行文本检测,得到检测结果,所述检测结果中包括文本框和非文本框;
基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,得到文本框和非文本框。


2.如权利要求1所述的方法,其特征在于,所述分类模型通过以下方式确定得到:
获取样本图片,所述样本图片中包括已标注的样本文本框和样本非文本框;
提取所述样本图片中的所述样本文本框和所述样本非文本框;
基于所述样本文本框和所述样本非文本框进行学习训练,得到所述分类模型。


3.如权利要求2所述的方法,其特征在于,在基于所述样本文本框和所述样本非文本框进行学习训练之前,所述方法还包括:
对所述样本文本框和所述样本非文本框进行标准化处理,得到具有相同大小的样本文本框和样本非文本框;
对标准化处理后得到的样本文本框和样本非文本框进行数据清洗,得到用于模型训练的样本文本框和样本非文本框。


4.如权利要求3所述的方法,其特征在于,基于所述样本文本框和所述样本非文本框进行学习训练,得到所述分类模型,包括:
构建神经网络模型,所述神经网络模型中包括卷积层、标准化层、池化层、丢弃层和全连接层;
基于所述神经网络模型对数据清洗后的样本文本框和样本非文本框进行学习训练,得到所述分类模型。


5.如权利要求1所述的方法,其特征在于,基于预先训练的分类模型对所述检测结果中的文本框和非文本框进行分类,包括:
将所述检测结果中的文本框和非文本框进行标准化处理,得到具有相同大小的文本框和非文本框;
将标准化处理后得到的文本框和非文本框输入所述分类模型,得到输出结果;
基于所述输出结果对所述检测结果中的文本框和非文本框进行分类。


6.如权利要求5所述的...

【专利技术属性】
技术研发人员:谢春鸿
申请(专利权)人:北京云测信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1