【技术实现步骤摘要】
文本检测方法、电子设备及计算机可读介质
本专利技术实施例涉及计算机
,尤其涉及一种文本检测方法、电子设备和计算机可读介质。
技术介绍
文本检测是一种检测图像中的文本区域并标记其边界即文本框的技术,文本检测应用范围广泛,是很多计算机视觉任务的前置步骤,比如图像搜索、文字识别,身份认证和视觉导航等。随着机器学习技术的发展,越来越多的神经网络模型被广泛应用于文本检测中,EAST(EfficientandAccurateSceneText)模型便是其中重要的一种。EAST模型的模型结构通常包括:特征提取层、特征融合层和输出层。使用EAST模型进行文本检测包括两个阶段,即:全卷积网络阶段和NMS(Non-MaximumSuppression,非极大值抑制)阶段。其中,在全卷积网络阶段,采用特征提取层对检测图像进行特征提取,形成不同尺度的多个特征映射图;通过特征融合层基于多个特征映射图进行特征融合,形成融合特征图;而输出层则通过卷积操作,将融合特征图映射到1个通道的分数特征图和一个多通道的几何图形特征图。几何图形特征图可以 ...
【技术保护点】
1.一种文本检测方法,其特征在于,包括:/n对包含有文本的待检测图像进行文本检测,获取所述待检测图像中的多个文本预测框;/n从所述多个文本预测框中确定待合并的文本预测框;/n根据所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框;/n根据所述合并框,确定所述待检测图像的文本检测结果。/n
【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:
对包含有文本的待检测图像进行文本检测,获取所述待检测图像中的多个文本预测框;
从所述多个文本预测框中确定待合并的文本预测框;
根据所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框;
根据所述合并框,确定所述待检测图像的文本检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框,包括:
获取待合并的文本预测框的顶点坐标和预测框权重;
根据所述顶点坐标和所述预测框权重,以及所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,获得合并框。
3.根据权利要求2所述的方法,其特征在于,所述根据所述顶点坐标和所述预测框权重,以及所述待合并的文本预测框的宽度与所述待检测图像的宽度之间的关系,对所述待合并的文本预测框中的文本预测框进行合并,包括:
从待合并的文本预测框中确定基准框,从除所述基准框外的其它文本预测框中选择与所述基准框进行合并的准合并框;
根据所述基准框的顶点坐标和所述准合并框的顶点坐标,分别确定所述基准框的宽度和所述准合并框的宽度;
若所述基准框的宽度和所述准合并框的宽度均小于预设宽度阈值,则按照第一合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并;
若所述基准框的宽度和所述准合并框的宽度中,至少有一个大于所述预设宽度阈值,则按照第二合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并;
其中,所述预设宽度阈值根据所述待检测图像的宽度设定。
4.根据权利要求3所述的方法,其特征在于,所述按照第一合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并,包括:
分别计算所述基准框的顶点坐标与所述基准框的预测框权重的第一乘积,所述准合并框的顶点坐标与所述准合并框的预测框权重的第二乘积,以及,所述基准框的预测框权重和所述准合并框的预测框权重的权重之和,根据所述第一乘积、所述第二乘积和所述权重之和,对所述基准框和所述准合并框进行合并。
5.根据权利要求3所述的方法,其特征在于,所述按照第二合并规则,根据所述基准框的顶点坐标和所述准合并框的顶点坐标,以及,所述基准框的预测框权重和所述准合并框的预测框权重,对所述基准框和所述准合并框进行合并,包括:
分别计算所述基准框和所述准合并框的左边界顶点坐标中的小值,与所述基准框和所述准合并框的预测框权重中的大值的第三乘积;...
【专利技术属性】
技术研发人员:张子浩,李兵,杨家博,
申请(专利权)人:北京易真学思教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。