区域检测方法及其相关装置、设备和介质制造方法及图纸

技术编号:34792365 阅读:23 留言:0更新日期:2022-09-03 19:56
本申请公开了一种区域检测方法及其相关装置、设备和介质,该方法包括:获取待检测图像;利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框;其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,预测框是区域检测模型对验证样本图像进行区域检测得到的。通过上述方式,本申请能够提高目标预测框的精准性。准性。准性。

【技术实现步骤摘要】
区域检测方法及其相关装置、设备和介质


[0001]本申请涉及文本识别
,特别是涉及一种区域检测方法及其相关装置、设备和介质。

技术介绍

[0002]场景文本识别是只对自然场景中检测到的文本区域进行文本识别,并将其翻译合理的计算机文字,是计算机视觉领域中的一个重要课题,近年来,场景文本识别技术不断地进行发展创新,并且广泛应用在智能交通、无人驾驶和机器人等领域,运用最普遍的就是非标车牌识别
其中,文本区域检测的是否准确会直接影响场景文本识别的准确性。

技术实现思路

[0003]本申请主要解决的技术问题是提供一种区域检测方法及其相关装置、设备和介质,能够提高目标预测框的精准性。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种区域检测方法,该方法包括:获取待检测图像;利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框;其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,预测框是区域检测模型对验证样本图像进行区域检测得到的。
[0005]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种区域检测装置,该装置包括:获取模块,用于获取待检测图像;检测模块,用于利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框;其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,预测框是区域检测模型对验证样本图像进行区域检测得到的。
[0006]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述区域检测方法。
[0007]为了解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令以实现上述区域检测方法。
[0008]上述方案,利用基于区域检测模型的评估指标优化后的区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框。故,由于区域检测模型是基于区域检测模型的评估指标进行优化得到的,而评估指标是基于真值框与预测框之间的边界紧密程度得到的,所以基于该评估指标对区域检测模型进行优化过程中,会将预测框相对真值框的边界紧密程度这一因素考虑在内,合理地控制预测框每条边界的位置,使得通过优化后的区域检测模型获得的预测框的各边界逼近对应的真值框的边界。因此,利用优化后的区域检测模型对待检测图像进行区域检测而得到关于特定文本区域的目标
预测框更加逼近于对应的真值框,即目标预测框更加精准。
附图说明
[0009]图1是本申请提供的区域检测方法一实施例的流程示意图;
[0010]图2是本申请提供的区域检测模型的训练方法一实施例的流程示意图;
[0011]图3是本申请提供的非标车牌一实施例的示意图;
[0012]图4是本申请提供的非标车牌另一实施例的示意图;
[0013]图5是本申请提供的文本识别模型的训练方法一实施例的流程示意图;
[0014]图6是本申请提供的文本识别模型的测试方法一实施例的流程示意图;
[0015]图7是图2所示步骤S23一实施例的流程示意图;
[0016]图8是图7所示步骤S231一实施例的流程示意图;
[0017]图9是本申请提供的真值框和预测框一实施例的示意图;
[0018]图10是图8所示步骤S2312一实施例的流程示意图;
[0019]图11是图10所示步骤S102一实施例的流程示意图;
[0020]图12是图7所示步骤S232一实施例的流程示意图;
[0021]图13是图12所示步骤S2321一实施例的流程示意图;
[0022]图14是本申请提供的区域检测模型的训练装置一实施例的框架示意图;
[0023]图15是本申请提供的电子设备一实施例的框架示意图;
[0024]图16是本申请提供的计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0025]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0026]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0027]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0028]请参阅图1,图1是本申请提供的区域检测方法一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例包括:
[0029]步骤S11:获取待检测图像。
[0030]本实施例的方法用于对待检测图像进行检测而得到待检测图像中关于特定文本区域的目标检测框。本文所述的待检测图像可以但不限于多目拼接的图像、缝合全景图像,分辨率超过4K的高分辨率图像等。其中,待检测图像具体可以从本地存储或者云端存储中获取得到,或者通过电子设备对当前环境进行采集得到,在此不做具体限定。
[0031]步骤S12:利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框。
[0032]本实施方式中,利用区域检测模型对待检测图像进行区域检测,得到待检测图像
中关于特定文本区域的目标预测框。其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,预测框是区域检测模型对验证样本图像进行区域检测得到的。由于区域检测模型是基于区域检测模型的评估指标进行优化得到的,而评估指标是基于真值框与预测框之间的边界紧密程度得到的,所以基于该评估指标对区域检测模型进行优化过程中,会将预测框相对真值框的边界紧密程度这一因素考虑在内,合理地控制预测框每条边界的位置,使得通过优化后的区域检测模型获得的预测框的各边界逼近对应的真值框的边界。因此,利用优化后的区域检测模型对待检测图像进行区域检测而得到关于特定文本区域的目标预测框更加逼近于对应的真值框,即目标预测框更加精准。
[0033]请参阅图2,图2是本申请提供的区域检测模型的训练方法一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图2所示的流程顺序为限。如图2所示,在利用区域检测模型对待检测图像进行区域检测之前,需要对区域检测模型进行优化训练,具体包括:...

【技术保护点】

【技术特征摘要】
1.一种区域检测方法,其特征在于,包括:获取待检测图像;利用区域检测模型对所述待检测图像进行区域检测,得到所述待检测图像中关于特定文本区域的目标预测框;其中,所述区域检测模型是基于所述区域检测模型的评估指标进行优化得到的,所述评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,所述预测框是所述区域检测模型对所述验证样本图像进行区域检测得到的。2.根据权利要求1所述的方法,其特征在于,在所述利用区域检测模型对所述待检测图像进行区域检测,得到所述待检测图像中关于特定文本区域的目标预测框之前,所述方法还包括:从验证集中获取所述验证样本图像,其中,所述验证样本图像包含特定文本区域,并标注有所述特定文本区域的真值框;利用所述区域检测模型对所述验证样本图像进行区域检测,得到所述验证样本图像中关于所述特定文本区域的预测框;基于所述真值框与所述预测框之间的边界紧密程度,得到所述区域检测模型的评估指标;基于所述评估指标,对所述区域检测模型进行优化。3.根据权利要求2所述的方法,其特征在于,所述基于所述真值框与所述预测框之间的边界紧密程度,得到所述区域检测模型的评估指标,包括:确定所述真值框与所述预测框之间的边界紧密程度;基于所述边界紧密程度,确定至少一个边界加权度量,以作为所述区域检测模型的评估指标。4.根据权利要求3所述的方法,其特征在于,所述确定所述真值框与所述预测框之间的边界紧密程度,包括:获取所述真值框与所述预测框之间的第一边界的距离,并获取所述真值框与所述预测框之间的第二边界的距离,其中,所述第一边界为在第一方向上的边界,所述第二边界为在第二方向上的边界;利用所述第一边界的距离得到关于所述第一边界的第一边界紧密程度,以及利用所述第二边界的距离得到关于所述第二边界的第二边界紧密程度。5.根据权利要求4所述的方法,其特征在于,所述第一边界包括上边界和下边界,所述第二边界包括左边界和右边界;所述获取所述真值框与所述预测框之间的第一边界的距离,并获取所述真值框与所述预测框之间的第二边界的距离,包括:获取所述真值框与所述预测框之间的上边界的第一距离、所述真值框与所述预测框之间的下边界的第二距离,以分别作为扩大高度、收缩高度;以及获取所述真值框与所述预测框之间的左边界的第三距离、所述真值框与所述预测框之间的右边界的第四距离,以分别作为扩大宽度、收缩宽度;所述利用所述第一边界的距离得到关于所述第一边界的第一边界紧密程度,以及利用所述第二边界的距离得到关于所述第二边界的第二边界紧密程度,包括:利用所述扩大高度、所述收缩高度得到关于所述第一边界的第一边界紧密程度,以及
利用所述扩大宽度、所述收缩宽度得到关于所述第二边界的第二边界紧密程度。6.根据权利要求5所述的方法,其特征在于,所述利用所述扩大高度、所述收缩高度得到关于所述第一边界的第一边界紧密程度,或者,所述利用所述扩大宽度、所述收缩宽度得到关于所述第二边界的第二边界紧密程度,包括:以参考框的高为第一参考距离、所述扩大高度为扩大长度、所述收缩高度为收缩长度、所述第一边界紧密程度为目标边界紧密程度;或者,以所述参考框的宽为第一参考距离、所述扩大宽度为扩大长度、所述收缩宽度为收缩长度、所述第二边界紧密程度为所述目标边界紧密程度;利用所述扩大长度和所述第一参考距离,得到扩大参数,并利用所述收缩长度和所述第一参考距离,得到收缩参数,其中,所述参考框包含所述真值框和所述预测框;利用所...

【专利技术属性】
技术研发人员:贾若然谭昶张友国何小倩李成龙姜殿洪刘江韩辉
申请(专利权)人:安徽大学科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1