【技术实现步骤摘要】
区域检测方法及其相关装置、设备和介质
[0001]本申请涉及文本识别
,特别是涉及一种区域检测方法及其相关装置、设备和介质。
技术介绍
[0002]场景文本识别是只对自然场景中检测到的文本区域进行文本识别,并将其翻译合理的计算机文字,是计算机视觉领域中的一个重要课题,近年来,场景文本识别技术不断地进行发展创新,并且广泛应用在智能交通、无人驾驶和机器人等领域,运用最普遍的就是非标车牌识别
其中,文本区域检测的是否准确会直接影响场景文本识别的准确性。
技术实现思路
[0003]本申请主要解决的技术问题是提供一种区域检测方法及其相关装置、设备和介质,能够提高目标预测框的精准性。
[0004]为解决上述技术问题,本申请采用的一个技术方案是:提供一种区域检测方法,该方法包括:获取待检测图像;利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框;其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,预测框是区域检测模型对验证样本图像进行区域检测得到的。
[0005]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种区域检测装置,该装置包括:获取模块,用于获取待检测图像;检测模块,用于利用区域检测模型对待检测图像进行区域检测,得到待检测图像中关于特定文本区域的目标预测框;其中,区域检测模型是基于区域检测模型的评估指标进行优化得到的,评估指标是基于验证样本
【技术保护点】
【技术特征摘要】
1.一种区域检测方法,其特征在于,包括:获取待检测图像;利用区域检测模型对所述待检测图像进行区域检测,得到所述待检测图像中关于特定文本区域的目标预测框;其中,所述区域检测模型是基于所述区域检测模型的评估指标进行优化得到的,所述评估指标是基于验证样本图像中的特定文本区域的真值框与预测框之间的边界紧密程度得到的,所述预测框是所述区域检测模型对所述验证样本图像进行区域检测得到的。2.根据权利要求1所述的方法,其特征在于,在所述利用区域检测模型对所述待检测图像进行区域检测,得到所述待检测图像中关于特定文本区域的目标预测框之前,所述方法还包括:从验证集中获取所述验证样本图像,其中,所述验证样本图像包含特定文本区域,并标注有所述特定文本区域的真值框;利用所述区域检测模型对所述验证样本图像进行区域检测,得到所述验证样本图像中关于所述特定文本区域的预测框;基于所述真值框与所述预测框之间的边界紧密程度,得到所述区域检测模型的评估指标;基于所述评估指标,对所述区域检测模型进行优化。3.根据权利要求2所述的方法,其特征在于,所述基于所述真值框与所述预测框之间的边界紧密程度,得到所述区域检测模型的评估指标,包括:确定所述真值框与所述预测框之间的边界紧密程度;基于所述边界紧密程度,确定至少一个边界加权度量,以作为所述区域检测模型的评估指标。4.根据权利要求3所述的方法,其特征在于,所述确定所述真值框与所述预测框之间的边界紧密程度,包括:获取所述真值框与所述预测框之间的第一边界的距离,并获取所述真值框与所述预测框之间的第二边界的距离,其中,所述第一边界为在第一方向上的边界,所述第二边界为在第二方向上的边界;利用所述第一边界的距离得到关于所述第一边界的第一边界紧密程度,以及利用所述第二边界的距离得到关于所述第二边界的第二边界紧密程度。5.根据权利要求4所述的方法,其特征在于,所述第一边界包括上边界和下边界,所述第二边界包括左边界和右边界;所述获取所述真值框与所述预测框之间的第一边界的距离,并获取所述真值框与所述预测框之间的第二边界的距离,包括:获取所述真值框与所述预测框之间的上边界的第一距离、所述真值框与所述预测框之间的下边界的第二距离,以分别作为扩大高度、收缩高度;以及获取所述真值框与所述预测框之间的左边界的第三距离、所述真值框与所述预测框之间的右边界的第四距离,以分别作为扩大宽度、收缩宽度;所述利用所述第一边界的距离得到关于所述第一边界的第一边界紧密程度,以及利用所述第二边界的距离得到关于所述第二边界的第二边界紧密程度,包括:利用所述扩大高度、所述收缩高度得到关于所述第一边界的第一边界紧密程度,以及
利用所述扩大宽度、所述收缩宽度得到关于所述第二边界的第二边界紧密程度。6.根据权利要求5所述的方法,其特征在于,所述利用所述扩大高度、所述收缩高度得到关于所述第一边界的第一边界紧密程度,或者,所述利用所述扩大宽度、所述收缩宽度得到关于所述第二边界的第二边界紧密程度,包括:以参考框的高为第一参考距离、所述扩大高度为扩大长度、所述收缩高度为收缩长度、所述第一边界紧密程度为目标边界紧密程度;或者,以所述参考框的宽为第一参考距离、所述扩大宽度为扩大长度、所述收缩宽度为收缩长度、所述第二边界紧密程度为所述目标边界紧密程度;利用所述扩大长度和所述第一参考距离,得到扩大参数,并利用所述收缩长度和所述第一参考距离,得到收缩参数,其中,所述参考框包含所述真值框和所述预测框;利用所...
【专利技术属性】
技术研发人员:贾若然,谭昶,张友国,何小倩,李成龙,姜殿洪,刘江,韩辉,
申请(专利权)人:安徽大学科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。