一种标签四点检测模型构建方法和装置制造方法及图纸

技术编号：39309767 阅读：13 留言：0更新日期：2023-11-12 15:56

本发明专利技术公开了一种标签四点检测模型构建方法和装置，所述方法包括：获取标签图像的训练数据集，对其进行数据增强并标注正确的目标检测框；构建初始网络模型，该模型包括主干网络、位置子网络和分类子网络；通过主干网络提取并生成相应图像样本的多层特征图；再通过分类子网络和位置子网络生成每个目标的初始类别和位置；将多层特征图中每个目标的预测框映射回原图，计算得到多个经过还原的真实坐标的预测框，采用预设方法筛选得到最优的预测框的类别及位置；采用训练数据集训练初始网络模型，构建损失函数，以得到标签四点检测模型。本发明专利技术能够有效检测不规则四边形目标，精确输出不规则四边形的四个角点坐标。不规则四边形的四个角点坐标。不规则四边形的四个角点坐标。

全部详细技术资料下载

【技术实现步骤摘要】
一种标签四点检测模型构建方法和装置

[0001]本专利技术涉及目标检测技术，具体涉及一种标签四点检测模型构建方法和装置。

技术介绍

[0002]随着人工智能以及深度学习的快速发展，目标检测等计算机视觉的技术已经广泛的应用到了各行各业并且发挥了重要作用。其中，以FoveaBox、FCOS为代表的anchor
‑
free目标检测技术，改变了绝大多数目标检测算法都要使用anchor box的现状，大大降低了模型的复杂度，并且减少了模型的输出。
[0003]具体的，相较于anchor
‑
based方法，anchor
‑
free方法最大的优势在于高效的检测速度和模型效率，因为该方法不需要预先设计anchor，只需要对不同尺度的特征图中的目标中心点、高和宽进行回归即可，这显著地减少了模型的耗时和计算成本。
[0004]然而，现有anchor
‑
free方法整体的检测精度并不能达到anchor
‑
based方法研究任务中最好模型的检测精度。并且对于不规则四边形的标签检测也存在着较大的问题，示例性的，存在检测不精准、无法准确识别目标标签的四点角点等问题。而目前通用的检测算法基本上都是回归边界框，但结合工程经验来看，边界框的定位不如采用角点定位的形式精度高。

技术实现思路

[0005]专利技术目的：本专利技术的一个目的在于提供一种标签四点检测模型构建方法，能够解决现有基于anchor
‑
free目...

【技术保护点】

【技术特征摘要】
1.一种标签四点检测模型构建方法，其特征在于，该方法包括以下步骤：获取训练数据集，并对所述训练数据集进行数据增强操作；所述训练数据集包括多个样本，每个样本中包含有标签图像；为每个样本的标签图像标注正确的目标检测框；将所述训练数据集的各样本依次输入至预先构建标签四点检测模型的初始网络模型，初始网络模型包括主干网络、位置子网络和分类子网络；通过所述主干网络提取并生成相应样本的多层特征图，将多层特征图输入位置子网络生成多层特征图中每个目标的目标预测框以及获取多层特征图中每个目标的初始位置信息，将多层特征图输入分类子网络以得到多层特征图中每个目标的初始类别信息；将多层特征图中每个目标的目标预测框映射回原图，计算得到多个经过还原的真实坐标的预测框，并采用预设方法从多个经过还原的真实坐标的预测框中筛选得到最优预测框以及最优预测框的位置信息和类别信息；以及采用所述训练数据集训练初始网络模型，基于所述目标检测框和预设缩放因子构建正负样本，用于在训练过程中计算损失，并利用不同的损失函数对位置子网络和分类子网络进行训练，最终得到满足预设性能的标签四点检测模型。2.根据权利要求1所述的标签四点检测模型构建方法，其特征在于：所述主干网络采用特征金字塔网络，特征金字塔网络包括自顶向下的通路和横向连接，其中，自顶向下的通路为ResNet网络；所述特征金字塔网络的金字塔层级从浅层到深层，每个层次对输入的样本图像进行降采样。3.根据权利要求1所述的标签四点检测模型构建方法，其特征在于，所述将多层特征图中每个目标的目标预测框映射回原图，计算得到多个经过还原的真实坐标的预测框，包括：将多层特征图中每个目标的目标预测框映射回原图，利用Smooth L1损失函数计算投影坐标与真实图像的归一化偏移，得到多个经过还原的真实坐标的预测框。4.根据权利要求1所述的标签四点检测模型构建方法，其特征在于：所述对所述训练数据集进行数据增强操作，其中，数据增强操作至少包括透视变换操作和随机缩放操作。5.根据权利要求1所述的标签四点检测模型构建方法，其特征在于，所述基于所述目标检测框和预设缩放因子构建正负样本，包括：将相应样本的目标检测框映射到目标所在的层级特征图中，计算中心点坐标，计算式为：为：c
’
x
＝x
’1+0.5(x
’2‑
x
’1),c
’
y
＝y
’1+0.5(y
’2‑
y
’1)；其中，(x1,y1)和(x2,y2)为目标检测框左上和右下的...

【专利技术属性】
技术研发人员：谈震，刘兆峰，舒依娜，杨兴旺，孙宝贵，徐希涛，齐云鹏，魏自强，吴奇，熊永平，
申请(专利权)人：南京南瑞水利水电科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人