一种基于深度学习的目标检测模型的匹配优化方法技术

技术编号：40250032 阅读：5 留言：0更新日期：2024-02-02 22:44

本发明专利技术公开了一种基于深度学习的目标检测模型的匹配优化方法，包括：计算Anchor box和Ground Truth box的宽高比，将其比值与预设阈值相比较，过滤出与所有Ground Truth box宽高比差异过大的Anchor box；计算未过滤的Anchor box与每个Ground Truth box的坐标偏移量；根据坐标偏移量修正Anchor box坐标，并计算修正后的Anchor box坐标与每个Ground Truth box的IoU；对每个Ground Truth box，选择IoU最大的顶部N个Anchor box作为正样本；将正负样本的Anchor box进行整合；本发明专利技术避免大量重复的IoU计算，降低了模型训练和推理的计算成本，显著提升了模型训练、检测的速度，改善了正负样本的比例，匹配更准确、高效，显著提升了模型的检测精度，大幅度提升了目前检测模型的性能，能够广泛应用于计算机视觉、自动驾驶等领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及目标检测，特别涉及一种基于深度学习的目标检测模型的匹配优化方法。

技术介绍

1、目标检测是计算机视觉的重要任务之一，用于识别图像或视频中存在的各类对象，并给出其位置坐标。在目标检测模型中，需要生成大量候选框(anchor box)来匹配各个检测目标，anchor box的选择会直接影响检测效果。anchor box是一种预先定义的矩形框，它们用于在图像中定位和识别目标物体。anchor box匹配优化方法是指通过调整anchorbox的位置和尺寸，使其更准确地匹配目标物体的位置和大小。典型的目标检测模型如faster r-cnn、ssd等通常使用预设的anchor box，这些anchor box通常是人工设定，不够灵活。

2、yolo系列作为一种单阶段目标检测模型，其v5版本采用了自动学习anchor box的方法，但匹配过程存在效率较低的问题。具体来说，yolov5版本的原始anchor box匹配算法是每个anchor box与所有ground truth box(ground truth box是指在目标检测任务中，标注人员手动标注的真实目标边界框，bounding box为预测目标边界框，其作为模型训练和评估的参考)比对来计算iou(iou(intersection over union-交并比，是一种常用的评估目标检测算法性能的指标。它用于衡量预测框(模型输出的矩形框)与真实目标框(ground truth box)之间的重叠程度。选择最大的iou作为匹配，这需要大量重复的iou计算。而且原

3、因此有必要对yolov5版本的anchor box匹配算法进行优化，以提高匹配精度，减少重复计算，平衡正负样本，进而改进模型性能。

技术实现思路

1、本专利技术要解决的技术问题是：提供一种提升检测精度、加速训练和推理、平衡正负样本的基于深度学习的目标检测模型的匹配优化方法。

2、为了解决上述技术问题，本专利技术包括以下步骤：

3、1)计算anchor box和ground truth box的宽高比，并将其比值与预设阈值相比较，过滤出与所有ground truth box宽高比差异过大的anchor box；

4、2)计算未过滤的anchor box与每个ground truth box的坐标偏移量；

5、3)根据坐标偏移量修正anchor box坐标，并计算修正后的anchor box坐标与每个ground truth box的iou；

6、4)对每个ground truth box，选择iou最大的顶部n个anchor box作为正样本；

7、5)将正负样本的anchor box进行整合，用于后续的loss计算。

8、优选的，所述步骤1)中的预设阈值为0.5-2。

9、优选的，所述步骤2)中坐标偏移量的计算参考每个anchor box中心相对所在网格单元的位置。

10、优选的，所述步骤4)中选择至少三个anchor box作为正样本。

11、基于上述的匹配优化方法，本专利技术提供了一种基于深度学习的目标检测模型的训练方法，该训练方法包括上述的匹配优化方法。

12、基于上述的匹配优化方法，本专利技术还提供了一种基于深度学习的目标检测模型的检测方法，该检测方法包括上述的匹配优化方法。

13、基于上述的检测方法，本专利技术还提供了一种基于深度学习的目标检测模型的检测方法的应用，其主要应用于计算机视觉、自动驾驶等领域。

14、本专利技术的有益效果是：本专利技术的匹配优化方法充分利用了anchor box的宽高比信息，通过anchor box和ground truth box的宽高比与预设阈值比较，过滤大anchor box，避免大量重复的iou计算，降低了模型训练和推理的计算成本，显著提升了模型训练、检测的速度，改善了正负样本的比例，匹配更准确、高效，显著提升了模型的检测精度，大幅度提升了目前检测模型的性能，能够广泛应用于计算机视觉、自动驾驶等领域。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述步骤1)中的预设阈值为0.5-2。

3.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述步骤2)中坐标偏移量的计算参考每个Anchor box中心相对所在网格单元的位置。

4.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述步骤4)中选择至少三个Anchor box作为正样本。

5.一种基于深度学习的目标检测模型的训练方法，其特征在于，该训练方法基于权利要求1-4的任一项所述的匹配优化方法。

6.一种基于深度学习的目标检测模型的检测方法，其特征在于，该检测方法基于权利要求1-4的任一项所述的匹配优化方法。

7.一种基于权利要求6的所述目标检测模型的检测方法的应用。

8.根据权利要求7所述的目标检测模型的检测方法的应用，其特征在于，其应用于计算机视觉、自动驾驶。

【技术特征摘要】

1.一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述步骤1)中的预设阈值为0.5-2。

3.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述步骤2)中坐标偏移量的计算参考每个anchor box中心相对所在网格单元的位置。

4.根据权利要求1所述的一种基于深度学习的目标检测模型的匹配优化方法，其特征在于，所述...

【专利技术属性】
技术研发人员：杜洋，付坤豪，王昱，刘震，马广廉，郝晓松，陈仁山，张伟，梁学晨，
申请(专利权)人：山东高速建设管理集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人