模型训练方法、图像处理方法、装置以及可读存储介质制造方法及图纸

技术编号：37639513 阅读：25 留言：0更新日期：2023-05-25 10:06

本申请提供一种模型训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。该图像处理方法包括：获取若干真实标注框，以及获取目标检测头的目标特征图；按照目标检测头的粒度设置目标组锚框，其中，不同粒度的目标检测头对应的锚框组数不同；获取若干真实标注框在目标特征图的投影点位；基于投影点位落在每组锚框对应点位的真实标注框进行聚类，获取每组锚框的锚框尺寸；按照真实标注框及其对应的锚框尺寸对待训练模型进行训练。通过上述方式，图像处理装置通过使用聚类算法，在更精细的位置粒度上，对锚框进行聚类，使目标检测的定位准确性得到提升。定位准确性得到提升。定位准确性得到提升。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、图像处理方法、装置以及可读存储介质

[0001]本申请涉及图像处理
，特别是涉及一种模型训练方法、图像处理方法、图像处理装置以及计算机可读存储介质。

技术介绍

[0002]目标检测(Object Detection，OD)是机器视觉、人工智能等科研领域重要的研究方向，交通、安防、生态环保等各领域都使用OD作为实现业务逻辑的底层支撑。OD的任务是将图像或者视频中的人或者物定位和识别出来，以在此基础上完成跟踪、行为分析、数量统计、报警等功能。当前，OD主要通过深度学习方法作为实现手段。
[0003]图像处理方法通常可按有无锚框分为anchor
‑
based方法和anchor
‑
free方法，前者在特征图上设定先验锚框进行目标定位，后者基于特征图点位直接对目标进行定位。典型的anchor
‑
free方法有YOLOv1,anchor
‑
based方法有YOLOv3、Faster R
‑
CNN等。一般而言，anchor
‑
based方法在定位效果上优于anchor
‑
free方法。
[0004]锚框是一种假设在图片或者特征图上的先验框。定位任务和识别任务在深度学习中分别建模为回归任务和分类任务，先验框的恰当使用被证明有利于提升定位精度和稳定性。Faster R
‑
CNN中为特征图的每个点设定了9个大小、形状不一的锚框，YOLOv3则为不同尺度的检测h...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述模型训练方法包括：获取若干真实标注框，以及获取目标检测头的目标特征图；按照所述目标检测头的粒度设置目标组锚框，其中，不同粒度的目标检测头对应的锚框组数不同；获取若干所述真实标注框在所述目标特征图的投影点位；基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类，获取每组锚框的锚框尺寸；按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练。2.根据权利要求1所述的模型训练方法，其特征在于，所述基于所述投影点位落在每组锚框对应点位的真实标注框进行聚类，获取每组锚框的锚框尺寸，包括：以所述投影点位落在当前组锚框对应点位的所有真实标注框进行聚类；获取预设数量的聚类中心对应的真实标注框尺寸作为当前组锚框的锚框尺寸。3.根据权利要求1所述的模型训练方法，其特征在于，粗粒度的目标检测头对应的目标组锚框组数为一组；中粒度的目标检测头对应的目标组锚框组数为对应特征图的列数；细粒度的目标检测头对应的目标组锚框组数为对应特征图的点位数。4.根据权利要求1所述的模型训练方法，其特征在于，所述按照所述真实标注框及其对应的锚框尺寸对待训练模型进行训练，包括：获取所述真实标注框的投影点位关联的训练组锚框；获取所述真实标注框与所述训练组锚框中所有锚框的交并比；利用所述交并比最大的锚框对所述待训练模型做正样本回归训练；利用所述训练组锚框中的其余锚框对所述待训练模型做负样本回归训练。5.根据权利要求4所述的模型训练方法，其特征在于，所述利用所述交并比最大的锚框对所述待训练模型做正样本回归训练之后，所述模型训练方法还包括：利用所述交并比最大的锚框与其对应的真实标注框对所述待训练模型做类别和/或位置的差异训练。6.根据权利要求4所述的模型训练方法，其特征在于，所述获取所述真实标注框的投影点位关联的训练组锚框之前，所述模型...

【专利技术属性】
技术研发人员：王仁根，张朋，张学涵，蔡丹平，虞响，陈波扬，黄鹏，殷俊，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人