端到端目标检测模型训练、图像目标检测方法及相关设备技术

技术编号：38468382 阅读：13 留言：0更新日期：2023-08-11 14:45

本发明专利技术公开了端到端目标检测模型训练、图像目标检测方法及相关设备，通过样本图像的预测目标集合和标签目标集合，确定样本图像的匹配代价矩阵，然后根据预测检测框的第一位置质量分数和匹配代价矩阵，对预测目标集合以及标签目标集合进行目标匹配，得到最优分配结果，再根据最优分配结果生成目标训练样本以对预设深度学习模型进行调整，得到已训练的端到端目标检测模型。在本发明专利技术中通过位置信息监督匹配代价矩阵，提高目标匹配的准确率，以提高模型训练的稳定性，从而提高一对一匹配的图像目标检测的准确率，促进机器视觉的发展。促进机器视觉的发展。促进机器视觉的发展。

全部详细技术资料下载

【技术实现步骤摘要】
端到端目标检测模型训练、图像目标检测方法及相关设备

[0001]本专利技术涉及计算机视觉
，尤其涉及一种端到端目标检测模型训练、图像目标检测方法及相关设备。

技术介绍

[0002]目标检测能够识别图片或视频中有哪些物体以及物体的位置，是计算机视觉的重要组成部分。随着近年来深度学习的不断发展，基于深度学习的目标检测成为主流技术。
[0003]在相关技术提出的方案中，通常是训练端到端的目标检测模型，并通过训练后的目标检测模型实现端到端目标检测，但目前训练过程中存在不稳定标签匹配的问题，导致图像端到端的目标检测准确率低，无法对图像或视频进行准确的目标识别，影响计算机视觉的发展。
[0004]基于此，如何提高一对一匹配的图像目标检测的准确率成为亟需解决的技术问题。

技术实现思路

[0005]本专利技术的主要目的在于提供一种端到端目标检测模型训练、图像目标检测方法及相关设备，旨在解决现有技术中一对一匹配的图像目标检测准确率低的问题。
[0006]为了实现上述目的，本专利技术提供了一种端到端目标检测模型训练方法，所述方法包括：
[0007]通过预设深度学习模型对各样本图像进行目标检测，得到各所述样本图像的预测目标集合；其中，所述预测目标集合包括所述样本图像中目标物体的预测检测框以及所述预测检测框对应的预测物体类别；
[0008]基于所述样本图像的所述预测目标集合和预设的标签目标集合，确定所述样本图像的匹配代价矩阵；所述匹配代价矩阵为所述样本图像的定位损失矩阵和类别损失...

【技术保护点】

【技术特征摘要】
1.一种端到端目标检测模型训练方法，其特征在于，所述方法包括：通过预设深度学习模型对各样本图像进行目标检测，得到各所述样本图像的预测目标集合；其中，所述预测目标集合包括所述样本图像中目标物体的预测检测框以及所述预测检测框对应的预测物体类别；基于所述样本图像的所述预测目标集合和预设的标签目标集合，确定所述样本图像的匹配代价矩阵；所述匹配代价矩阵为所述样本图像的定位损失矩阵和类别损失矩阵的和值；基于所述预测目标集合中各所述预测检测框的第一位置质量分数以及所述匹配代价矩阵，对所述预测目标集合以及所述标签目标集合进行目标匹配，得到最优分配结果；其中，所述第一位置质量分数用于表征所述预测检测框与所述标签目标集合中定位标签的交互比；基于所述最优分配结果和所述样本图像，生成对应的目标训练样本以对所述预设深度学习模型进行调整，得到已训练的端到端目标检测模型。2.根据权利要求1所述的端到端目标检测模型训练方法，其特征在于，所述目标训练样本包括正样本和负样本；所述生成对应的目标训练样本以对所述预设深度学习模型进行调整，具体包括：根据各所述正样本中的所述预测检测框、所述预测检测框对应的所述定位标签以及所述预测检测框的第二位置质量分数，确定正样本集合的损失函数；其中，所述第二位置质量分数用于表征所述正样本中所述预测检测框与所述定位标签的交互比；根据各所述负样本的所述预测检测框以及对应的所述定位标签，确定负样本集合的损失函数；将所述正样本集合的损失函数和所述负样本集合的损失函数的和值，作为定位损失函数；基于所述定位损失函数，对所述预设深度学习模型的模型参数进行调整。3.根据权利要求1所述的端到端目标检测模型训练方法，其特征在于，基于所述预测目标集合中各所述预测检测框的第一位置质量分数以及所述匹配代价矩阵，对所述预测目标集合以及所述标签目标集合进行目标匹配，得到最优分配结果，具体包括：将所述匹配代价矩阵中每个元素与对应的所述第一位置质量分数相乘，得到目标代价矩阵；根据匈牙利算法，对所述目标代价矩阵进行计算，将计算得到的代价最小的目标代价矩阵作为最优分配矩阵；根据所述最优分配矩阵，确定所述最优分配结果。4.根据权利要求1所述的端到端目标检测模型训练方法，其特征在于，所述基于所述样本图像的所述预测目标集合和预设的标签目标集合，确定所述样本图像的匹配代价矩阵，具体包括：针对所述预测目标集合中的每个所述预测检测框，计算所述预测检测框与所述标签目标集合中每个所述定位标签的定位损失值，以得到所述样本图像的定位损失矩阵；针对所述预测目标集合中的每个所述预测检测框对应的每个所述预测物体类别，计算所述预测物体类别与所述标签目标集合中每个类别标签的类别损失值，以得到所述样本图
像的匹配代价矩阵。5.根据权利要求1所述的端到端目标检测模型训练方法，其特征在于，所述通过预设深...

【专利技术属性】
技术研发人员：刘世隆，任天和，曾兆阳，李弘洋，张浩，李峰，张磊，
申请(专利权)人：粤港澳大湾区数字经济研究院福田，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人