目标检测模型的训练方法、目标检测方法、装置及设备制造方法及图纸

技术编号：38470536 阅读：8 留言：0更新日期：2023-08-11 14:47

本公开提供了目标检测模型的训练方法、目标检测方法、装置及设备。本公开涉及人工智能技术领域，具体为计算机视觉、图像识别、深度学习等技术领域。具体方案为：获取每个样本图像的多个可用未掩码区域以及多个可用未掩码区域的位置信息和对应的目标标签；将每个样本图像的多个可用未掩码区域以及位置信息输入待训练模型，得到每个样本图像的多个可用未掩码区域的特征图；基于每个样本图像的多个可用未掩码区域的特征图得到每个样本图像的目标特征图；基于每个样本图像的目标特征图以及多个可用未掩码区域对应的目标标签对待训练模型进行训练，得到目标检测模型。根据本公开的方案，能够在降低算力成本和时间成本的同时，提升目标检测的准确性。升目标检测的准确性。升目标检测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测模型的训练方法、目标检测方法、装置及设备

[0001]本公开涉及人工智能
，具体为计算机视觉、图像识别、深度学习等

技术介绍

[0002]近几年，深度学习技术在人工智能领域不断发展，在图像分类、目标检测、语义分割等领域均展现出卓越的性能。随着大模型技术的兴起，基于转换器(Transformer)模型的下游视觉任务更是取得突破性的进展。然而，大模型技术伴随而来的是计算量的急剧增加，这无疑增大了训练目标检测等下游视觉任务的算力成本和时间成本。因此，亟需一种更高效的模型设计来对算力成本和时间成本进行优化。

技术实现思路

[0003]本公开提供了一种目标检测模型的训练方法、目标检测方法、装置及设备。
[0004]根据本公开的第一方面，提供了一种目标检测模型的训练方法，包括：
[0005]获取每个样本图像的多个可用未掩码区域以及多个可用未掩码区域的位置信息；
[0006]获取每个样本图像的多个可用未掩码区域对应的目标标签；
[0007]将每个样本图像的多个可用未掩码区域以及位置信息输入待训练模型，得到每个样本图像的多个可用未掩码区域的特征图；
[0008]基于每个样本图像的多个可用未掩码区域的特征图得到每个样本图像的目标特征图；
[0009]基于每个样本图像的目标特征图以及多个可用未掩码区域对应的目标标签对待训练模型进行训练，得到目标检测模型。
[0010]根据本公开的第二方面，提供了一种目标检测方法，包括：
[0011]获...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法，包括：获取每个样本图像的多个可用未掩码区域以及所述多个可用未掩码区域的位置信息；获取每个样本图像的所述多个可用未掩码区域对应的目标标签；将每个样本图像的所述多个可用未掩码区域以及所述位置信息输入待训练模型，得到每个样本图像的所述多个可用未掩码区域的特征图；基于每个样本图像的所述多个可用未掩码区域的特征图得到每个样本图像的目标特征图；基于每个样本图像的所述目标特征图以及所述多个可用未掩码区域对应的目标标签对所述待训练模型进行训练，得到目标检测模型。2.根据权利要求1所述的方法，还包括：获取多个原始图像；对每个原始图像进行随机掩码，得到每个原始图像的多个未掩码区域；将所述多个未掩码区域满足预设条件的原始图像，确定为所述样本图像。3.根据权利要求2所述的方法，其中，所述将所述多个未掩码区域满足预设条件的原始图像，确定为所述样本图像，包括：确定每个原始图像中待检测目标所在区域和所述多个未掩码区域的交叠面积的量化值；将所述量化值不小于预设阈值的原始图像，确定为所述样本图像。4.根据权利要求3所述的方法，其中，所述量化值等于所述待检测目标所在区域的第一面积和所述多个未掩码区域的第二面积的交集，与所述第一面积的比值。5.根据权利要求3所述的方法，其中，在所述原始图像包括多个待检测目标的情况下，所述将所述量化值不小于预设阈值的原始图像，确定为所述样本图像，还包括：响应于检测到所述原始图像中存在所述量化值小于所述预设阈值的多个第一未掩码区域，去除所述原始图像中所述多个第一未掩码区域以及所述原始图像的所述多个第一未掩码区域对应的第一待检测目标的目标标签；保留所述原始图像中所述量化值不小于所述预设阈值的多个第二未掩码区域以及所述原始图像的所述多个第二未掩码区域对应的第二待检测目标的目标标签。6.根据权利要求5所述的方法，其中，所述获取每个样本图像的多个可用未掩码区域，包括：将每个样本图像的所述量化值不小于所述预设阈值的所述多个第二未掩码区域，作为每个样本图像的所述多个可用未掩码区域；其中，所述获取每个样本图像的所述多个可用未掩码区域对应的目标标签，包括：将每个样本图像的所述多个第二未掩码区域对应的第二待检测目标的目标标签，作为每个样本图像的所述多个可用未掩码区域的目标标签。7.根据权利要求1所述的方法，其中，所述基于每个样本图像的所述多个可用未掩码区域的特征图得到每个样本图像的目标特征图，包括：基于每个样本图像的所述多个可用未掩码区域的位置信息，将每个样本图像的所述多个可用未掩码区域的特征图填充到对应样本图像的第一位置；将预设特征图填充到对应样本图像的第二位置，所述第二位置是所述第一位置之外的
位置；基于每个样本图像的所述第一位置的特征图和所述第二位置的所述预设特征图，得到每个样本图像的所述目标特征图。8.根据权利要求1至7任一项所述的方法，其中，所述目标检测模型包括骨干网络和头网络；所述骨干网络用于基于每个样本图像的所述多个可用未掩码区域得到每个样本图像的所述多个可用未掩码区域的特征图，所述待训练模型包括所述骨干网络；所述头网络用于基于每个样本图像的所述目标特征图输出每个样本图像的目标检测结果。9.一种目标检测方法，包括：获取待检测图像；将所述待检测图像输入目标检测模型，得到所述目标检测模型输出的所述待检测图像的目标检测结果；其中，所述目标检测模型基于权利要求1至8任一项所述的目标检测模型的训练方法训练得到。10.一种目标检测模型的训练装置，包括：第一获取模块，用于获取每个样本图像的多个可用未掩码区域以及所述多个可用未掩码区域的位置信息；第二获取模块，用于获取每个样本图像的所述多个可用未掩码区域对应的目标标签；第一输入模块，用于将每个样本图像的所述多个可用未掩码区域以及所述位置信息输入待训练模型，得到每个样本图像的所述多个可用未掩码区域的特征图；第三获取模块，...

【专利技术属性】
技术研发人员：陈阳，李弼，希滕，张刚，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人