【技术实现步骤摘要】
一种目标检测模型的训练方法、目标检测的方法和装置
[0001]本专利技术涉及计算机
,尤其涉及一种目标检测模型的训练方法、目标检测的方法和装置。
技术介绍
[0002]目前实现商品检测的方法主要分为两类:一类是使用两阶段目标检测模型在商品场景下进行检测,如以Faster
‑
RCNN为代表的目标检测模型;另一类是使用单阶段目标检测模型进行商品检测,如以YOLO为代表的一系列目标检测模型。但是,卷积神经网络(Convolution Neural Network,CNN)擅长提取局部有效信息而无法提取全局数据之间的长距离特征关系,且计算流程复杂。
[0003]基于自注意力机制的目标检测方法主要包括DETR和ViT
‑
FRCNN两个方法,但DETR方法的计算复杂度高、对小目标检测效果不好,ViT
‑
FRCNN存在后处理操作复杂等缺陷。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供一种目标检测模型的训练方法、目标检测的方法和装置,能够更充分 ...
【技术保护点】
【技术特征摘要】
1.一种目标检测模型的训练方法,其特征在于,包括:获取多个图像和每个所述图像对应的图像标签,所述图像标签包括所述图像中目标的位置和类别;根据所述图像获得所述图像对应的特征向量和位置编码向量;根据所述特征向量和所述位置编码向量获得所述图像对应的解码向量;采用多个所述图像对应的解码向量和图像标签进行训练,得到所述目标检测模型。2.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:从多个图像和每个所述图像对应的图像标签中选择出部分图像和每个图像对应的图像标签;根据所述部分图像和每个图像对应的图像标签训练得到图像检测模型;利用所述图像检测模型对所述多个图像和图像标签进行数据清洗,确定出待重新标注的图像标签,对所述待重新标注的图像标签进行重新标注。3.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:根据每个所述图像对应的图像标签确定每个类别对应的图像的数量;根据每个所述类别对应的图像的数量对部分类别的图像和图像标签进行数据增强。4.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量,包括:提取所述图像的每个子区域的图像特征,根据各个子区域的图像特征得到所述图像对应的特征向量;根据各个子区域的图像特征获得所述图像对应的位置编码向量,所述位置编码向量包含所述图像对应的各个子区域的图像特征之间的位置关系。5.根据权利要求4所述的训练方法,其特征在于,提取所述图像的每个子区域的图像特征之前,包括:采用显著性检测模型检测出所述图像的前景区域;对所述前景区域按照不同尺度划分,获得所述图像对应的多个子区域。6.根据权利要求4所述的训练方法,其特征在于,提取每个子区域的图像特征,根据各个子区域的图像特征得到所述图像对应的特征向量,包括:利用包含特征金字塔网络的骨干特征提取网络提取每个子区域的图像特征,得到每个子区域对应的子区域特征向量,根据所述图像对应的各个子区域特征向量得到所述图像对应的特征向量。7.根据权利要求1所述的训练方法,其特征在于,根据所述特征向量和所述位置编码向量获得所述图像对应的解码向量,包括:根据所述特征向量和所述位置编码向量得到融合特征向量;基于自注意力机制的模型对所述融合特征向量进行特征编码和特征解码,得到所述解码向量。8.根据权利要求1所述的训练方法,其特征在于,采用多个所述图像对应的解码向量和图像标签进行训练,得到所述目标检测模型,包括:
将各个图像对应的解码向量输入到共享前馈网络,得到各个图像对应的预测的目标的位置和类别,根据所述预测的目标的位置和类别以及各个图像的图像标签对损失函数进行迭代训练,得到所述目标检测模型,所述损失函数包括位置损失和类别损失。9.根据权利要求8所述的训练方法,其特征在于,所述目标的位置包括所述目标对应的目标框的中心坐标、宽度和高度,所述位置损失为根据预测目标框和真实目标框的交集面积和并集面积的比值得到的损失,所述类别损失为真实目标框集合和预测目标框集合的二分匹配排列的损失,所述共享前馈网络由Relu激活函数、多层感知机和线性层构成。10.一种目标检测的方法,其特征在于,包括:获取待检测图像;将所述待检测图像输入到训练好的...
【专利技术属性】
技术研发人员:刘安,吕晶晶,张政,刘平,
申请(专利权)人:北京沃东天骏信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。