模型训练方法、模型训练装置、存储介质和电子设备制造方法及图纸

技术编号：26792705 阅读：55 留言：0更新日期：2020-12-22 17:08

本发明专利技术实施例公开了一种模型训练方法、模型训练装置、存储介质和电子设备。本发明专利技术实施例在获取源域的待训练模型、第一图像集合和目标域的第二图像集合后，以各第一图像为输入，并以各第一图像对应的对象识别框和对象识别框的类别为训练目标对待训练模型进行训练，同时以各第二图像为输入，获取第二图像在待训练模型的不同层的输出，以对注意力判别模型和特征判别模型进行训练，从而响应于待训练模型的检测损失函数、注意力判别模型的注意力损失函数和特征判别模型的特征损失函数收敛，将训练后的待训练模型确定为目标模型。本发明专利技术实施例无需对目标域图像标记就可以对待训练模型进行训练，提升了模型对于目标域的物体检测能力，并降低了标记成本。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、模型训练装置、存储介质和电子设备
本专利技术涉及数据处理
，具体涉及一种模型训练方法、模型训练装置、存储介质和电子设备。
技术介绍
在传统视觉领域，物体检测属于非常热门的研究方向。随着科学技术的不断发展，人们可以通过机器学习的方式对RGB像素矩阵(也即，图像采集装置采集到的彩色图像)中的目标物体进行较为准确的物体检测。但RGB像素矩阵容易受到采集环境的影响，例如外界环境的光线强度、能见度等，因此在对不同环境下得到的RGB像素矩阵进行物体检测时，会导致机器学习的方式存在一定的局限性，对于一些环境下得到的RGB像素矩阵的检测准确性较高，而对于另一些环境下得到的RGB像素矩阵的检测准确性不高。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种模型训练方法、模型训练装置、存储介质和电子设备，用于提升模型在预定环境下物体检测的准确性。根据本专利技术实施例的第一方面，提供一种模型训练方法，所述方法包括：获取源域对应的待训练模型，所述待训练模型用于进行物体检测；获取...

【技术保护点】
1.一种模型训练方法，其特征在于，所述方法包括：/n获取源域对应的待训练模型，所述待训练模型用于进行物体检测；/n获取所述源域对应的第一图像集合以及目标域对应的第二图像集合，所述第一图像集合包括多个第一图像，所述第一图像包括第一对象，且各所述第一对象属于同一类别，所述第二图像集合包括多个第二图像，所述第二图像包括第二对象，且各所述第二对象属于同一类别；/n对于各所述第一图像，分别以各所述第一图像为所述待训练模型的输入，以所述第一图像对应的标识信息为训练目标对所述待训练模型进行训练，直至所述待训练模型的检测损失函数收敛，所述标识信息包括所述第一图像内的至少一个对象识别框以及所述对象识别框对应的类...

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法包括：
获取源域对应的待训练模型，所述待训练模型用于进行物体检测；
获取所述源域对应的第一图像集合以及目标域对应的第二图像集合，所述第一图像集合包括多个第一图像，所述第一图像包括第一对象，且各所述第一对象属于同一类别，所述第二图像集合包括多个第二图像，所述第二图像包括第二对象，且各所述第二对象属于同一类别；
对于各所述第一图像，分别以各所述第一图像为所述待训练模型的输入，以所述第一图像对应的标识信息为训练目标对所述待训练模型进行训练，直至所述待训练模型的检测损失函数收敛，所述标识信息包括所述第一图像内的至少一个对象识别框以及所述对象识别框对应的类别标识；
对于各所述第二图像，分别以各所述第二图像为所述待训练模型的输入，获取所述第二图像对应的第一特征和第二特征，第一特征以及所述第二特征为所述待训练模型的不同层的输出，所述第一特征以及所述第二特征用于使得第一注意力判别模型以及第二注意力判别模型的注意力损失函数收敛，并使得第一特征判别模型、第二特征判别模型以及第三特征判别模型的特征损失函数收敛；
响应于所述特征损失函数、所述注意力损失函数以及所述检测损失函数均收敛，将训练后的所述待训练模型确定为所述目标域对应的目标模型。

2.根据权利要求1所述的方法，其特征在于，所述待训练模型包括第四块结构、第五块结构和兴趣区域池化层；
所述分别以各所述第一图像为所述待训练模型的输入，以所述第一图像对应的信息集合为训练目标对所述待训练模型进行训练包括：
以各所述第一图像为所述待训练模型的输入，获取所述第四块结构输出的第三特征；
根据所述第三特征，基于第一注意力模型获取对应的所述第一图像的第四特征；
根据所述第四特征确定所述第五块结构的输入，以获取对应的所述第一图像的第五特征；
根据所述第五特征，基于第二注意力模型获取对应的所述第一图像的第六特征；
根据所述第六特征确定所述兴趣区域池化层的输入，以对应的所述标识信息为训练目标对所述待训练模型进行训练。

3.根据权利要求2所述的方法，其特征在于，所述分别以各所述第一图像为所述待训练模型的输入，以所述第一图像对应的信息集合为训练目标对所述待训练模型进行训练还包括：
根据所述第四特征、经过梯度反转处理的第三特征以及对应的所述第一图像的第一域标签对第一注意力判别模型进行训练。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第四特征、经过梯度反转处理的第三特征以及对应的所述第一图像的第一域标签对第一注意力判别模型进行训练包括：
以所述第三特征为第一梯度反转结构的输入，获取经过梯度反转处理的所述第三特征；
根据所述第四特征以及经过梯度反转处理的第三特征确定第一通道乘积向量；
以所述第一通道乘积向量为所述第一注意力判别模型的输入，以对应的所述第一域标签为训练目标对所述第一注意力判别模型进行训练。

5.根据权利要求2所述的方法，其特征在于，所述根据所述第四特征确定所述第五块结构的输入包括：
根据所述第三特征以及所述第四特征确定第二通道乘积向量；
以所述第二通道乘积向量为所述第五块结构的输入。

6.根据权利要求3所述的方法，其特征在于，所述分别以各所述第一图像为所述待训练模型的输入，以所述第一图像对应的信息集合为训练目标对所述待训练模型进行训练还包括：
根据所述第六特征以及经过梯度反转处理的第五特征以及对应的所述第一图像的第一域标签对第二注意力判别模型进行训练。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第六特征、经过梯度反转处理的第五特征以及对应的所述第一图像的第一域标签对第二注意力判别模型进行训练包括：
以所述第五特征为第二梯度反转结构的输入，获取经过梯度反转处理的所述第五特征；
根据所述第六特征以及经过梯度反转处理的第五特征确定第三通道乘积向量；
以所述第三通道乘积向量为所述第二注意力判别模型的输入，以对应的所述第一域标签为训练目标对所述第二注意力判别模型进行训练。

8.根据权利要求2所述的方法，其特征在于，所述根据所述第六特征确定所述兴趣区域池化层的输入包括：
根据所述第五特征以及所述第六特征确定第四通道乘积向量；
以所述第四通道乘积向量为所述兴趣区域池化层的输入。

9.根据权利要求1所述的方法，其特征在于，所述待训练模型包括第四块结构以及第五块结构，所述第一特征为所述第四块结构的输出，所述第二特征为所述第五块结构的输出；
所述分别以各所述第二图像为所述待训练模型的输入，获取所述第二图像对应的第一特征和第二特征包括：
以各所述第二图像为所述待训练模型的输入，获取所述第一特征；
根据所述第一特征，基于所述第一注意力模型获取第七特征；
根据所述第七特征确定所述第五块结构的输入，以获取对应的所述第二图像的所述第二特征。

10.根据权利要求9所述的方法，其特征在于，所述根据所述第七特征确定所述第五块结构的输入，以获取对应的所述第二图像的所述第二特征包括：
根据所述第七特征以及所述第一特征确定第六通道乘积向量；
以所述第六通道乘积向量为所述第五块结构的输入。

11.根据权利要求9所述的方法，其特征在于，所述第一特征以及所述第二特征用于使得第一注意力判别模型以及第二注意力判别模型的注意力损失函数收敛包括：
根据所述第七特征、经过梯度反转处理的第一特征以及对应的所述第二图像的第二域标签对第一注意力判别模型进行训练。

12.根据权利要求11所述的方法，其特征在于，所述根据所述第七特征、经过梯度反转处理的第一特征以及对应的所述第二图像的第二域标签对第一注意力判别模型进行训练包括：
以所述第一特征为第一梯度反转结构的输入，获取经过梯度反转...

【专利技术属性】
技术研发人员：赵震，郭玉红，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人