检测模型的训练方法、目标检测方法、装置、设备和介质制造方法及图纸

技术编号：37122577 阅读：9 留言：0更新日期：2023-04-01 05:18

本公开提供了一种检测模型的训练方法，涉及人工智能技术领域，尤其涉及自然语言处理、深度学习、预训练模型技术，可应用在智慧城市、智慧政务场景下。具体实现方案为：将样本图像输入第一检测模型，得到第一骨干网络输出特征；对第一骨干网络输出特征分别进行至少一次卷积处理，得到第一查询特征、第一键特征和第一值特征；根据第二查询特征和第一查询特征，得到查询损失；根据第二键特征和第一键特征，得到键损失；根据第二值特征和第一值特征，得到值损失，其中，第二检测模型的参数量大于第一检测模型的参数量；以及根据查询损失、键损失和值损失，训练第一检测模型。本公开还提供了一种目标检测方法、装置、电子设备和存储介质。质。质。

全部详细技术资料下载

【技术实现步骤摘要】
检测模型的训练方法、目标检测方法、装置、设备和介质

[0001]本公开涉及人工智能
，尤其涉及自然语言处理、深度学习、预训练模型技术，可应用在智慧城市、智慧政务场景下。更具体地，本公开提供了一种检测模型的训练方法、目标检测方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展，深度学习模型的应用场景不断增加。可以基于模型蒸馏技术，提升检测模型的目标检测能力。

技术实现思路

[0003]本公开提供了一种检测模型的训练方法、目标检测方法、装置、电子设备和存储介质。
[0004]根据本公开的一方面，提供了一种检测模型的训练方法，该方法包括：将样本图像输入第一检测模型，得到第一骨干网络输出特征；对第一骨干网络输出特征分别进行至少一次卷积处理，得到第一查询特征、第一键特征和第一值特征；根据第二查询特征和第一查询特征，得到查询损失；根据第二键特征和第一键特征，得到键损失；根据第二值特征和第一值特征，得到值损失，其中，第二查询特征、第二键特征和第二值特征是利用第二检测模型处理样本图像得到的，第二检测模型的参数量大于第一检测模型的参数量；以及根据查询损失、键损失和值损失，训练第一检测模型。
[0005]根据本公开的另一方面，提供了一种目标检测方法，该方法包括：将目标图像输入第一检测模型，得到目标检测结果，其中，目标检测结果包括目标图像中目标对象的目标检测框，目标检测框用于指示目标对象所处的区域，其中，第一检测模型是利用本公开提供的方法训练的。
[0006]根据本公...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法，包括：将样本图像输入第一检测模型，得到第一骨干网络输出特征；对所述第一骨干网络输出特征分别进行至少一次卷积处理，得到第一查询特征、第一键特征和第一值特征；根据第二查询特征和所述第一查询特征，得到查询损失；根据第二键特征和所述第一键特征，得到键损失；根据第二值特征和所述第一值特征，得到值损失，其中，所述第二查询特征、所述第二键特征和所述第二值特征是利用第二检测模型处理所述样本图像得到的，所述第二检测模型的参数量大于第一检测模型的参数量；以及根据所述查询损失、所述键损失和所述值损失，训练所述第一检测模型。2.根据权利要求1所述的方法，其中，所述对所述第一骨干网络输出特征分别进行至少一次卷积处理，得到第一查询特征、第一键特征和第一值特征包括：对所述第一骨干网络输出特征进行第一卷积处理，得到所述第一查询特征；对所述第一骨干网络输出特征进行第二卷积处理，得到所述第一键特征；以及对所述第一骨干网络输出特征进行第三卷积处理，得到所述第一值特征。3.根据权利要求1所述的方法，其中，所述将样本图像输入第一检测模型，得到第一骨干网络输出特征包括：将所述样本图像输入所述第一检测模型，得到所述第一骨干网络输出特征、第一中间网络输出特征和第一检测结果。4.根据权利要求3所述的方法，其中，所述第一检测模型包括第一骨干网络、第一中间网络和第一检测网络，所述第二检测模型包括第二骨干网络、第二中间网络和第二检测网络，所述第二查询特征、所述第二键特征和所述第二值特征是利用所述第二骨干网络处理所述样本图像得到的，所述第一骨干网络的结构与所述第二骨干网络的结构相异。5.根据权利要求4所述的方法，其中，所述将所述样本图像输入所述第一检测模型，得到所述第一骨干网络输出特征、第一中间网络输出特征和第一检测结果包括：将所述样本图像输入所述第一骨干网络，得到所述第一骨干网络输出特征；将所述第一骨干网络输出特征输入所述第一中间网络，得到所述第一中间网络输出特征；以及将所述第一中间网络输出特征输入所述第一检测网络，得到所述第一检测结果。6.根据权利要求3所述的方法，其中，所述根据所述查询损失、所述键损失和所述值损失，训练所述第一检测模型包括：根据所述查询损失、所述键损失和所述值损失，得到骨干网络输出损失；根据第二中间网络输出特征和所述第一中间网络输出特征，得到中间网络输出损失，其中，所述第二中间网络输出特征是利用所述第二检测模型处理第二骨干网络输出特征得到的，所述第二骨干网络输出特征是将所述第二查询特征、所述第二键特征和所述第二值特征融合得到的；以及根据所述骨干网络输出损失和所述中间网络输出损失，训练所述第一检测模型。
7.根据权利要求6所述的方法，其中，所述根据第二中间网络输出特征和所述第一中间网络输出特征，得到中间网络输出损失包括：对所述第一中间网络输出特征进行归一化处理，得到第一中间归一化特征；对所述第二中间网络输出特征进行归一化处理，得到第二中间归一化特征；以及根据所述第一中间归一化特征和所述第二中间归一化特征，得到所述中间网络输出损失。8.根据权利要求7所述方法，其中，所述根据所述第一中间归一化特征和所述第二中间归一化特征，得到所述中间网络输出损失包括：对所述第一中间归一化特征进行全局上下文处理，得到第一全局特征；对所述第二中间归一化特征进行全局上下文处理，得到第二全局特征；根据所述第一全局特征和所述第二全局特征，得到第一中间网络输出子损失；以及根据所述第一中间网络输出子损失，得到所述中间网络输出损失。9.根据权利要求8所述的方法，其中，所述对所述第一中间归一化特征进行全局上下文处理，得到第一全局特征包括：基于通道注意力机制处理所述第一中间归一化特征，得到第一通道注意力特征；基于空间注意力机制处理所述第一通道注意力特征，得到所述第一空间注意力特征；以及对所述第一空间注意力特征进行全局上下文处理，得到所述第一全局特征。10.根据权利要求8所述的方法，其中，所述对所述第二中间归一化特征进行全局上下文处理，得到第二全局特征包括：基于通道注意力机制处理所述第二中间归一化特征，得到第二通道注意力特征；基于空间注意力机制处理所述第二通道注意力特征，得到所述第二空间注意力特征；以及对所述第二空间注意力特征进行全局上下文处理，得到所述第二全局特征。11.根据权利要求6所述的方法，其中，所述根据第二中间网络输出特征和所述第一中间网络输出特征，得到中间网络输出损失包括：根据所述样本图像的标签指示的标注检测框位置，对所述第一中间网络输出特征进行掩码处理，得到第一中间掩码特征；根据所述样本图像的标签指示的标注检测框位置，对所述第二中间网络输出特征进行掩码处理，得到第二中间掩码特征；对所述第一中间掩码特征进行全局上下文处理，得到第一全局掩码特征；对所述第二中间掩码特征进行全局上下文处理，得到第二全局掩码特征；根据所述第一全局掩码特征和所述第二全局掩码特征，得到第二中间网络输出子损失；以及根据所述第二中间网络输出子损失，得到所述中间网络输出损失。12.根据权利要求6所述的方法，其中，所述根据所述骨干网络输出损失和所述中间网络输出损失，训练所述第一检测模型包括：根据第二检测结果和所述第一检测结果，得到蒸馏损失；根据所述样本图像的标签和所述第一检测结果，得到检测损失，其中，所述标签包括所
述样本图像中样本对象的标注检测框，所述标注检测框用于指示所述样本对象所处的区域；以及根据所述骨干网络输出损失、所述中间网络输出损失、所述蒸馏损失和所述检测损失，训练所述第一检测模型。13.一种目标检测方法，包括：将目标图像输入第一检测模型，得到目标检测结果，其中，所述目标检测结果包括所述目标图像中目标对象的目标检测框，所述目标检测框用于指示所述目标对象所处的区域，其中，所述第一检测模型是利用权利要求1至12任一项所述的方法训练的。14.一种检测模型的训练装置，包括：第一获得模块，用于将样本图像输入第一检测模型，得到第一骨干网络输出特征；卷积处理模块，用于对所述第一骨干网络输出特征分别进行至少一次卷积处理，得到第一查询特征、第一键特征和第一值特征；第二获得模块，用于根据第二查询特征和所述第一查询特征，得到查询损失；第三获得模块，用于根据第二键特征...

【专利技术属性】
技术研发人员：沈智勇，赵一麟，陆勤，龚建，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人