目标模型的训练方法、目标检测方法及装置制造方法及图纸

技术编号：37818106 阅读：13 留言：0更新日期：2023-06-09 09:49

本申请公开了目标模型的训练方法、目标检测方法及装置，人工智能技术领域，尤其涉及计算机视觉、目标检测技术领域。该目标模型的训练方法的具体实现方案为：利用目标模型对样本图像进行处理，得到第一检测结果和真值损失信息。利用第一模型对样本图像进行处理，得到第二检测结果，其中，目标模型的各卷积层与第一模型的各卷积层一一对应。根据真值损失信息，得到样本图像的样本权重。根据第一检测结果、第二检测结果和样本权重得到目标蒸馏损失信息。基于真值损失信息和目标蒸馏损失信息，利用第一模型对目标模型进行训练，得到经训练的目标模型。目标模型。目标模型。

全部详细技术资料下载

【技术实现步骤摘要】
目标模型的训练方法、目标检测方法及装置

[0001]本申请涉及人工智能
，尤其涉及计算机视觉、目标检测
，具体地，涉及一种目标模型的训练方法、目标检测方法及装置。

技术介绍

[0002]目标检测是计算机视觉
中的重要研究方向之一，是一种基于目标几何和统计特征的图像分割，它将目标的分割和识别合二为一。
[0003]随着人工智能技术的发展，利用计算机图像处理技术对目标进行实时动态跟踪检测，在智能交通、医学器械定位等方面得到广泛应用。

技术实现思路

[0004]本申请提供了一种目标模型的训练方法、目标检测方法及装置。
[0005]根据本申请的一方面，提供了一种目标模型的训练方法，包括：利用目标模型对样本图像进行处理，得到第一检测结果和真值损失信息。利用第一模型对样本图像进行处理，得到第二检测结果，其中，目标模型的各卷积层与第一模型的各卷积层一一对应；根据真值损失信息，得到样本图像的样本权重。根据第一检测结果、第二检测结果和样本权重得到目标蒸馏损失信息。基于真值损失信息和目标蒸馏损失信息，利用第一模型对目标模型进行训练，得到经训练的目标模型。
[0006]根据本申请的另一方面，提供了一种目标检测方法，包括：利用目标模型对待检测图像进行卷积处理，得到目标二维图像特征；其中，目标模型是利用上述目标模型的训练方法训练得到的。利用预定深度分布图对目标二维图像特征进行深度估计，得到目标深度分布特征图。根据目标深度特征分布图和目标二维特征图，得到目标三维特征图。对目标三维特征图进...

【技术保护点】

【技术特征摘要】
1.一种目标模型的训练方法，包括：利用目标模型对样本图像进行处理，得到第一检测结果和真值损失信息；利用第一模型对所述样本图像进行处理，得到第二检测结果，其中，所述目标模型的各卷积层与所述第一模型的各卷积层一一对应；根据所述真值损失信息，得到所述样本图像的样本权重；根据所述第一检测结果、所述第二检测结果和所述样本权重得到目标蒸馏损失信息；以及基于所述真值损失信息和所述目标蒸馏损失信息，利用所述第一模型对所述目标模型进行训练，得到经训练的目标模型。2.根据权利要求1所述的方法，其中，所述目标蒸馏损失信息包括特征蒸馏损失信息和结果蒸馏损失信息，其中，所述根据所述第一检测结果、所述第二检测结果和所述样本权重得到目标蒸馏损失信息，包括：根据所述第一检测结果，从所述目标模型输出的第一特征图中提取第一图像特征；根据所述第二检测结果，从所述第一模型输出的第二特征图中提取第二图像特征；根据所述第一图像特征、所述第二图像特征和所述样本权重，得到特征蒸馏损失信息；根据所述第一检测结果、所述第二检测结果和所述样本权重，得到结果蒸馏损失信息；以及根据所述特征蒸馏损失信息和所述结果蒸馏损失信息，得到所述目标蒸馏损失信息。3.根据权利要求2所述的方法，其中，所述第一图像特征包括第一二维图像特征和第一三维图像特征，所述第一特征图包括第一二维特征图和第一三维特征图，所述第一检测结果包括第一检测框的位置信息，所述根据所述第一检测结果，从所述目标模型输出的第一特征图中提取第一图像特征，包括：根据所述第一检测框的位置信息，从所述目标模型输出的所述第一二维特征图中提取所述第一二维图像特征；以及根据所述第一检测框的位置信息，从所述目标模型输出的所述第一三维特征图中提取所述第一三维图像特征。4.根据权利要求3所述的方法，其中，所述根据所述第一检测框的位置信息，从所述目标模型输出的所述第一二维特征图中提取所述第一二维图像特征，包括：根据来自图像采集设备的设备参数信息，将所述第一检测框映射到所述第一二维特征图中，得到第一二维感兴趣区域特征图；以及对所述第一二维感兴趣区域特征图进行池化处理，得到所述第一二维图像特征。5.根据权利要求3所述的方法，其中，所述根据所述第一检测框的位置信息，从所述目标模型输出的所述第一三维特征图中提取所述第一三维图像特征，包括：将所述第一检测框映射到所述第一三维特征图中，得到第一三维感兴趣区域特征图；以及对所述第一三维感兴趣区域特征图进行池化处理，得到所述第一三维图像特征。6.根据权利要求2所述的方法，其中，所述第二图像特征包括第二二维图像特征和第二三维图像特征，所述第二特征图包括第二二维特征图和第二三维特征图，所述第二检测结果包括第二检测框的位置信息，所述根据所述第二检测结果，从所述第一模型输出的第二
特征图中提取第二图像特征，包括：根据所述第二检测框的位置信息，从所述第一模型输出的所述第二二维特征图中提取所述第二二维图像特征；以及根据所述第二检测框的位置信息，从所述第一模型输出的所述第二三维特征图中提取所述第二三维图像特征。7.根据权利要求6所述的方法，其中，所述根据所述第二检测框的位置信息，从所述第一模型输出的所述第二二维特征图中提取所述第二二维图像特征，包括：根据来自图像采集设备的设备参数信息，将所述第二检测框映射到所述第二二维特征图中，得到第二二维感兴趣区域特征图；以及对所述第二二维感兴趣区域特征图进行池化处理，得到所述第二二维图像特征。8.根据权利要求6所述的方法，其中，所述根据所述第二检测框的位置信息，从所述第一模型输出的所述第二三维特征图中提取所述第二三维图像特征，包括：将所述第二检测框映射到所述第二三维特征图中，得到第二三维感兴趣区域特征图；以及对所述第二三维感兴趣区域特征图进行池化处理，得到所述第二三维图像特征。9.根据权利要求2所述的方法，其中，所述第一图像特征包括第一二维图像特征和第一三维图像特征，所述第二图像特征包括第二二维图像特征和第二三维图像特征，所述根据所述第一图像特征、所述第二图像特征和所述样本权重，得到特征蒸馏损失信息，包括：根据所述第一二维图像特征、所述第二二维图像特征和所述样本权重，得到二维图像特征的蒸馏损失信息；根据所述第一三维图像特征、所述第二三维图像特征和所述样本权重，得到三维图像特征的蒸馏损失信息；以及根据所述二维图像特征的蒸馏损失信息和所述三维图像特征的蒸馏损失信息，得到所述特征蒸馏损失信息。10.根据权利要求2所述的方法，其中，所述第一检测结果包括第一检测框的位置信息和第一目标类别信息；所述第二检测结果包括第二检测框的位置信息和第二目标类别信息；所述根据所述第一检测结果、所述第二检测结果和所述样本权重，得到结果蒸馏损失信息，包括：根据所述第一检测框的位置信息和所述第二检测框的位置信息和所述样本权重，得到位置蒸馏损失信息；根据所述第一目标类别信息、所述第二目标类别信息和所述样本权重，得到所述类别蒸馏损失信息；以及根据所述位置蒸馏损失信息和所述类别蒸馏损失信息，得到所述结果蒸馏损失信息。11.根据权利要求1所述的方法，其中，所述利用所述目标模型对所述样本图像进行处理，得到第一检测结果和真值损失信息，包括：利用所述目标模型对所述样本图像进行卷积处理，得到第一二维特征图；利用预定深度分布图对所述第一二维特征图进行深度估计，得到第一深度特征分布图；根据所述第一深度特征分布图和所述第一二维特征图，得到所述第一三维特征图；
对所述第一三维特征图进行检测处理，得到所述第一检测结果；以及基于真值损失函数，根据所述第一检测结果和样本标签，得到所述真值损失信息。12.根据权利要求11所述的方法，其中，所述根据所述第一深度特征分布图和所述第一二维特征图，得到所述第一三维特征图，包括：基于张量点积算法，对所述第一深度特征分布图和所述第一二维特征图进行处理，得到第一中间特征图；根据预定标定关系对所述第一中间特征图进行坐标转换处理，得到所述第二中间特征图；以及对所述第二中间特征图进行降维处理，得到所述第一三维特征图。13.根据权利要求1所述的方法，其中，所述利用所述第一模型对所述样本图像进行处理，得到第二检测结果，包括：利用所述第一模型对所述样本图像进行卷积处理，得到第二二维特征图；利用预定深度分布图对所述第二二维特征图进行深度估计，得到第二深度特征分布图；根据所述第二深度特征分布图和所述第二二维特征图，得到所述第二三维特征图；以及对所述第二三维特征图进行检测处理，得到所述第二检测结果。14.根据权利要求13所述的方法，其中，所述根据所述第二深度特征分布图和所述第二二维特征图，得到所述第二三维特征图，包括：基于张量点积算法，对所述第二深度特征分布图和所述第二二维特征图进行处理，得到第三中间特征图；根据预定标定关系对所述第三中间特征图进行坐标转换处理，得到所述第四中间特征图；以及对所述第四中间特征图进行降维处理，得到所述第二三维特征图。15.根据权利要求1所述的方法，其中，所述基于所述真值损失信息和所述目标蒸馏损失信息，利用所述第一模型对所述目标模型进行训练，得到经训练的目标模型，包括：根据所述真值损失信息和所述目标蒸馏损失信息，得到所述目标模型的损失信息；以及基于所述目标模型的损失信息，调节所述目标模型的参数，得到经训练的目标模型。16.一种目标检测方法，包括：利用目标模型对待检测图像进行卷积处理，得到目标二维图像特征；其中，所述目标模型是利用权利要求1～15任一项所述的训练方法训练得到的；利用预定深度分布图对所述目标二维图像特征进行深度估计，得到目标深度分布特征图；根据所述目标深度特征分布图和所述目标二维特征图，得到所述目标三维特征图；以及对所述目标三维特征图进行检测处理，得到目标检测结果。17.一种目标模型的训练装置，包括：第一处理模块，用于利用目标模型对样本图像进行处理，得到第一检测结果和真值损
失信息；第二处理模块，用于利用第一模型对所述样本图像进行处理，得到第二检测结果，其中，所述目标模型的各卷积层与所述第一模型的各卷积层一一对应；样...

【专利技术属性】
技术研发人员：王童，叶晓青，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人