目标检测模型训练方法、目标检测方法、装置、电子设备制造方法及图纸

技术编号：35016085 阅读：15 留言：0更新日期：2022-09-21 15:19

本公开提供了一种目标检测模型的训练方法、目标检测方法、装置、电子设备和介质，涉及人工智能领域，尤其涉及图像处理、计算机视觉和深度学习等技术领域，可应用于智慧城市、智能交通等场景。一种目标检测模型的训练方法，包括：获得第一样本图像和第一样本图像的真实类别；基于第一样本图像，通过第一子网络获得第一样本图像的图像特征；基于第一样本图像的图像特征，根据第二子网络获得第一样本图像的预测类别；基于第一样本图像的图像特征和真实类别的第一向量表示确定第一损失值；基于预测类别和真实类别的第二向量表示确定第二损失值；以及基于第一损失值和第二损失值调整目标检测模型的参数。检测模型的参数。检测模型的参数。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测模型训练方法、目标检测方法、装置、电子设备

[0001]本公开涉及人工智能
，尤其涉及图像处理、计算机视觉和深度学习等
，可应用于智慧城市、智能交通等场景，具体涉及一种目标检测模型的训练方法、目标检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为（如学习、推理、思考、规划等）的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术：人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]在人工智能
中，计算机视觉是其中很重要的一个方面。可以通过训练目标检测模型，使得模型获得“视觉”能力，识别图像或视频中的目标或者对目标进行分类。然而，这样的模型往往难以训练，或者准确度有限，例如，训练效果会很大地依赖于初始训练样本等。期望一种能够获得更准确的目标检测或识别能力的训练方法。

技术实现思路

[0004]本公开提供了一种目标检测模型的训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]根据本公开的一方面，提供了一种目标检测模型的训练方法，所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络，所述方法包括：获得第一样本图像和所述第一样本图像的真实类别；基于所述第一样本图像，通过所...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法，所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络，其特征在于，所述方法包括：获得第一样本图像和所述第一样本图像的真实类别；基于所述第一样本图像，通过所述第一子网络获得所述第一样本图像的图像特征；基于所述第一样本图像的图像特征，根据所述第二子网络获得所述第一样本图像的预测类别；基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值；基于所述预测类别和所述真实类别的第二向量表示确定第二损失值；以及基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数。2.根据权利要求1所述的方法，其特征在于，所述目标检测模型还包括第三子网络，所述第三子网络用于基于所述第一样本图像生成至少一个候选框，其中，基于所述图像特征和所述真实类别的第一向量表示确定第一损失值包括：基于所述第一样本图像的在所述至少一个候选框处的图像特征和所述第一向量表示确定所述第一损失值。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：确定所述至少一个候选框中的属于前景的候选部分，并且其中，基于所述第一样本图像的在所述至少一个候选框处的图像特征和所述第一向量表示确定所述第一损失值包括：基于第一图像特征和所述第一向量表示确定所述第一损失值，所述第一图像特征是所述第一样本图像中的前景候选部分处的图像特征。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述第一样本图像是从第一样本图像集中获得的，所述第一样本图像集中的每个样本图像被对应标记一个类别，所述一个类别属于包括N个类别的类别集合，N为正整数，并且其中，所述真实类别的所述第一向量表示是指示所述真实类别对应所述类别集合中的一个类别的N维向量。5. 根据权利要求4所述的方法，其特征在于，所述方法还包括：获得第二样本图像集，所述第二样本图像集包括第二样本图像，所述第二样本图像被标记有第二类别，所述第二类别不属于所述N个类别；以及对所述类别集合进行更新，使得经更新的类别集合包括所述N个类别与所述第二类别。6. 根据权利要求5所述的方法，其特征在于，所述方法还包括：将所述第一向量表示更新为（N+1）维向量，使得经更新的第一向量表示指示所述真实类别对应所述经更新的类别集合中的一个类别；以及使用所述第一样本图像再次对所述目标检测模型进行训练。7.根据权利要求5所述的方法，其特征在于，所述方法还包括：通过将所述第二样本图像输入到所述第一子网络，获得所述第二样本图像的图像特征；通过将所述第二样本图像的图像特征输入到所述第二子网络，获得所述第二样本图像的预测类别；基于所述第二样本图像的图像特征和第二类别的第三向量表示确定第三损失值，其中，所述第三向量表示是指示所述第二类别对应所述经更新的类别集合中的一个类别的（N
+1）维向量；基于所述第二样本图像的预测类别和所述第二类别的第四向量表示确定第四损失值；以及基于所述第三损失值和所述第四损失值调整所述目标检测模型的参数。8.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述真实类别的第二向量表示与所述真实类别的第一向量表示相同。9.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述真实类别的第二向量表示是所述真实类别的类别名称的向量映射表示。10.根据权利要求1
‑
3中任一项所述的方法，其特征在于，基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数包括调整所述第一子网络和所述第二子网络的参数。11.一种目标检测方法，包括：基于待检测图像和目标检测模型，获得所述样本图像的预测类别，其特征在于，所述目标检测模型是根据权利要求1
‑
10中任一项所述的训练方法获得的。12.一种目标检测模型的训练装置，所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络，其特征在于，所述装置包括：真实类别获得单元，用于获得第一样本图像和所述第一样本图像的真实类别；图像特征获得单元，用于基于所述第一样本图像，通过所述第一子网络获得所述第一样本图像的图像特征；预测类别获得单元，用于基于所述第一样本图像的图像特征，根据所述第二子网络获得所述第一样本图像的预测类别；第一损失确定单元，用于基于所述第一样本图像的图像特征和所述真实类别的第一向量表示确定第一损失值；第二损失确定单元，用于基于所述预测类别和所述真实类别的第二向量表示确定第二损失...

【专利技术属性】
技术研发人员：林相如，张伟，谭啸，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人