场景识别模型训练方法、场景识别方法及模型训练装置制造方法及图纸

技术编号:31079825 阅读:23 留言:0更新日期:2021-12-01 11:51
本发明专利技术实施例公开了一种场景识别模型训练方法、场景识别方法及模型训练装置,该场景识别模型训练方法通过对所述全局场景特征进行注意力提取得到局部特征,利用局部特征得到局部预测损失,利用全局场景特征与局部特征合并得到融合特征,利用融合特征得到融合预测损失,再根据局部预测损失和融合预测损失得到总预测损失值来进行场景识别模型的参数修正,由于该实施例中通过训练图像的场景类别标签分别进行局部预测损失值和融合预测损失值的计算,从而无须对训练图像的局部特征进行标注,可以降低人工标注的投入,降低模型训练的复杂程度,可广泛应用于图像识别技术领域。可广泛应用于图像识别技术领域。可广泛应用于图像识别技术领域。

【技术实现步骤摘要】
场景识别模型训练方法、场景识别方法及模型训练装置


[0001]本专利技术涉及图像识别
,特别是涉及一种场景识别模型训练方法、场景识别方法及模型训练装置。

技术介绍

[0002]场景识别是计算机视觉技术的热点问题,通过场景识别能够得到图像中的场景信息。场景识别具有丰富的应用领域,例如自动监视、人机交互、视频索引、图像索引等。场景识别难度比通用物体识别大,造成这一难题的原因是场景特征经常在场景识别的背景环境中。而常规的场景识别方法一般都是集中在特定物体或者部位上提取特征,这种方式在训练场景识别模型时需要对样本中的物体进行大量的标注,训练的复杂程度较高。

技术实现思路

[0003]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0004]本专利技术实施例提供了一种场景识别模型训练方法、场景识别方法及模型训练装置,能够降低模型训练的复杂程度。
[0005]一方面,本专利技术实施例提供了一种场景识别模型训练方法,包括以下步骤:
[0006]获取训练图像以及所述训练图像的场景类别标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种场景识别模型训练方法,其特征在于,包括以下步骤:获取训练图像以及所述训练图像的场景类别标签;将所述训练图像输入至场景识别模型得到第一场景分类结果以及目标场景分类结果;根据所述第一场景分类结果以及所述场景类别标签得到局部预测损失值,根据所述目标场景分类结果以及所述场景类别标签得到融合预测损失值,根据所述局部预测损失值以及所述融合预测损失值得到总预测损失值;根据所述总预测损失值对所述场景识别模型的参数进行修正;其中,所述将所述训练图像输入至场景识别模型得到第一场景分类结果以及目标场景分类结果,包括:通过所述场景识别模型提取所述训练图像的全局场景特征,对所述全局场景特征进行注意力提取,得到局部特征,对所述局部特征进行场景类别预测得到第一场景分类结果;将所述全局场景特征和所述局部特征合并,得到融合特征,对所述融合特征进行场景类别预测得到目标场景分类结果。2.根据权利要求1所述的场景识别模型训练方法,其特征在于,所述场景识别模型训练方法还包括:通过所述场景识别模型对所述全局场景特征进行场景类别预测得到第二场景分类结果,根据所述第二场景分类结果以及所述场景类别标签得到全局预测损失值;所述根据所述局部预测损失值以及所述融合预测损失值得到总预测损失值,包括:根据所述局部预测损失值、所述融合预测损失值以及所述全局预测损失值得到总预测损失值。3.根据权利要求1所述的场景识别模型训练方法,其特征在于,所述全局场景特征用第一特征向量表征,所述局部特征用第二特征向量表征,所述对所述全局场景特征进行注意力提取,得到局部特征,包括:对所述第一特征向量进行压缩处理,得到压缩特征向量,其中,所述压缩特征向量表征被压缩后的所述第一特征向量中每个空间坐标的注意力强度;对所述压缩特征向量进行矩阵变换处理,得到每个所述注意力强度所对应的候选点;从所述训练图像中提取与每个所述候选点对应的原图像框,从所述原图像框中筛选出目标图像框;获取所述目标图像框对应的向量,得到第二特征向量。4.根据权利要求3所述的场景识别模型训练方法,其特征在于,所述从所述训练图像中提取与每个所述候选点对应的原图像框,包括:对每个所述候选点进行放大处理,得到每个所述候选点对应的放大区域,并根据所述压缩处理的压缩比例确定每个所述放大区域的大小;根据每个所述候选点在所述第一特征向量中的位置以及每个所述放大区域的大小,得到每个所述放大区域在所述训练图像中的平面坐标,根据每个所述放大区域的平面坐标从所述训练图像中分别提取与每个所述候选点对应的原图像框。5.根据权利要求3所述的场景识别模型训练方法,其特征在于,所述从所述原图像框中筛选出目标图像框,包括:获取每个所述原图像框所对应的置信度;
对所述置信度进行排序,根据所述置信度的排序结果得到候选图像框;获取除所述候选图像框以外其余的原图像框与所述候选图像框之间的交并比;将所述候选图像框以及所述交并比小于或者等于阈值的原图像框作为目标图像框。6.根据权利要求3至5任意一项所述的场景识别模型训练方法,其特征在于,所述获取所述目标图像框对应的向量,得到第二特征向量,包括:获取所述目标图像框在所述训练图像中对应的平面坐标;根据所述平面坐标从所述训练图像中提取目标图像块;对所述目标图像块进行特征提取,得到第二特征向量。7.根据权利要求3至...

【专利技术属性】
技术研发人员:郭卉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1