【技术实现步骤摘要】
模型的训练及场景识别方法、装置、设备及介质
[0001]本专利技术涉及图像识别
,尤其涉及一种模型的训练及场景识别方法、装置、设备及介质。
技术介绍
[0002]随着信息技术的发展,用户越来越多地通过图像来传递信息,比如,视频中某一视频帧对应的图像、用户拍摄的图像。图像可以涉及各种各样的场景,比如美食场景、人像场景、风景场景及卡通场景等。识别图像所属的场景,在图像内容分析以及图像检索等领域具有十分重要的意义。
[0003]因此,如何准确地识别图像所属的场景是近几年来人们日益关注的问题。
技术实现思路
[0004]本专利技术实施例提供了一种模型的训练及场景识别方法、装置、设备及介质,用以准确地识别图像所述的场景。
[0005]本专利技术实施例提供了一种场景识别方法,所述方法包括:
[0006]通过预先训练的场景识别模型中的特征提取层,获取待识别图像的特征图;
[0007]对于所述场景识别模型中的至少两个第一分类层,通过所述第一分类层中的第一子网络,基于所述特征图以及上一第一 ...
【技术保护点】
【技术特征摘要】
1.一种场景识别方法,其特征在于,所述方法包括:通过预先训练的场景识别模型中的特征提取层,获取待识别图像的特征图;对于所述场景识别模型中的至少两个第一分类层,通过所述第一分类层中的第一子网络,基于所述特征图以及上一第一分类层输出的融合特征向量,确定第一特征向量;通过所述第一分类层中的第二子网络,确定所述第一特征向量对应的第二特征向量,基于所述第一特征向量及所述第二特征向量,确定所述第一分类层对应的融合特征向量并输出至下一第一分类层,并基于所述第二特征向量,确定所述待识别图像在所述第一分类层对应的层级所归属的场景;其中,不同层级所包含的场景不同。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过所述场景识别模型中的第二分类层,基于所述特征图以及最后一个第一分类层输出的融合特征向量,确定所述待识别图像在所述第二分类层对应的层级所归属的场景;其中,所述第二分类层对应的层级所包含的场景与所述至少两个第一分类层分别对应的层级所包含的场景不同。3.根据权利要求1或2所述的方法,其特征在于,所述场景识别模型通过如下方式训练:获取样本集中的任一样本图像;其中,所述样本图像在每个预设层级均对应有样本场景标签,任一预设层级的样本场景标签用于标识所述样本图像在所述预设层级所归属的场景,所述至少一个样本场景标签不同,所述每个预设层级包括所述至少两个第一分类器分别对应的层级;通过原始场景识别模型,基于所述样本图像,确定所述样本图像在所述每个预设层级分别对应的场景概率向量;其中,任一预设层级所对应的场景概率向量包括所述样本图像分别归属于该层级的每个场景的概率值;根据所述每个预设层级分别对应的场景概率向量、及对应预设层级的样本场景标签所对应的概率值,对所述场景识别模型进行训练。4.根据权利要求3所述的方法,其特征在于,所述根据每个所述场景概率向量及对应的样本场景标签所对应的概率值,对所述场景识别模型进行训练,包括:根据所述样本图像在所述每个预设层级分别对应的场景概率向量以及对应预设层级的样本场景标签,确定第一损失值;根据所述第一损失值,对所述场景识别模型中的参数值进行调整。5.根据权利要求4所述的方法,其特征在于,所述根据所述样本图像在所述每个预设层级分别对应的场景概率向量以及对应预设层级的样本场景标签,确定第一损失值,包括:根据所述样本图像在所述每个预设层级分别对应的场景概率向量以及对应预设层级的样本场景标签,确定所述每个预设层级分别对应的多分类交叉熵子损失值;根据所述每个预设层级分别对应的多分类交叉熵子损失值的和,确定所述第一损失值。6.根据权利要求5所述的方法,其特征在于,所述根据所述样本图像在所述每个预设层级分别对应的场景概率向量以及对应预设层级的样本场景标签,确定所述每个预设层级分别对应的多分类交叉熵子损失值,包括:对于所述每个预设层级的第一分类层,根据该层级的第一分类层对应的场景概率向量、及该层级的父层级的第一分类层对应的场景概率向量,确定该层级对应的多分类交叉
熵子损失值。7.根据权利要求6所述的方法,其特征在于,所述根据该层级的第一分类层对...
【专利技术属性】
技术研发人员:温偲,项伟,陈德健,
申请(专利权)人:百果园技术新加坡有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。