开放场景中多场景识别方法、系统、设备及存储介质技术方案

技术编号:28037992 阅读:24 留言:0更新日期:2021-04-09 23:20
本发明专利技术公开了开放场景中多场景识别方法、系统、设备及存储介质,其中开放场景中多场景识别模型生成方法包括:在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型;对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。该模型属于分类模型,利用深度学习框架和通道注意机制,以实现开放场景中多场景识别的目的。

【技术实现步骤摘要】
开放场景中多场景识别方法、系统、设备及存储介质
本专利技术涉及图像识别领域,尤其涉及一种开放场景中多场景识别方法、系统、设备及存储介质。
技术介绍
随着信息时代的到来,人们在出行旅游过程中,都会随手拍摄许多照片并上传至网络平台进行分享。以一些OTA(在线旅游)平台的图库为例,每天都会新增大量由用户或者商家上传的图片,图库中累计了海量的图片。由于无法通过人工进行审核和标注,这些图片杂乱无章,难以利用,通常依赖自动识别及分类机制来对图片内容进行识别并打上相应标签,如场景类别的识别等。在现有技术中,对特定某一类场景中图片进行分类和识别的方法有很多,但在包括很多种场景的开放场景中识别出包含特定场景的内容图片的方法识别的准确率不高。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中在开放场景中识别出包含特定场景的内容图片的方法识别的准确率不高的缺陷,提供一种开放场景中多场景识别方法、系统、设备及存储介质。本专利技术是通过下述技术方案来解决上述技术问题:本专利技术提供一种开放场景中多场景识别模型生成方法,所述开放场景中多场景识别模型生成方法包括:在残差网络中的conv3_x(一种卷积层)层、conv4_x(一种卷积层)层和conv5_x(一种卷积层)层中的至少一层后插入一ECA(通道注意机制)层后得到一初始模型;对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。优选地,所述在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型包括:分别在所述残差网络中的所述conv3_x层、conv4_x层和conv5_x层后均插入一ECA层后得到所述初始模型;和/或,多场景类别标签包括建筑类标签和其他类标签,所述建筑类标签包括中式建筑标签、东西式建筑标签、现代建筑标签、公园乐园标签、遗迹古址标签中的至少一种。优选地,所述训练所述初始模型得到开放场景中多场景识别模型,包括:设置加权交叉熵函数作为主损失函数;设置Ringloss作为辅助损失函数;利用所述主损失函数和所述辅助损失函数训练所述初始模型得到所述开放场景中多场景识别模型。优选地,所述利用所述主损失函数和所述主损失函数训练所述初始模型得到开放场景中多场景识别模型,包括:设置所述主损失函数和所述辅助损失函数的加权和为最终的损失函数;利用所述最终的损失函数训练所述初始模型得到开放场景中多场景识别模型。优选地,所述利用所述主损失函数和所述辅助损失函数训练所述初始模型得到开放场景中多场景识别模型之前还包括:采用动量的随机梯度下降法和反向传播算法优化所述初始模型。本专利技术还提供一种开放场景中多场景识别方法,所述开放场景中多场景识别方法包括:获取开放场景中的待识别场景的目标图片;将所述目标图片输入至开放场景中多场景识别模型进行分类,以得到多场景中对应的场景类别识别的结果;所述开放场景中多场景识别模型使用如上所述的开放场景中多场景识别模型的生成方法生成。本专利技术还提供一种开放场景中多场景识别模型生成系统,所述开放场景中多场景识别模型生成系统包括模型建立模块、标注模块和训练模块;所述模型建立模块用于在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型;所述标注模块用于对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;所述训练模块用于以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。优选地,所述模型建立模块用于分别在所述残差网络中的所述conv3_x层、conv4_x层和conv5_x层后均插入一ECA层后得到所述初始模型;和/或,多场景类别标签包括建筑类标签和其他类标签,所述建筑类标签包括中式建筑标签、东西式建筑标签、现代建筑标签、公园乐园标签、遗迹古址标签中的至少一种。优选地,所述训练模块包括设置单元和训练单元;所述设置单元用于设置加权交叉熵函数作为主损失函数,以及设置Ringloss作为辅助损失函数;所述训练单元用于利用所述主损失函数和所述辅助损失函数训练所述初始模型得到所述开放场景中多场景识别模型。优选地,所述训练单元用于设置所述主损失函数和所述辅助损失函数的加权和为最终的损失函数;所述训练单元还用于利用所述最终的损失函数训练所述初始模型得到开放场景中多场景识别模型。优选地,所述训练模块包括还包括优化单元;所述优化单元用于采用动量的随机梯度下降法和反向传播算法优化所述初始模型。本专利技术还提供一种开放场景中多场景识别系统,所述开放场景中多场景识别系统包括获取模块、分类模块;所述获取模块用于获取开放场景中的待识别场景的目标图片;所述分类模块用于将所述目标图片输入至开放场景中多场景识别模型进行分类,以得到多场景中对应的场景类别识别的结果;所述开放场景中多场景识别模型使用如上所述的开放场景中多场景识别模型的生成系统生成。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的开放场景中多场景识别模型生成方法或如上述的开放场景中多场景识别方法。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的开放场景中多场景识别模型生成方法或如上所述的开放场景中多场景识别方法的步骤。本专利技术的积极进步效果在于:本专利技术通过在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型;对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。该模型属于分类模型,利用深度学习框架和通道注意机制,以实现开放场景中多场景识别的目的。附图说明图1为本专利技术的实施例1的开放场景中多场景识别模型生成方法的流程示意图。图2为本专利技术的实施例1的开放场景中多场景识别模型生成方法的初始模型的结构示意图。图2-1为本专利技术的实施例1的开放场景中多场景识别模型生成方法的ECA层的结构示意图。图3为本专利技术的实施例2的开放场景中多场景识别方法的流程示意图。图4为本专利技术的实施例3的开放场景中多场景识别模型生成系统的模块示意图。图5为本专利技术的实施例3的开放场景中多场景识别模型生成系统的训练模块33的模块示意图。图6为本专利技术的实施例4的开放场景中多场景本文档来自技高网...

【技术保护点】
1.一种开放场景中多场景识别模型生成方法,其特征在于,所述开放场景中多场景识别模型生成方法包括:/n在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型;/n对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;/n以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。/n

【技术特征摘要】
1.一种开放场景中多场景识别模型生成方法,其特征在于,所述开放场景中多场景识别模型生成方法包括:
在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型;
对开放场景中的若干样本图片进行标注,以得到对应的多场景类别标签;
以所述若干样本图片作为输入,以对应的所述场景类别标签作为输出,训练所述初始模型得到开放场景中多场景识别模型。


2.如权利要求1所述的开放场景中多场景识别模型生成方法,其特征在于,所述在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型包括:
分别在所述残差网络中的所述conv3_x层、conv4_x层和conv5_x层后均插入一ECA层后得到所述初始模型;
和/或,
多场景类别标签包括建筑类标签和其他类标签,所述建筑类标签包括中式建筑标签、东西式建筑标签、现代建筑标签、公园乐园标签、遗迹古址标签中的至少一种。


3.如权利要求1所述的开放场景中多场景识别模型生成方法,其特征在于,所述训练所述初始模型得到开放场景中多场景识别模型,包括:
设置加权交叉熵函数作为主损失函数;
设置Ringloss作为辅助损失函数;
利用所述主损失函数和所述辅助损失函数训练所述初始模型得到所述开放场景中多场景识别模型。


4.如权利要求3所述的开放场景中多场景识别模型生成方法,其特征在于,所述利用所述主损失函数和所述主损失函数训练所述初始模型得到开放场景中多场景识别模型,包括:
设置所述主损失函数和所述辅助损失函数的加权和为最终的损失函数;
利用所述最终的损失函数训练所述初始模型得到开放场景中多场景识别模型。


5.如权利要求3所述的开放场景中多场景识别模型生成方法,其特征在于,所述利用所述主损失函数和所述辅助损失函数训练所述初始模型得到开放场景中多场景识别模型之前还包括:
采用动量的随机梯度下降法和反向传播算法优化所述初始模型。


6.一种开放场景中多场景识别方法,其特征在于,所述开放场景中多场景识别方法包括:
获取开放场景中的待识别场景的目标图片;
将所述目标图片输入至开放场景中多场景识别模型进行分类,以得到多场景中对应的场景类别识别的结果;
所述开放场景中多场景识别模型使用如权利要求1至5任一项所述的开放场景中多场景识别模型的生成方法生成。


7.一种开放场景中多场景识别模型生成系统,其特征在于,所述开放场景中多场景识别模型生成系统包括模型建立模块、标注模块和训练模块;
所述模型建立模块用于在残差网络中的conv3_x层、conv4_...

【专利技术属性】
技术研发人员:杨凯罗超胡泓李巍
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1