开放场景中多场景识别方法、系统、设备及存储介质技术方案

技术编号：28037992 阅读：24 留言：0更新日期：2021-04-09 23:20

本发明专利技术公开了开放场景中多场景识别方法、系统、设备及存储介质，其中开放场景中多场景识别模型生成方法包括：在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型；对开放场景中的若干样本图片进行标注，以得到对应的多场景类别标签；以所述若干样本图片作为输入，以对应的所述场景类别标签作为输出，训练所述初始模型得到开放场景中多场景识别模型。该模型属于分类模型，利用深度学习框架和通道注意机制，以实现开放场景中多场景识别的目的。

全部详细技术资料下载

【技术实现步骤摘要】
开放场景中多场景识别方法、系统、设备及存储介质
本专利技术涉及图像识别领域，尤其涉及一种开放场景中多场景识别方法、系统、设备及存储介质。
技术介绍
随着信息时代的到来，人们在出行旅游过程中，都会随手拍摄许多照片并上传至网络平台进行分享。以一些OTA(在线旅游)平台的图库为例，每天都会新增大量由用户或者商家上传的图片，图库中累计了海量的图片。由于无法通过人工进行审核和标注，这些图片杂乱无章，难以利用，通常依赖自动识别及分类机制来对图片内容进行识别并打上相应标签，如场景类别的识别等。在现有技术中，对特定某一类场景中图片进行分类和识别的方法有很多，但在包括很多种场景的开放场景中识别出包含特定场景的内容图片的方法识别的准确率不高。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中在开放场景中识别出包含特定场景的内容图片的方法识别的准确率不高的缺陷，提供一种开放场景中多场景识别方法、系统、设备及存储介质。本专利技术是通过下述技术方案来解决上述技术问题：本专利技术提供一种开放场景中多场景识别模型生成方法，所述开放场景中多场景识别模型生成方法包括：在残差网络中的conv3_x(一种卷积层)层、conv4_x(一种卷积层)层和conv5_x(一种卷积层)层中的至少一层后插入一ECA(通道注意机制)层后得到一初始模型；对开放场景中的若干样本图片进行标注，以得到对应的多场景类别标签；以所述若干样本图片作为输入，以对应的所述场景类别标签作为输出，训练所述初始模...

【技术保护点】
1.一种开放场景中多场景识别模型生成方法，其特征在于，所述开放场景中多场景识别模型生成方法包括：/n在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型；/n对开放场景中的若干样本图片进行标注，以得到对应的多场景类别标签；/n以所述若干样本图片作为输入，以对应的所述场景类别标签作为输出，训练所述初始模型得到开放场景中多场景识别模型。/n

【技术特征摘要】
1.一种开放场景中多场景识别模型生成方法，其特征在于，所述开放场景中多场景识别模型生成方法包括：
在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型；
对开放场景中的若干样本图片进行标注，以得到对应的多场景类别标签；
以所述若干样本图片作为输入，以对应的所述场景类别标签作为输出，训练所述初始模型得到开放场景中多场景识别模型。

2.如权利要求1所述的开放场景中多场景识别模型生成方法，其特征在于，所述在残差网络中的conv3_x层、conv4_x层和conv5_x层中的至少一层后插入一ECA层后得到一初始模型包括：
分别在所述残差网络中的所述conv3_x层、conv4_x层和conv5_x层后均插入一ECA层后得到所述初始模型；
和/或，
多场景类别标签包括建筑类标签和其他类标签，所述建筑类标签包括中式建筑标签、东西式建筑标签、现代建筑标签、公园乐园标签、遗迹古址标签中的至少一种。

3.如权利要求1所述的开放场景中多场景识别模型生成方法，其特征在于，所述训练所述初始模型得到开放场景中多场景识别模型，包括：
设置加权交叉熵函数作为主损失函数；
设置Ringloss作为辅助损失函数；
利用所述主损失函数和所述辅助损失函数训练所述初始模型得到所述开放场景中多场景识别模型。

4.如权利要求3所述的开放场景中多场景识别模型生成方法，其特征在于，所述利用所述主损失函数和所述主损失函数训练所述初始模型得到开放场景中多场景识别模型，包括：
设置所述主损失函数和所述辅助损失函数的加权和为最终的损失函数；
利用所述最终的损失函数训练所述初始模型得到开放场景中多场景识别模型。

5.如权利要求3所述的开放场景中多场景识别模型生成方法，其特征在于，所述利用所述主损失函数和所述辅助损失函数训练所述初始模型得到开放场景中多场景识别模型之前还包括：
采用动量的随机梯度下降法和反向传播算法优化所述初始模型。

6.一种开放场景中多场景识别方法，其特征在于，所述开放场景中多场景识别方法包括：
获取开放场景中的待识别场景的目标图片；
将所述目标图片输入至开放场景中多场景识别模型进行分类，以得到多场景中对应的场景类别识别的结果；
所述开放场景中多场景识别模型使用如权利要求1至5任一项所述的开放场景中多场景识别模型的生成方法生成。

7.一种开放场景中多场景识别模型生成系统，其特征在于，所述开放场景中多场景识别模型生成系统包括模型建立模块、标注模块和训练模块；
所述模型建立模块用于在残差网络中的conv3_x层、conv4_...

【专利技术属性】
技术研发人员：杨凯，罗超，胡泓，李巍，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人