【技术实现步骤摘要】
图像标注模型训练和图像标注方法、系统、设备及介质
本专利技术涉及深度学习
,特别涉及一种图像标注模型训练和图像标注方法、系统、设备及介质。
技术介绍
随着信息技术的发展,图像信息迎来爆炸式增长。例如以景点分享、推荐为目的的攻略图库,每天都会新增大量由用户或者景点官方上传的图片,图库中积压了海量的杂乱无章的图片,难以进一步利用。仅凭人工处理无法对如此大量的图像数据进行标注,基于深度学习模型的图像分类算法是目前进行海量图片标注的主要方法。但现有的开源图像分类模型针对的是特定窄邻域的图像,在攻略图库等开放场景下,无法对包括海量的无关图片的图像数据进行准确地识别和标注。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中针对特定窄邻域的图像分类模型无法准确地识别和标注海量包括海量的无关图片的图像数据的缺陷,提供一种图像标注模型训练和图像标注方法、系统、设备及介质。本专利技术是通过下述技术方案来解决上述技术问题:本专利技术提供一种图像标注模型训练方法,所述图像标注模型训练方法包括:< ...
【技术保护点】
1.一种图像标注模型训练方法,其特征在于,所述图像标注模型训练方法包括:/n获取图像数据并构造训练数据集,所述训练数据集包括被预设的分类标签标注的所述图像数据;所述分类标签包括若干不同的目标标签和一个非目标标签;所述非目标标签与所述目标标签的类别不同;/n在残差网络结构包括的卷积层后增加注意力机制模块,以构建图像标注模型,其中,所述注意力机制模块用于对所述卷积层输出的特征图的不同通道和区域进行调整,所述残差网络结构包括依次连接的至少一个卷积层和一个全连接层;/n将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型。/n
【技术特征摘要】
1.一种图像标注模型训练方法,其特征在于,所述图像标注模型训练方法包括:
获取图像数据并构造训练数据集,所述训练数据集包括被预设的分类标签标注的所述图像数据;所述分类标签包括若干不同的目标标签和一个非目标标签;所述非目标标签与所述目标标签的类别不同;
在残差网络结构包括的卷积层后增加注意力机制模块,以构建图像标注模型,其中,所述注意力机制模块用于对所述卷积层输出的特征图的不同通道和区域进行调整,所述残差网络结构包括依次连接的至少一个卷积层和一个全连接层;
将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型。
2.如权利要求1所述的图像标注模型训练方法,其特征在于,所述在残差网络结构包括的卷积层后增加注意力机制模块的步骤包括:
将所述卷积层输出的第一特征图输入到所述注意力机制模块得到注意力权重特征图;
根据所述第一特征图和所述注意力权重特征图确定所述注意力机制模块输出的第二特征图。
3.如权利要求1所述的图像标注模型训练方法,其特征在于,所述残差网络结构包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层;
所述在残差网络结构包括的卷积层后增加注意力机制模块的步骤包括:
在所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层后分别增加一个注意力机制模块。
4.如权利要求1所述的图像标注模型训练方法,其特征在于,所述将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型的步骤包括:
将所述训练数据集输入到所述图像标注模型,得到模型输出结果;
根据所述模型输出结果和平衡因子,利用第一损失函数计算所述图像标注模型的错误损失;
所述平衡因子为所述训练数据集中各所述分类标签标注的样本数与所述训练数据集的样本总数的比例。
5.如权利要求4所述的图像标注模型训练方法,其特征在于,所述将所述训练数据集输入到所述图像标注模型进行训练,得到目标图像标注模型的步骤包括:
根据所述模型输出结果,利用第二损失函数计算所述图像标注模型...
【专利技术属性】
技术研发人员:杨凯,罗超,胡泓,李巍,
申请(专利权)人:携程计算机技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。