图像多标签分类方法、装置、设备及介质制造方法及图纸

技术编号：24093890 阅读：17 留言：0更新日期：2020-05-09 09:21

本发明专利技术公开了一种图像多标签分类方法，涉及图像分类技术领域，用于解决现有图像单标签分类不准确的问题，该方法包括以下步骤：接收图像及所述图像的标注数据，将预处理后的所述图像及所述图像的标注数据按预设比例分成训练集及测试集；将所述训练集输入预设卷积神经网络模型进行训练；将图像特征数据输入Attention机制模型进行标签相关性学习，得到初始模型；通过所述测试集对所述初始模型进行校正测试，输出多标签分类模型。本发明专利技术还公开了一种图像多标签分类装置、电子设备和计算机存储介质。本发明专利技术通过卷积神经网络加Attention机制进行图像标签分类学习，进而获得一个可识别图像多标签的模型。

Image multi label classification method, device, equipment and media

全部详细技术资料下载

【技术实现步骤摘要】
图像多标签分类方法、装置、设备及介质
本专利技术涉及图像分类
，尤其涉及一种图像多标签分类方法、装置、设备及介质。
技术介绍
图像分类技术是当前应用最为广泛的人工智能技术之一，图像分类指的是从给定的分类集合中为图像分配标签的过程，这些标签通常是来自预先定义好的指定类别集。目前的图像分类技术主要是单标签图像分类技术，即对一个图像只分配一个标签，单标签图像分类技术已是成熟的现有技术；但是在很多时候，单标签并不能充分表达图像中所包含的具体内容，例如，一张图像中有爆炸和军装，常用的内容审核图像单标签分类是看爆炸和军装哪个类别标签在图片中占比较大，就给这张图像分配哪个标签，但得到图像中既有爆炸标签又有军装标签的结果才更能充分表达图像内容。因此，亟需一种可以为图像匹配多标签的方法。
技术实现思路
为了克服现有技术的不足，本专利技术的目的之一在于提供一种图像多标签分类方法，其通过卷积神经网络提取标签的图像特征，并通过Attention机制模型得到各标签之间的相关性，进而得到一个高准确度的图像多标签分类模型。本专利技术的目的之一采用以下技术方案实现：一种图像多标签分类方法，包括以下步骤：接收图像及所述图像的标注数据，并对所述图像进行预处理，将预处理后的所述图像及所述图像的标注数据按预设比例分成训练集及测试集；将所述训练集输入预设卷积神经网络模型进行训练，得到图像特征数据；将所述图像特征数据及所述预设卷积神经网络模型的中间计算参数，输入Attention机制模型...

【技术保护点】
1.一种图像多标签分类方法，其特征在于，包括以下步骤：/n接收图像及所述图像的标注数据，并对所述图像进行预处理，将预处理后的所述图像及所述图像的标注数据按预设比例分成训练集及测试集；/n将所述训练集输入预设卷积神经网络模型进行训练，得到图像特征数据；/n将所述图像特征数据及所述预设卷积神经网络模型的中间计算参数，输入Attention机制模型进行标签相关性学习，得到初始模型；/n通过所述测试集对所述初始模型进行校正测试，将满足评价指标的所述初始模型作为多标签分类模型输出。/n

【技术特征摘要】
1.一种图像多标签分类方法，其特征在于，包括以下步骤：
接收图像及所述图像的标注数据，并对所述图像进行预处理，将预处理后的所述图像及所述图像的标注数据按预设比例分成训练集及测试集；
将所述训练集输入预设卷积神经网络模型进行训练，得到图像特征数据；
将所述图像特征数据及所述预设卷积神经网络模型的中间计算参数，输入Attention机制模型进行标签相关性学习，得到初始模型；
通过所述测试集对所述初始模型进行校正测试，将满足评价指标的所述初始模型作为多标签分类模型输出。

2.如权利要求1所述的图像多标签分类方法，其特征在于，所述预处理包括图像均衡化、图像翻转、仿射变换、图像增强、图像格式转换、数据去重中的一种或多种。

3.如权利要求1所述的图像多标签分类方法，其特征在于，所述预设卷积神经网络模型为DenseNet模型。

4.如权利要求1所述的图像多标签分类方法，其特征在于，所述图像为同一标签集合下的图像。

5.如权利要求1所述的图像多标签分类方法，其特征在于，通过所述测试集对所述初始模型进行校正测试，还包括以下步骤：
构建损失函数，通过随机梯度下降法优化所述初始模型；
通过测试集对优化后的所述初始模型进行测试；
当优化后的所述初始模型达到或超过评价指标...

【专利技术属性】
技术研发人员：包月青，黄小刚，李宏宇，李晓林，
申请(专利权)人：同盾控股有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人