System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机视觉,尤其涉及一种图像多标签分类方法、装置、设备及存储介质。
技术介绍
1、图像多标签分类问题是计算机视觉领域中的重点问题之一。其主要目标在于利用图像的语义信息对不同类别的图像进行多标签的准确区分,从而实现最小化的分类误差。任务要求是,为给定的目标图像分配一个或多个适当的标签;算法或者模型的输入为一张图像,而其输出则为该图像对应的多个类别标签。
2、现有的图像多标签分类相对于单标签分类难度更大,所以精确度较低;而且基于深度学习的图像多标签分类技术中的网络参数和特征通道冗余较大,导致中间特征层易失效,难以发挥特征层和网络参数的效用;此外,神经网络通过增加卷积层提高感受野的方式会增加模型复杂度,导致较大的计算量,需要较长的计算时间,从而降低预测效率。
技术实现思路
1、本申请提供了一种图像多标签分类方法、装置、设备及存储介质,用于解决现有用于图像多标签分类的神经网络存在较大的冗余信息,计算量大,致使模型效率较差且精确度较低的技术问题。
2、有鉴于此,本申请第一方面提供了一种图像多标签分类方法,包括:
3、将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层;
4、在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量;
6、优选地,所述将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
7、基于mobilenetv2的倒置瓶颈残差块构建基础efficientnet-b0网络;
8、在所述基础efficientnet-b0网络的多个深度网络层中添加非局部注意力响应机制层,生成预设注意力efficientnet-b0网络。
9、优选地,所述将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
10、通过预设训练数据集对预设注意力efficientnet-b0网络进行优化预训练,得到优化模型参数。
11、优选地,所述在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量,包括:
12、在反向传播之前,通过奇异值分解算法对逐点卷积层和全连接层的初始参数矩阵进行奇异值分解,得到分解矩阵;
13、基于所述分解矩阵进行强制化正交计算,得到权重参数矩阵;
14、通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量。
15、本申请第二方面提供了一种图像多标签分类装置,包括:
16、图像输入单元,用于将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层;
17、卷积优化单元,用于在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量;
18、分类预测单元,用于通过所述预设注意力efficientnet-b0网络的输出层对所述目标特征向量进行预测分析,得到多分类结果,所述多分类结果包括多个预测标签。
19、优选地,还包括:
20、模型构建单元,用于基于mobilenetv2的倒置瓶颈残差块构建基础efficientnet-b0网络;
21、全局优化单元,用于在所述基础efficientnet-b0网络的多个深度网络层中添加非局部注意力响应机制层,生成预设注意力efficientnet-b0网络。
22、优选地,还包括:
23、预训练单元,用于通过预设训练数据集对预设注意力efficientnet-b0网络进行优化预训练,得到优化模型参数。
24、优选地,所述卷积优化单元,具体用于:
25、在反向传播之前,通过奇异值分解算法对逐点卷积层和全连接层的初始参数矩阵进行奇异值分解,得到分解矩阵;
26、基于所述分解矩阵进行强制化正交计算,得到权重参数矩阵;
27、通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量。
28、本申请第三方面提供了一种图像多标签分类设备,所述设备包括处理器以及存储器;
29、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
30、所述处理器用于根据所述程序代码中的指令执行第一方面所述的图像多标签分类方法。
31、本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的图像多标签分类方法。
32、从以上技术方案可以看出,本申请实施例具有以下优点:
33、本申请中,提供了一种图像多标签分类方法,包括:将目标图像输入预设注意力efficientnet-b0网络中,预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层;在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点卷积层和全连接层根据权重参数矩阵对输入的目标图像进行特征提取操作,得到目标特征向量;通过预设注意力efficientnet-b0网络的输出层对目标特征向量进行预测分析,得到多分类结果,多分类结果包括多个预测标签。
34、本申请提供的图像多标签分类方法,通过非局部注意力响应机制在efficientnet-b0网络架构中构建全局感受野网络层,不需要增设额外的卷积层就能达到扩充感受野的目的,可以在一定程度上降低模型复杂度,减小计算量;而且,通过强制正交化对模型参数矩阵进行优化处理,可以确保输出特征之间无线性相关,降低了特征通道的冗余量,不仅提升了特征层的高效性,还可以提高预测结果的准确性;此外,正则化操作使参数受到正则化约束,还可以减少模型训练的过拟合。因此,本申请能够解决现有用于图像多标签分类的神经网络存在较大的冗余信息,计算量大,致使模型效率较差且精确度较低的技术问题。
本文档来自技高网...【技术保护点】
1.一种图像多标签分类方法,其特征在于,包括:
2.根据权利要求1所述的图像多标签分类方法,其特征在于,所述将目标图像输入预设注意力EfficientNet-B0网络中,所述预设注意力EfficientNet-B0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
3.根据权利要求1所述的图像多标签分类方法,其特征在于,所述将目标图像输入预设注意力EfficientNet-B0网络中,所述预设注意力EfficientNet-B0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
4.根据权利要求1所述的图像多标签分类方法,其特征在于,所述在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点卷积层和全连接层根据所述权重参数矩阵对输入的所述目标图像进行特征提取操作,得到目标特征向量,包括:
5.一种图像多标签分类装置,其特征在于,包括:
6.根据权利要求5所述的图像多标签分类装置,其特征在于,还包括:
7.根据权利要求5所述的图像多标签分类装置,其特征在于,还包括:
8.根
9.一种图像多标签分类设备,其特征在于,所述设备包括处理器以及存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的图像多标签分类方法。
...【技术特征摘要】
1.一种图像多标签分类方法,其特征在于,包括:
2.根据权利要求1所述的图像多标签分类方法,其特征在于,所述将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
3.根据权利要求1所述的图像多标签分类方法,其特征在于,所述将目标图像输入预设注意力efficientnet-b0网络中,所述预设注意力efficientnet-b0网络基于非局部注意力响应机制构建全局感受野网络层,之前还包括:
4.根据权利要求1所述的图像多标签分类方法,其特征在于,所述在反向传播之前进行强制正交化得到权重参数矩阵后,通过逐点...
【专利技术属性】
技术研发人员:天尧,张力文,谢志强,金子杰,
申请(专利权)人:天翼数字生活科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。