基于语义关系图的图像分类方法技术

技术编号：34485572 阅读：22 留言：0更新日期：2022-08-10 09:03

本发明专利技术公开的基于语义关系图的图像分类方法，具体为：1)准备图像训练样本集，并根据图像训练样本集构建语义关系图；2)根据图像训练样本集和语义关系图，搭建基于语义关系图的图像分类方法的网络模型；3)构造语义相关性目标函数；4)构造局部几何结构一致性目标函数；5)根据语义相关性目标函数和局部几何结构一致性目标函数，构造总的目标函数；6)根据步骤5)构造的总的目标函数在训练样本集上训练步骤2)所搭建的网络模型；7)将待分类的图像输入到步骤6)训练好的网络模型，在分类层得到该图像的预测类别。该方法能够学习出更具有语义相关性的图像特征向量，且能够显著提高图像分类精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义关系图的图像分类方法

[0001]本专利技术属于计算机视觉图像分类
，具体涉及一种基于语义关系图的图像分类方法。

技术介绍

[0002]图像分类是指给定一张输入图像，根据图像中所包含的内容将其划分到合适的类别。传统的图像分类方法包括图像特征提取和分类器判别两个阶段。深度卷积神经网络能够从原始图像端到端地学习到适合分类任务的特征向量和分类器。目前最好的图像分类方法都是基于深度卷积神经网络的。尽管深度卷积神经网络在几乎所有图像分类数据集上都取得了目前最好的分类精度，但在具体的实际应用中，分类精度还达不到人们的期望。
[0003]目前大部分提高图像分类精度的方法是通过增加网络模型复杂度或增加有标注训练样本数量来实现的。增加网络模型复杂度将耗费更多的计算资源，影响这些方法在轻型设备及移动终端的使用；对大量训练样本进行人工标注需要耗费大量的人力物力和财力，而且往往还需要相关专业知识。这些通过大模型驱动和大数据驱动的图像分类方法限制了它们的实际应用范围。
[0004]终上所述，如何在不增加网络模型复杂度和有标注训练样本的前提下，提高图像分类精度具有重要的研究意义。

技术实现思路

[0005]本专利技术的目的是提供一种基于语义关系图的图像分类方法，该方法不依赖于深度卷积神经网络结构，能够学习出类别标签的隐语义信息的向量表示，能够学习出更具有语义相关性的图像特征向量，且能够显著提高图像分类精度。
[0006]本专利技术所采用的技术方案是，基于语义关系图的图像分类方法，包括以下步骤...

【技术保护点】

【技术特征摘要】
1.基于语义关系图的图像分类方法，其特征在于，包括以下步骤：1)准备图像训练样本集，并根据图像训练样本集构建语义关系图；2)根据图像训练样本集和语义关系图，搭建基于语义关系图的图像分类方法的网络模型；3)构造语义相关性目标函数；4)构造局部几何结构一致性目标函数；5)根据语义相关性目标函数和局部几何结构一致性目标函数，构造总的目标函数；6)根据步骤5)构造的总的目标函数在训练样本集上训练步骤2)所搭建的网络模型；7)将待分类的图像输入到步骤6)训练好的网络模型，在分类层得到该图像的预测类别。2.根据权利要求1所述的基于语义关系图的图像分类方法，其特征在于，步骤1)的具体实现方法如下：步骤1.1、假定为图像训练样本集，X
i
表示第i个训练样本图像，c
i
∈{l1,l2,
…
,l
C
}表示训练样本图像X
i
的类别标签，{l1,l2,
…
,l
C
}表示图像训练样本集的类别标签集合，l
j
表示训练样本集的第j个类别标签，j＝1,2,
…
,C，C表示训练样本集类别标签的个数，N表示训练样本的总数；步骤1.2、构建语义关系图：构建一个无向图其中是顶点集，是边集，A＝(a
ij
)
C
×
C
是邻接矩阵，a
ij
表示类别标签l
i
与l
j
之间的相似度，其中，w
i
和w
j
分别表示类别标签l
i
和l
j
的词嵌入向量，exp(
·
)表示指数函数，||
·
||表示向量的模长，参数η大于零。3.根据权利要求2...

【专利技术属性】
技术研发人员：石伟伟，张璐鑫，黑新宏，谢国，王晓帆，费蓉，鲁晓锋，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人