当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于深度语义嵌入的图像聚类算法制造技术

技术编号:20546638 阅读:26 留言:0更新日期:2019-03-09 19:32
本发明专利技术的一种基于深度语义嵌入的图像聚类算法,包括如下步骤:步骤1:将图像数据集分为训练集和测试集,并获得各自的数据特征空间;步骤2:求图像数据从步骤1得到的训练集的数据特征空间映射到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的结果作为输入层,通过自编码进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤4得到的低维的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。本发明专利技术有效改善了数据特征的可判别性,提高了聚类效果。

An Image Clustering Algorithm Based on Deep Semantic Embedding

An image clustering algorithm based on deep semantic embedding of the present invention includes the following steps: step 1: divide image data set into training set and test set, and obtain their respective data feature space; step 2: find the mapping function of image data from the data feature space of training set obtained in step 1 to the semantic space of training set, and get the language of test set by mapping function. Step 3: Take the result of step 2 as the input layer and reduce the dimension by self-coding to get the low-dimensional embedding space with semantic information and original features; Step 4: Cluster in the low-dimensional embedding space with semantic information and original features obtained from step 4 by using KL divergence function, and if the KL divergence function converges, it will end; otherwise return. Step 3, and update the input layer of step 3. The method effectively improves the discriminability of data features and improves the clustering effect.

【技术实现步骤摘要】
一种基于深度语义嵌入的图像聚类算法
本专利技术属于图像聚类与深度学习
,具体涉及一种基于深度语义嵌入的图像聚类算法。
技术介绍
在机器学习和计算机视觉领域,高维图像聚类是一个巨大的挑战。传统的聚类算法主要是聚焦于距离函数的优化以及分组算法的研究,这类算法包括k-means算法,高斯混合模型以及光谱聚类等。然而这些算法受限于线性嵌入很难去处理更复杂的高维数据的聚类任务。因此,为了解决更复杂的高维数据的聚类问题,融合了降维的聚类算法应运而生。不同于上述传统的聚类算法,深度聚类算法通过学习更典型的数据特征从而可以获得更可观的聚类结果。现有的深度聚类算法分为两种方法:第一种方法是更注重于特征提取,特征提取即为通过降维算法获得更典型更低维的特征表达,在此基础上再利用传统的聚类算法来进行聚类,该方法取得了一定的聚类效果。第二种方法是集中于特征提取与聚类的结合操作,这种做法既提取了典型的特征表达又对聚类算法进行了一定的改进,使得特征提取与聚类更加的兼容,获得了更好地聚类效果。在使用第二种方法时,提出了一种重要的降维算法即自编码算法。相比于传统的降维算法,自编码有多种形式,例如传统自编码,稀疏自编码,降噪自编码等。这些不同的自编码其实就是原始数据的重构过程,通过使重构函数最小化来提取最典型的数据低维特征表达。自编码一般都包含三层网络结构,分别为输入层,输出层,以及隐藏层。我们可以通过增加隐藏层的层数来改变自编码网络的内部结构,从而获得高维数据更复杂的特征关系。然而,即使自编码是通过分析高维数据复杂的特征关系来进行降维,对高维图像数据而言,也避免不了会丢失一些有识别力的信息。因此弥补缺失的有用信息,成为了聚类算法亟待解决的问题。
技术实现思路
针对现有技术中存在的问题,一种基于深度语义嵌入的图像聚类算法,包括:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间;步骤2:求得图像数据从步骤1得到的训练集的数据特征空间映射到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间作为升维的输入层,然后通过自编码对升维的输入层进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。进一步的,步骤1包括如下子步骤:步骤1.1:将带视觉属性的图像数据集分为训练集和测试集,且训练集和测试集的类别无交集,视觉属性相关联;步骤1.2:采用卷积神经网络GooleNet分别提取训练集和测试集的特征,并将得到的训练集和测试集的特征分别作为各自的数据特征空间。进一步的,步骤2包括如下子步骤:步骤2.1:通过公式1构建数据从数据特征空间映射到语义空间的模型,对公式1利用Sylvester函数求得映射函数W:其中,X表示训练集的数据特征空间,S表示训练集的语义空间,W表示数据从特征空间映射到语义空间的映射函数,WT表示数据从语义空间映射到原始特征空间的映射函数,δ表示权重系数取值为50000,F表示求矩阵的范式;步骤2.2:利用步骤2.1得到的映射函数W通过公式2,得到测试集的语义空间:Su=WU(公式2)其中,U是数据测试集,Su是测试集的语义空间。进一步的,步骤3包括如下子步骤:步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间T作为升维的输入层,然后通过由多层去噪自编码器组成的堆叠编码器对升维的输入层进行降维,最终得到低维语义嵌入特征层Z。进一步的,步骤4包括如下子步骤:步骤4.1:在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内,利用公式3所示的KL散度函数进行聚类:式中,P表示软分配,Q表示辅助目标分配,zi表示语义嵌入点,μj表示聚类中心点,L表示收敛函数符号;i表示第i个样本,取值范围为:1至测试集的总样本个数,j表示第j类别,取值范围为:1至测试集的总类别数;pij表示第i个样本分配到第j类的概率,qij表示第i个样本分配到第j类的辅助目标概率。步骤4.2:通过随机梯度下降算法进行迭代,如果KL散度函数收敛,则结束迭代;否则每次迭代后先通过公式4更新语义嵌入点zi和聚类中心点μj,然后将更新后的zi带入步骤3的输入层中返回执行步骤3;所述的随机梯度下降算法中的更新公式为:式中:λ表示学习率,取值为0.1。本专利技术提供的技术方案带来的有益效果是:提出了一种基于深度神经网络的自编码方法来进行原始特征与语义信息的提取和嵌入,从而得到一个低维的带有语义信息和原始特征的嵌入空间。最后在更低维的嵌入语义信息的特征空间完成图像的聚类任务,有效改善了数据特征的可判别性,提高了聚类效果。附图说明图1为本专利技术方法的流程图;图2为提取语义特征的结构图;图3为深度语义嵌入的堆叠自编码;图4为AWA数据集的聚类accuracy结果;图5为CUB数据集的聚类accuracy结果;图6为SUN数据集的聚类accuracy结果;图7为AWA数据集的聚类NMI结果;图8为CUB数据集的聚类NMI结果;图9为SUN数据集的聚类NMI结果。具体实施方式首先介绍三种带属性的图像数据集AwA、SUN和CUB:动物视觉属性数据集(AWA):它是从各大图片网站收集了50类动物图片,共30475张。其中40类的所有样本作为训练数据,总共24295个样例,其他10类样本作为测试数据,共6180个样本。同时,数据集定义了85个属性,并为每个训练样例提供了利用先验知识定义的属性值。CUB数据集:加利福尼亚理工学院鸟类数据库,这个数据库总共包含11788个样例,分为200个类别。根据实验需要,选取175类的样本作为训练数据,其余25类的样本作为测试数据使用。同时这个数据集包含312个属性,同样每个训练样例提供了人工定义的属性值。SUN数据集:SUN数据集主要是在SUN类别数据库的基础上创建的,样本总共有14340个,共有类别717类,一般研究者们选择645/72,和707/10两种分片方式来分训练数据和测试数据的类别。本实验选择707个类别作为训练数据,其余10类作为测试数据。这个数据及包含102个属性,同样每个训练样例提供了人工定义的属性值。以下给出本专利技术的具体实施方式,需要说明的是本专利技术并不局限于以下具体实施例,凡在本申请技术方案基础上做的等同变换均落入本专利技术的保护范围。一种基于深度语义嵌入的图像聚类方法,包括以下步骤:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间,包括如下子步骤:步骤1.1:将带视觉属性的图像数据集分为训练集和测试集,且训练集和测试集的类别无交集,视觉属性相关联;步骤1.2:采用卷积神经网络GooleNet分别提取训练集和测试集的特征,并将得到的训练集和测试集的特征分别作为各自的数据特征空间;具体的,步骤1.2中每个训练集或测试集提取出1024维特征。该步骤优点:本方本文档来自技高网
...

【技术保护点】
1.一种基于深度语义嵌入的图像聚类算法,其特征在于,包括:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间;步骤2:求得图像数据从步骤1得到的训练集的数据特征空间到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间作为升维的输入层,然后通过自编码对升维的输入层进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。

【技术特征摘要】
1.一种基于深度语义嵌入的图像聚类算法,其特征在于,包括:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间;步骤2:求得图像数据从步骤1得到的训练集的数据特征空间到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间作为升维的输入层,然后通过自编码对升维的输入层进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。2.如权利要求1所述的基于深度语义嵌入的图像聚类算法,其特征在于,步骤1包括如下子步骤:步骤1.1:将带视觉属性的图像数据集分为训练集和测试集,且训练集和测试集的类别无交集,视觉属性相关联;步骤1.2:采用卷积神经网络GooleNet分别提取训练集和测试集的特征,并将得到的训练集和测试集的特征分别作为各自的数据特征空间。3.如权利要求1所述的基于深度语义嵌入的图像聚类算法,其特征在于,步骤2包括如下子步骤:步骤2.1:通过公式1构建数据从数据特征空间映射到语义空间的模型,对公式1利用Sylvester函数求得映射函数W:其中,X表示训练集的数据特征空间,S表示训练集的语义空间,W表示数据从特征空间映射到语义空间的映射函数,WT表示数据从语义空...

【专利技术属性】
技术研发人员:郭军袁璇许鹏飞柏浩刘宝英陈锋
申请(专利权)人:西北大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1