An image clustering algorithm based on deep semantic embedding of the present invention includes the following steps: step 1: divide image data set into training set and test set, and obtain their respective data feature space; step 2: find the mapping function of image data from the data feature space of training set obtained in step 1 to the semantic space of training set, and get the language of test set by mapping function. Step 3: Take the result of step 2 as the input layer and reduce the dimension by self-coding to get the low-dimensional embedding space with semantic information and original features; Step 4: Cluster in the low-dimensional embedding space with semantic information and original features obtained from step 4 by using KL divergence function, and if the KL divergence function converges, it will end; otherwise return. Step 3, and update the input layer of step 3. The method effectively improves the discriminability of data features and improves the clustering effect.
【技术实现步骤摘要】
一种基于深度语义嵌入的图像聚类算法
本专利技术属于图像聚类与深度学习
,具体涉及一种基于深度语义嵌入的图像聚类算法。
技术介绍
在机器学习和计算机视觉领域,高维图像聚类是一个巨大的挑战。传统的聚类算法主要是聚焦于距离函数的优化以及分组算法的研究,这类算法包括k-means算法,高斯混合模型以及光谱聚类等。然而这些算法受限于线性嵌入很难去处理更复杂的高维数据的聚类任务。因此,为了解决更复杂的高维数据的聚类问题,融合了降维的聚类算法应运而生。不同于上述传统的聚类算法,深度聚类算法通过学习更典型的数据特征从而可以获得更可观的聚类结果。现有的深度聚类算法分为两种方法:第一种方法是更注重于特征提取,特征提取即为通过降维算法获得更典型更低维的特征表达,在此基础上再利用传统的聚类算法来进行聚类,该方法取得了一定的聚类效果。第二种方法是集中于特征提取与聚类的结合操作,这种做法既提取了典型的特征表达又对聚类算法进行了一定的改进,使得特征提取与聚类更加的兼容,获得了更好地聚类效果。在使用第二种方法时,提出了一种重要的降维算法即自编码算法。相比于传统的降维算法,自编码有多种形式,例如传统自编码,稀疏自编码,降噪自编码等。这些不同的自编码其实就是原始数据的重构过程,通过使重构函数最小化来提取最典型的数据低维特征表达。自编码一般都包含三层网络结构,分别为输入层,输出层,以及隐藏层。我们可以通过增加隐藏层的层数来改变自编码网络的内部结构,从而获得高维数据更复杂的特征关系。然而,即使自编码是通过分析高维数据复杂的特征关系来进行降维,对高维图像数据而言,也避免不了会丢失一些有识别力 ...
【技术保护点】
1.一种基于深度语义嵌入的图像聚类算法,其特征在于,包括:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间;步骤2:求得图像数据从步骤1得到的训练集的数据特征空间到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间作为升维的输入层,然后通过自编码对升维的输入层进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。
【技术特征摘要】
1.一种基于深度语义嵌入的图像聚类算法,其特征在于,包括:步骤1:将图像数据集分为训练集和测试集,并分别提取训练集和测试集的特征作为各自的数据特征空间;步骤2:求得图像数据从步骤1得到的训练集的数据特征空间到训练集的语义空间的映射函数,通过映射函数得到测试集的语义空间;步骤3:对步骤2得到的测试集的语义空间及步骤1提取到的测试集的数据特征空间进行深度语义嵌入联合,并将联合后的测试集的语义空间和测数据特征空间作为升维的输入层,然后通过自编码对升维的输入层进行融合降维,得到低维的带有语义信息和原始特征的嵌入空间;步骤4:利用KL散度函数,在步骤3得到的降维后的带有语义信息和原始特征的嵌入空间内进行聚类,如果KL散度函数收敛,则结束;否则返回步骤3,并更新步骤3的输入层。2.如权利要求1所述的基于深度语义嵌入的图像聚类算法,其特征在于,步骤1包括如下子步骤:步骤1.1:将带视觉属性的图像数据集分为训练集和测试集,且训练集和测试集的类别无交集,视觉属性相关联;步骤1.2:采用卷积神经网络GooleNet分别提取训练集和测试集的特征,并将得到的训练集和测试集的特征分别作为各自的数据特征空间。3.如权利要求1所述的基于深度语义嵌入的图像聚类算法,其特征在于,步骤2包括如下子步骤:步骤2.1:通过公式1构建数据从数据特征空间映射到语义空间的模型,对公式1利用Sylvester函数求得映射函数W:其中,X表示训练集的数据特征空间,S表示训练集的语义空间,W表示数据从特征空间映射到语义空间的映射函数,WT表示数据从语义空...
【专利技术属性】
技术研发人员:郭军,袁璇,许鹏飞,柏浩,刘宝英,陈锋,
申请(专利权)人:西北大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。