【技术实现步骤摘要】
基于离散多视图聚类的图像聚类方法、系统、设备及介质
本公开涉及图像聚类
,特别是涉及基于离散多视图聚类的图像聚类方法、系统、设备及介质。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:随着信息技术的深入发展和应用,大数据时代已经到来。为了更加准确、完整地描述数据信息,多视图数据出现并被广泛应用于不同的研究领域中,如数据挖掘、机器学习、计算机视觉。对于同一事物可以从多种不同的途径或不同的角度对其进行描述,这多种描述构成事物的多个视图,每一个视图都有其特定的物理意义。因此,多视图数据的出现带来了一个新的“多视图学习”研究问题。另外,在现实应用中,我们获得的数据通常是没有标签的,这使得“无监督学习”引起极大的关注。聚类技术是无监督学习任务中研究最多、应用最广的一类任务,也是数据挖掘中最基本的主题之一。多视图聚类研究的关键是有效地探索多视图数据的关系来完成数据聚类,最具有代表性的一个策略是基于图的方法。在图论中,图是表示特征内在关系的重要数据结构。图的每个顶点对应一个数 ...
【技术保护点】
1.基于离散多视图聚类的图像聚类方法,其特征是,包括:获取训练图像数据集;所述训练图像数据集,包括:若干个图像;对每个图像提取若干个视图特征,获得多视图特征训练数据集;对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数;求解基于结构化图的多视图聚类目标函数,得到映射矩阵和连续性聚类标签矩阵;基于连续性聚类标签矩阵构造离散化标签的目标函数,求解离散化标签的目标函数,将连续性标签转换为离散的聚类标签;获取若干个待聚类的图像,对每个待聚类的图像提取若干个视图特征,得到待聚类图像的多视图特征数据集;将待聚类图像的多视图特征数据集输入到映射矩阵中,得到待聚类图像的类别标签。
【技术特征摘要】
1.基于离散多视图聚类的图像聚类方法,其特征是,包括:获取训练图像数据集;所述训练图像数据集,包括:若干个图像;对每个图像提取若干个视图特征,获得多视图特征训练数据集;对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数;求解基于结构化图的多视图聚类目标函数,得到映射矩阵和连续性聚类标签矩阵;基于连续性聚类标签矩阵构造离散化标签的目标函数,求解离散化标签的目标函数,将连续性标签转换为离散的聚类标签;获取若干个待聚类的图像,对每个待聚类的图像提取若干个视图特征,得到待聚类图像的多视图特征数据集;将待聚类图像的多视图特征数据集输入到映射矩阵中,得到待聚类图像的类别标签。2.如权利要求1所述的方法,其特征是,对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数,具体步骤包括:对每个视图特征,通过高斯核函数预先创建一个样本相似度图;基于样本相似度图构建基于结构化图的多视图聚类目标函数,期望学习到一个结构化的图,使得结构化的图与预先创建的样本相似度图相似度最高。3.如权利要求1所述的方法,其特征是,所述基于结构化图的多视图聚类目标函数为:其中,S∈Rn×n是学习的结构化图,sij是S的第i行第j列的元素,是第v个视图特征的相似度图,LS=DS-(ST+S)/2是结构化图的拉普拉斯矩阵,度矩阵DS∈Rn×n被定义为一个第i个元素为∑j(sij+sji)/2的对角矩阵,是训练图像数据集中第v个视图的特征矩阵;n是样本总数量,c是聚类个数;是第v个视图特征的映射矩阵,P=[P1,P2,...,PV]为多个视图映射矩阵的集合;F∈Rn×c是一个连续性的标签矩阵,FT表示F的转置矩阵,Ic∈Rc×c是单位矩阵;β>0,μ>0,β和μ是平衡参数,用来平衡目标函数的多个子项,λ是正则化参数;FTF=Ic是对F的正交化约束,rank()表示矩阵的秩运算;第v个视图特征的相似度图:其中,样本的近邻关系通过K近邻算法KNN衡量;v=[1,2,...,V],v是视图索引,V是视图个数;是第v个视图特征的相似度图,为第v个视图中的第i个样本;i=[1,2,...,n],n是样本总数量,为第v个视图中的第j个样本;j=[1,2,...,n];exp()表示以e为底的指数函数,表示样本之间的欧式距离;σ是一个自由参数,σ是函数的带宽参数,σ用于控制近邻数量。4.如权利要求1所述的方法,其特征是,所述对于多视图特征训练数据集,构造基于结构化图的多视图聚类目标函数包括:S21:对于多视图特征训练数据集X=[X1,...,XV]∈Rn×D,v=[1,2,...,V],D为数据集中总的特征维度,Av∈Rn×n是V个视图特征对应的相似度图,其中,1≤v≤V,针对每个视图特征创建对应的相似度图,并将基于相似度图来学习适用于数据聚类的结构化图S,目标是学习结构化图S,并且使该结构化图与预创建的多个视图的样本相似度图保持一致性;因此,通过最小化每个视图的重建误差的线性组合来实现结构化图的创建;对多个相似度图加权并进行线性拼接,另外对结构化图S的学习施加一个秩约束,实现结构化图S的学习;多视图数据的相似度关系表示定义为:其中,αv=1/(2||S-Av||F),v=[1,2,...,V]是学习结构化图时第v个视图的权重;是第v个视图特征的相似度图,n是样本总数量,c是聚类个数;秩约束rank(LS)=n-c使得学习到的结构化图S具有c个连通分量;S22:依据谱聚类算法,通过图嵌入的方法来实现在聚类过程中保留数据的流行结构,该过程表示为:minTr(FTLSF),s.t.F∈Rn×c,FTF=Ic(4)其中,Tr(·)表示求矩阵的迹的运算;LS=DS-(ST+S)/2是结构化图的拉普拉斯矩阵,度矩阵DS∈Rn×n被定义为一个第i个元素为∑j(sij+sji)/2的对角矩阵,Ic∈Rc×c为单位矩阵,F∈Rn×c是连续性的标签矩阵,FTF=Ic是对F的正交化约束;S23:针对每一个视图特征学习一个映射矩阵,并不同的视图特征施加权重;映射矩阵的学习,通过该映射矩阵的学习解决样本外的数据聚类问题:其中,ωv=1/(2||XvPv-F||F)是学习映射矩阵时V个视图分别对应的权重,v=[1,2,...,V],为正则化项,防止过拟合,λ为正则化参数,防止P出现极端解;为Frobenius范数,简称F范数;S24:综合步骤S21到步骤S24得到基于结构化图的多视图聚类目标函...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。