一种基于非负字典对学习的鲁棒多视角聚类方法技术

技术编号:14310911 阅读:55 留言:0更新日期:2016-12-27 18:18
本发明专利技术公开一种基于非负字典对学习的鲁棒多视角聚类方法,通过提取包含若干子空间的数据集不同视角下的特征;然后将特征学习嵌入字典学习,联合学习语义投影矩阵和非负特征投影;加入一致性约束和局部几何保持约束学习多视角所共享的公共聚类标签,在多个约束下学习各视角的语义投影矩阵、参数表示矩阵及多视角共享的语义投影矩阵,完成多视角聚类。该方法可以挖掘出多视角所共享的公共语义标签,并且加入一致性约束,减少单独的聚类标签与公共语义标签之间的差异性,同时加入局部几何保持约束,使得具有相似结构的数据更大概率分到相同的类。

【技术实现步骤摘要】

本专利技术涉及模式识别
,尤其是一种基于非负字典对学习的鲁棒多视角聚类方法
技术介绍
在现实中,很多数据都有多个模态,例如,文章可以被翻译成多种语言、新闻可以从多个视角报道、图片可以由多种描述子描述。一般而言,多视角数据可以提供互补和兼容的信息。多视角聚类是一种无监督的多视角学习方法,已经引起了人们的关注。过去的工作主要分为两类:基于回归的方法和基于子空间的方法。虽然这些方法都取得了显著的提高,但是它们是有局限性的。因为这些方法都假设所给的特征是无噪声的,这些数据可以揭示潜在的聚类结构。但不幸的是,现实生活中的特征常常是冗余的且含有噪声,这极大地降低了上述方法的性能。因此亟需一种高效鲁棒的多视角聚类方法。
技术实现思路
鉴于以往方法不能有效的满足鲁棒多视角聚类的需要,本专利技术提出了一种基于非负字典对学习的鲁棒多视角聚类方法。该方法用特征投影学习聚类标签,使用语义投影探索潜在语义信息,同时加入一致性约束和局部几何保持约束以生成一个多视角共享的公共聚类标签,从而实现多视角聚类。本专利技术是这样实现的,一种基于非负字典对学习的鲁棒多视角聚类方法,包括以下步骤:S1,提取多模态数据库中的多模态特征;S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;S3,向所述多模态数据库嵌入非负特征投影以处理噪声特征;S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性;S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,得到统一的目标函数;S7,求解所述目标函数得到公共语义标签,根据所述公共语义标签,得到公共的聚类结果,完成多视角聚类。本专利技术方法假设数据是冗余的且有噪声,通过学习非负特征投影处理噪声特征,利用一致性约束最小化单独聚类标签与共享标签之间的差异,利用局部几何保持约束保持数据的局部一致性,使得相似数据具有较大概率,具有相同的语义标签;同时考虑特征投影、一致性约束和局部几何保持约束,将其纳入到统一的子空间聚类框架,采用近端交替线性最小化算法优化目标函数,得到公共语义标签,完成多视角聚类。根据本专利技术的方法,可挖掘出多视角所共享的公共语义标签,并且加入一致性约束,减少单独的聚类标签与公共语义标签之间的差异性,同时加入局部几何保持约束,使得具有相似结构的数据更大概率分到相同的类。附图说明图1是基于非负字典对学习的鲁棒多视角聚类方法流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。如图1所示,本专利技术的基于非负字典对学习的鲁棒多视角聚类方法包括以下步骤:步骤S1,提取包含若干子空间的多模态数据库中的多模态特征;多模态数据即同一数据有不同的表现形式,如视频数据可由音频和图像流组成,图片数据可由图像本身视觉信息和标记单词信息组成。对不同模态的数据分别提取特征,如提取图片视觉信息的GIST特征,标记单词的词频特征等。多模态特征是包括含有图片和标记单词一一对应的图像标记对。步骤S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;在该步骤中,采用字典学习方法来学习多模态数据库中的特征向量的语义投影矩阵和参数表示矩阵。语义投影矩阵是探索模态特征的语义信息,在字典学习中是字典;参数表示矩阵是模态特征在所学字典上的表达。所述字典学习的目标函数为: min U , V || X - U V || F 2 + Ω { U , V本文档来自技高网...

【技术保护点】
一种基于非负字典对学习的鲁棒多视角聚类方法,包括步骤:S1,提取多模态数据库中的多模态特征;S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;S3,向所述多模态数据库嵌入非负特征投影以处理噪声特征;S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性;S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,得到统一的目标函数;S7,采用近端交替线性最小化算法求解优化所述目标函数,得到公共语义标签,根据所述公共语义标签,得到公共的聚类结果,完成多视角聚类。

【技术特征摘要】
1.一种基于非负字典对学习的鲁棒多视角聚类方法,包括步骤:S1,提取多模态数据库中的多模态特征;S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;S3,向所述多模态数据库嵌入非负特征投影以处理噪声特征;S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性;S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,...

【专利技术属性】
技术研发人员:谭铁牛曹冬赫然孙哲南李志航
申请(专利权)人:天津中科智能识别产业技术研究院有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1