结合多源特征学习和组稀疏约束的无监督物体识别方法技术

技术编号:20944852 阅读:20 留言:0更新日期:2019-04-24 02:32
本发明专利技术公开一种结合多源特征学习和组稀疏约束的无监督物体识别方法,包括如下步骤:步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈R

Unsupervised object recognition based on multi-source feature learning and group sparse constraints

The invention discloses an unsupervised object recognition method combining multi-source feature learning and group sparse constraints, which comprises the following steps: step 1, obtaining V views from a set of images containing C categories to be processed, and composing data sets X=[x1, x2,... Xn], R

【技术实现步骤摘要】
结合多源特征学习和组稀疏约束的无监督物体识别方法
本专利技术属于机器学习
,特别涉及一种结合多源特征学习和组稀疏约束的无监督物体识别方法。
技术介绍
聚类技术旨在将待处理对象划分为多个相似的簇,进而提取数据的抽象语义,是应用非常广泛的一项技术,在图像物体识别领域中获得了巨大的成功。然而,传统图像物体识别领域中的聚类方法还存在以下缺陷:首先,图像数据一般由高维特征组成,这些高维图像数据中往往包含噪声特征,直接对其操作将严重影响聚类效果;其次,这些高维图像数据一般存在大量冗余特征,处理这类数据需要消耗昂贵的计算资源。在多媒体技术高速发展的今天,高维图像数据呈现爆发式增长,给传统聚类方法带来了巨大挑战。最新研究表明,若能有效选择数据最优特征子集,将能有效提高图像识别的准确率。互联网技术的快速增长,扩大了数据收集来源的多样性,也使得数据特征呈现多源化。不同类型数据特征拥有不同的性质,其在图像识别应用中也发挥着不同的作用。为有效处理这些多源高维数据,现有的方法一般借助子空间学习和多视图学习,以获得高维数据在不同视图上的最优特征子空间。然而,这些方法需要借助降维方法定位特征子空间,其所获取的子空间与原始空间存在较大差异,很难满足实际应用中对数据语义理解的需求。另外,为处理多视图数据,这类方法需要单独确定每个视图的最优子空间,当视图数量增加时,其子空间搜索的复杂度将会陡然上升。
技术实现思路
本专利技术的目的,在于提供一种结合多源特征学习和组稀疏约束的无监督物体识别方法,使得聚类方法能够高效利用多源数据特征间的相互关系和共享特征子空间,以提高聚类方法的准确度;利用组稀疏技术约束多源数据的联合特征选择矩阵,对联合特征进行综合排序,进而可快速定位最优特征子集;其还可有效抑制数据集中的噪声干扰,最终为机器学习、计算机视觉相关应用提供有效支持。为了达成上述目的,本专利技术的解决方案是:一种结合多源特征学习和组稀疏约束的无监督物体识别方法,包括如下步骤:步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈Rd×n,其中d代表数据的特征维度,n代表数据集的样本数;步骤2,提取数据集X的总散度矩阵St;步骤3,在步骤2的基础上构建基于线性判别分析的KM聚类模型;步骤4,在步骤3的基础上构建基于组稀疏约束和特征选择的多源数据联合聚类模型;步骤5,求解步骤4得到的多源数据联合聚类模型的目标函数,并进行优化。上述步骤2中,提取数据集的总散度矩阵St的公式是:其中,为数据集样本的总平均值。上述步骤3中,KM聚类模型的目标函数如下:其中,W=[w1,…,wd]T∈Rd×m为特征选择矩阵,m为降维后的特征维度,I为单位矩阵,F=[f1,f2,…,fn]T∈Rn×c为预测标签矩阵,G=[g1,g2,…,gc]∈Rm×c为聚类中心矩阵,||·||2,1代表其l2,1范数且对于任意矩阵M∈Rr×p,上述步骤4中,多源数据联合聚类模型的目标函数如下:其中,W=[w1,…,wd]T∈Rd×m为特征选择矩阵,m为降维后的特征维度,I为单位矩阵,F=[f1,2,…,fn]T∈Rn×c为预测标签矩阵,G=[g1,g2,…,gc]∈Rm×c为聚类中心矩阵,||·||2,1代表其l2,1范数且对于任意矩阵M∈Rr×p,代表G2,1范数,设为第i组视图数据对应的特征选择矩阵,则W表示为且其G2,1范数表示为γ和η是正则化参数,分别用于控制模型中特征稀疏度和视图间的稀疏度。上述步骤5中,求解多源数据联合聚类模型的目标函数的过程是:步骤a1,将目标函数转换为如下形式:其中,E=[e1,e2,…,en]=XTW-FGT,且D,De和均是对角阵,定义如下:步骤a2,设W,De,D,和G已经给定,令Dii代表矩阵D的第i个对角元素,则目标函数转换为:其中,fi表示预测标签矩阵F的第i个列向量;则F通过下式获得,即:其中,gk表示聚类中心矩阵G的第k个列向量,k=1,…,c;Fij表示F中的第i行第j列元素;步骤a3,设F,De,D,已经给定,取转化后目标函数对G的导数,并令求导结果为0,得:G=WTXDeF(FTDeF)-1将所求得的G代入目标函数,目标函数转化为:其中,Sw=XDeXT-XDeF(FTDeF)-1FTDeXT;定义Λ为拉格朗日乘子,继而得拉格朗日函数:将以上拉格朗日函数对W求导,得:则最优解W*通过求解以下矩阵的m个最小特征值获得:上述步骤5中,进行优化的具体过程是:令t代表迭代次数步骤b1,随机初始化特征选择矩阵W,类别中心矩阵G,初始化De,D,为单位矩阵;步骤b2,在低维嵌入数据WTX上应用传统KM方法求解F;步骤b3,更新W为由前m个最小特征值对应特征向量所组成的矩阵;步骤b4,更新G=WTXDeF(FTDeF)-1;步骤b5,更新De,D和步骤b6,重复执行步骤b2-步骤b5,直到收敛,输出类别标签矩阵F和特征选择矩阵W,其中第i个特征的权重由||w1||2确定,而第v个视图的权重由确定。采用上述方案后,本专利技术的有益效果是:本专利技术可有效利用数据可区分信息和多源数据特征信息,且无需单独求解每一视图最优特征子空间,避免由于视图数量增加而造成的子空间搜索代价,从而能有效节约计算机资源。在模型学习过程中,利用l2,1范数损失函数评价模型与数据的拟合度,从而对数据集中噪声具有良好抗干扰性。最后,本专利技术还能有效提取多个视图数据之间共享信息,并以此约束模型,从而提高特征选择准度性和扩展性。附图说明图1是本专利技术的示意图;图2是本专利技术的流程图。具体实施方式以下将结合附图,对本专利技术的技术方案及有益效果进行详细说明。如图1和图2所示,本专利技术提供一种结合多源特征学习和组稀疏约束的无监督物体识别方法,包括如下步骤:(1)从包含c个类别的待处理图像集中获取V种类型特征(视图),并将这些特征组成数据集X=[x1,x2,…,xn]∈Rd×n,其中d代表数据的特征维度,n代表数据集的样本数。(2)提取数据集的总散度矩阵St:其中,为数据集样本的总平均值。(3)在步骤(2)的基础上构建基于线性判别分析的KM聚类模型,目标函数如下:其中,W=[w1,…,wd]T∈Rd×m为特征选择矩阵,m为降维后的特征维度,I为单位矩阵,F=[f1,f2,…,fn]T∈Rn×c为预测标签矩阵,G=[g1,g2,…,gc]∈Rm×c为聚类中心矩阵,||·||2,1代表其l2,1范数且对于任意矩阵M∈Rr×p,(4)在步骤(3)的基础上构建基于组稀疏约束和特征选择的多源数据联合聚类模型,目标函数如下:其中,代表G2,1范数,设为第i组视图数据对应的特征选择矩阵,则W可表示为且其G2,1范数可表示为γ和η是正则化参数,分别用于控制模型中特征稀疏度和视图间的稀疏度。可以看出,以上目标函数具备以下几个特点:1)该模型中的G2,1范数对不同视图的特征选择矩阵进行稀疏约束,进而能够有效评估不同视图的重要性,即通过该约束将为相关性较高的视图数据特征分配较大的权重,反之则分配小的权重;2)该模型通过采用基于l2,1范数的损失函数扩展KM聚类模型,能够有效减少噪声数据(即离群点)的干扰;3)模型采用基于l2,1范数的稀疏约束,可有效判定相同视图中不同数据特征重要性。(本文档来自技高网...

【技术保护点】
1.一种结合多源特征学习和组稀疏约束的无监督物体识别方法,其特征在于包括如下步骤:步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈R

【技术特征摘要】
1.一种结合多源特征学习和组稀疏约束的无监督物体识别方法,其特征在于包括如下步骤:步骤1,从包含c个类别的待处理图像集中获取V种视图,并将其组成数据集X=[x1,x2,…,xn]∈Rd×n,其中d代表数据的特征维度,n代表数据集的样本数;步骤2,提取数据集X的总散度矩阵St;步骤3,在步骤2的基础上构建基于线性判别分析的KM聚类模型;步骤4,在步骤3的基础上构建基于组稀疏约束和特征选择的多源数据联合聚类模型;步骤5,求解步骤4得到的多源数据联合聚类模型的目标函数,并进行优化。2.如权利要求1所述的结合多源特征学习和组稀疏约束的无监督物体识别方法,其特征在于:所述步骤2中,提取数据集的总散度矩阵St的公式是:其中,为数据集样本的总平均值。3.如权利要求1所述的结合多源特征学习和组稀疏约束的无监督物体识别方法,其特征在于:所述步骤3中,KM聚类模型的目标函数如下:其中,W=[w1,...,wd]T∈Rd×m为特征选择矩阵,m为降维后的特征维度,I为单位矩阵,F=[f1,f2,…,fn]T∈Rn×c为预测标签矩阵,G=[g1,g2,…,gc]∈Rm×c为聚类中心矩阵,||·||2,1代表其l2,1范数且对于任意矩阵M∈Rr×p,4.如权利要求1所述的结合多源特征学习和组稀疏约束的无监督物体识别方法,其特征在于:所述步骤4中,多源数据联合聚类模型的目标函数如下:其中,W=[w1,...,wd]T∈Rd×m为特征选择矩阵,m为降维后的特征维度,I为单位矩阵,F=[f1,f2,…,fn]T∈Rn×c为预测标签矩阵,G=[g1,g2,…,gc]∈Rm×c为聚类中心矩阵,||·||2,1代表其l2,1范数且对于任意矩阵M∈Rr×p,||·||G2,1代表G2,1范数,设为第i组视图数据对应的特征选择矩阵,则W表...

【专利技术属性】
技术研发人员:曾志强王晓栋严菲陈玉明
申请(专利权)人:厦门理工学院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1