一种基于联合熵尺度加权和正则块对角的鲁棒多核子空间聚类算法制造技术

技术编号:28216169 阅读:19 留言:0更新日期:2021-04-28 09:27
本发明专利技术涉及机器学习和数据挖掘领域,特别是一种基于联合熵尺度加权和块对角正则的鲁棒多核子空间聚类算法。提出一种用于数据聚类的鲁棒多核子空间聚类(JNKSC)方法,该算法包括:使用特征映射将数据映射到希尔伯特空间H;使用核技巧构成核池,共包含12个基核;对核池使用熵尺度加权策略,得到新的共识核H;引入BDR和自表达框架,致力于得到最优块对角结构的关系矩阵Z;利用共识核H和最优关系矩阵Z,构成目标函数,用于聚类。本发明专利技术利用基于熵尺度的自加权策略来更新迭代基核并得到具有更好数据特征的共识核,提高对非高斯噪声的鲁棒性,利用BDR和自表达框架,提高亲和矩阵的块对角性,提高谱聚类的聚类结果。提高谱聚类的聚类结果。提高谱聚类的聚类结果。

【技术实现步骤摘要】
一种基于联合熵尺度加权和正则块对角的鲁棒多核子空间聚类算法


[0001]本专利技术设计数据挖掘领域,特别是基于非线性核子空间聚类的高精度和鲁棒性的一种基于联合熵尺度加权和正则块对角的鲁棒多核子空间聚类算法。

技术介绍

[0002]随着大数据智能化时代来临,大规模高维数据在社会、经济、工程等领域越来越普遍。大规模高维数据不仅增加了数据存储的需求,也使得数据分析更加复杂,以此引发了一系列相关学科与技术的高速发展。
[0003]子空间学习是行业中极具挑战和热门的方向,在数据挖掘和机器学习中起着至关重要的作用,特别是多个潜在子空间之间有相交性的情形。目前行业内研究子空间学习问题比较常见的且有效的是自表达方法,这类方法基本上将每个样本向量表示为其他向量的线性组合,因为子空间的属性特点,表示向量之间具有比较明显的子空间属性,再将谱聚类方法用于由自表达矩阵对称非负化得到的关系矩阵,就可以得到具有一定的子空间属性的聚类方式,进而由聚类得到样本点,估计相应的子空间。子空间聚类的关键点就是求解表达系数矩阵Z,而其不足是Z与图谱聚类的拉普拉斯矩阵L是两个分开的过程,相互之间不能联系。
[0004]近年来,基于非线性核的子空间聚类方法通过揭示样本的非线性结构来提高聚类性能,得到了广泛的关注,很多子空间聚类方法得以提出。但是,现有的内核子空间聚类存在以下三个缺点:一是聚类性能高度依赖所选择的核函数,二是对非高斯噪声不具备鲁棒性,三是得到的亲和矩阵不满足聚类必须的块对角属性。因此,急需一种具有更佳精度和鲁棒性的子空间聚类算法。<br/>
技术实现思路

[0005]有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种提高计算结果精度和鲁棒性的一种基于联合熵尺度加权和正则块对角的鲁棒多核子空间聚类算法,所述方法包括以下步骤:1、一种基于联合熵尺度加权和块对角正则的鲁棒多核子空间聚类算法,其特征在于:所述方法包括以下步骤:S100、预处理图像,得到输入矩阵X。
[0006]S200、根据先验知识,输入目标函数的权衡参数α、β、γ,阈值,同时输入已知类数值k。
[0007]S300、引用12种核函数对输入矩阵进行映射到希尔伯特空间,得到多个核矩阵H
i
,构成核池。
[0008]S400、初始化:初始化矩阵S1=0,A1=0,Z1=0,H1、w1,令迭代统计变量t=1,最大迭代次数t
max
=1000。
[0009]S500、利用下式,更新Z: 。
[0010]S600、利用下式,更新S:引入的度矩阵为最优。其中,D是具有对角元素{
jj
}的对角矩阵。
[0011]S700、利用下式,更新A:其中,,。
[0012]S800、利用下式,更新H: 。
[0013]S900、利用下式,更新w:。
[0014]S1000、获得Z、S、A、H、w获得目标函数。
[0015]S1100、判断目标函数是否收敛,若不收敛,则跳转到S500,若收敛,则进行到下一步,判断收敛算法如下式:其中是第次迭代的目标函数的值,是停止阈值。
[0016]S1200、使用谱聚类算法,输出聚类结果。
[0017]本专利技术的有益效果是:1、由于本专利技术提出了一种用于子空间聚类的鲁棒多核方法。该方法从预定义的核池中自适应地学习最优的共识核来解决寻找合适的单核难题,优化处理非线性结构的数据,与现有的单核和多核方法相比,获得了更可靠的聚类结果;2、由于本专利技术引入BDR,使得到的再生核希尔伯特征空间中的数据点具有自表达性,得到的关系矩阵具有最优的块对角结构;3、本专利技术利用熵尺度加权的方法从12个基核中学习得到一个共识核,提高算法对非高斯噪声的鲁棒性。
[0018]附图说明
[0019]图1是本专利技术的一个实施例流程框图。
[0020]图2和图3是是本公开专利技术的实际案例结果评估数据。
具体实施方式
[0021]为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全面的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。
[0022]在一个实施例中,结合附图1,本专利技术揭示了一种基于联合熵尺度加权和块对角正则的鲁棒多核子空间聚类算法,其特征在于:所述方法包括以下步骤:S100、预处理图像,得到输入矩阵X;S200、根据先验知识,输入目标函数的权衡参数α、β、γ,阈值,同时输入已知类数值k;S300、引用12种核函数对输入矩阵进行映射到希尔伯特空间,得到多个核矩阵H
i
,构成核池;S400、初始化:初始化矩阵S1=0,A1=0,Z1=0,H1、w1,令迭代统计变量t=1,设置最大迭代次数t
max
;S500、利用下式,更新Z:;S600、利用下式,更新S:引入的度矩阵为最优。其中,D是具有对角元素{
jj
}的对角矩阵;S700、利用下式,更新A:其中,,;S800、利用下式,更新H:;S900、利用下式,更新w:;S1000、获得Z、S、A、H、w获得目标函数;S1100、判断目标函数是否收敛,若不收敛,则跳转到S500,若收敛,则进行到下一步,判断收敛算法如下式:其中是第次迭代的目标函数的值,是停止阈值;S1200、使用谱聚类算法,输出聚类结果。
[0023]在一个实施例中,所述步骤S100具体包括以下步骤:S1001、输入n张图片;S1002、针对每张图片进行ROI处理,提取特征,得到n张h
×
w数据;S1003、对每张图片向量化,构成(h
×
w)
×
1列向量;S1004、将n张图片按列向量顺序排列,得到(h
×
w)
×
n输入矩阵X。
[0024]在一个实施例中,所述步骤S300具体包括以下步骤:S3001、引入常见的12种核函数,包含7种高斯函数,4种线性函数,1种多项式函数;S3002、引入“核技巧”,利用直接得到任意两个数据点的相似性,构成相应核函数的核矩阵H;S3003、12种核函数得到12个基础核,构成核池。
[0025]在一个实施例中,所述步骤S500具体包括以下步骤:S5001、引入联合多核子空间聚类方法(JMKSC)模型的目标函数,如下式:其中,α、β、γ为已知权衡参数,Z为亲和矩阵,A为关系矩阵,H为共识核矩阵,w为基核权重;S5002、引入交替最小策略,固定其他变量同时更新Z,因此定义一个目标函数如下:;S5003、得到的求解式如下:对上式求关于Z的偏导,得到Z的更新解。
[0026]在一个实施例中,所述步骤S700具体包括以下步骤:S7001、引入联合多核子空间聚类方法(JMKSC)模型的目标函数,如下式:其中,α、β、γ为已知权衡参数,Z为亲和矩阵,A为关系矩阵,H为共识核本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联合熵尺度加权和块对角正则的鲁棒多核子空间聚类算法,其特征在于,所述方法包括以下步骤:S100、预处理图像,得到输入矩阵X;S200、根据先验知识,输入目标函数的权衡参数α、β、γ,阈值,同时输入已知类数值k;S300、引用12种核函数对输入矩阵进行映射到希尔伯特空间,得到多个核矩阵H
i
,构成核池;S400、初始化:初始化矩阵S1=0,A1=0,Z1=0,H1、w1,令迭代统计变量t=1,设置最大迭代次数t
max
;S500、利用下式,更新Z:;S600、利用下式,更新S:引入引入的度矩阵的度矩阵为最优为最优。其中,D是具有对角元素{素{
jj
}}的对角矩阵;S700、利用下式,更新A:其中,其中,,,;S800、利用下式,更新H:;S900、利用下式,更新w:;S1000、获得Z、S、A、H、w获得目标函数;S1100、判断目标函数是否收敛,若不收敛,则跳转到S500,若收敛,则进行到下一步,判断收敛算法如下式:其中其中是第是第次迭代的目标函数的值,次迭代的目标函数的值,是停止阈值;S1200、使用谱聚类算法,输出聚类结果。2.根据权利要求1所述,其特征在于,所述步骤S100具体包括以下步骤:S1001、输入n张图片;S1002、针对每张图片进行ROI处理,提取特征,得到n张h
×
w数据;S1003、对每张图片向量化,构成(h
×
w)
×
1列向量;S1004、将n张图片按列向量顺序排列,得到(h
×
w)
×
n输入矩阵X。
3.根据权利要求1所述,其特征在于,所述步骤S300具体包括以下步骤:S3001、引入常见的12种核函数
ꢀꢀ
,包含7种高斯函数,4种线性函数,1种多项式函数;S3002、引入
ꢀ“
核技巧”,利用利用直接得到任意两个数据点的相似性,构成相应核函数的核矩阵H;S3003、12种核函数得到12个基础核,构成核池。4.根据权利要求1所述,其特征在于,所述步骤S500具体包括以下步骤:S5001、引入联合多核子...

【专利技术属性】
技术研发人员:杨超李玉琳印茂伟任珍文黄震韦家军孙梧雨张雨亭周帅吴轩光张芯悦张维含虎楠
申请(专利权)人:西南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1