一种谱聚类算法中心点的选取方法和装置制造方法及图纸

技术编号:23705775 阅读:23 留言:0更新日期:2020-04-08 11:21
本发明专利技术公开了一种谱聚类算法中心点的选取方法和装置。方法包括:采用莱维飞行策略生成一个步长;判断步长是否大于预设阈值;如果大于,采用预设的第一公式更新种群中各个粒子的速度;如果不大于,采用预设的第二公式更新种群中各个粒子的速度,其中所述步长不引入所述第一公式和所述第二公式;依据种群中各个粒子更新后的速度,确定各个粒子的位置;针对种群中的每一个粒子,将该粒子的位置代入预设的目标函数,计算得到该粒子的适应度值;判断当前是否满足终止条件;如果满足,将种群中适应度值最优的粒子确定为谱聚类算法中心点。本发明专利技术能够保证收敛速度快且最终收敛值较小。

【技术实现步骤摘要】
一种谱聚类算法中心点的选取方法和装置
本专利技术涉及数据处理
,尤其涉及一种谱聚类算法中心点的选取方法和装置。
技术介绍
聚类是为了将数据样本划分为几组类簇,属于同类簇的数据样本在设定规则下更为相似,而不同类簇的数据样本在设定规则下被区分开来。而因为数据的多样性使得许多数据的维度具有不相关性,因此传统的聚类算法面对多样性的数据时聚类效果变差。谱聚类算法用于解决数据维度不相关导致的聚类效果变差的问题,但是谱聚类算法的中心点选择对聚类结果具有非常大的影响。目前对于谱聚类算法中心点的选取方法采用布谷鸟搜索算法或粒子群算法等群智能算法。然而,使用布谷鸟搜索算法搜索聚类算法初始化中心点,虽然最终收敛值较小,但存在后期收敛速度慢的问题,而粒子群算法虽然收敛速度快,但最终收敛值较大。因此,目前急需一种能够同时保证收敛速度快且最终收敛值较小的谱聚类算法中心点的选取方法。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种谱聚类算法中心点的选取方法和装置。技术方案如下:基于本专利技术的一方面,本专利技术提供一种谱聚类算法中心点的选取方法,所述选取方法包括:采用莱维飞行策略生成一个步长;判断所述步长是否大于预设阈值;如果大于,采用预设的第一公式更新种群中各个粒子的速度;如果不大于,采用预设的第二公式更新种群中各个粒子的速度,其中所述步长不引入所述第一公式和所述第二公式;依据种群中各个粒子更新后的速度,确定各个粒子的位置;针对种群中的每一个粒子,将该粒子的位置代入预设的目标函数,计算得到该粒子的适应度值;判断当前是否满足终止条件;如果满足,将种群中适应度值最优的粒子确定为谱聚类算法中心点。可选地,所述第一公式为所述第二公式为其中,D表示D维向量,表示第k+1代粒子i的速度,表示第k代粒子i的速度,D、k均为正整数;l_factor为预设的局部影响因子,g_factor为预设的全局影响因子,其中,c1、c2为学习因子;r1、r2取值范围是[0,1]区间内均匀分布的伪随机数;pkiD为第k代粒子i经历过的历史最好位置,为第k代粒子i的位置,gkiD为第k代种群内全部粒子历史最佳位置。可选地,所述依据种群中各个粒子更新后的速度,确定各个粒子的位置包括:采用公式确定各个粒子的位置;其中,为第k+1代粒子i的位置,为第k代粒子i的位置。可选地,所述判断当前是否满足终止条件包括:判断当前的迭代次数是否达到设定的迭代次数;或,判断粒子的适应度值是否达到收敛阈值。可选地,在采用莱维飞行策略生成一个步长之前,所述选取方法还包括:设置全局参数并初始化所述种群,使得所述种群中的每个粒子具备初始速度和初始位置;分别将所述种群中每个粒子的初始位置代入所述预设的目标函数,计算得到每个粒子的初始适应度值;确定每个粒子的历史最优解和全局最优解。可选地,所述确定每个粒子的历史最优解和全局最优解包括:保留各个粒子的适应度值F较小的结果,得到Fbest=min{F1,F2,...,Fn};其中Fn表示第n个粒子的适应度值,n为正整数;采用公式确定每个粒子的历史最优解;采用公式确定全局最优解。基于本专利技术的另一方面,本专利技术提供一种谱聚类算法中心点的选取装置,所述选取装置包括:生成单元,用于采用莱维飞行策略生成一个步长;第一判断单元,用于判断所述步长是否大于预设阈值;更新单元,用于在所述第一判断单元判断所述步长大于预设阈值时,采用预设的第一公式更新种群中各个粒子的速度;在所述第一判断单元判断所述步长不大于预设阈值时,采用预设的第二公式更新种群中各个粒子的速度,其中所述步长不引入所述第一公式和所述第二公式;第一确定单元,用于依据种群中各个粒子更新后的速度,确定各个粒子的位置;计算单元,用于针对种群中的每一个粒子,将该粒子的位置代入预设的目标函数,计算得到该粒子的适应度值;第二判断单元,用于判断当前是否满足终止条件;第二确定单元,用于在所述第二判断单元判断当前满足终止条件时,将种群中适应度值最优的粒子确定为谱聚类算法中心点。可选地,所述第一公式为所述第二公式为其中,D表示D维向量,表示第k+1代粒子i的速度,表示第k代粒子i的速度,D、k均为正数;l_factor为预设的局部影响因子,g_factor为预设的全局影响因子,其中,c1、c2为学习因子;r1、r2取值范围是[0,1]区间内均匀分布的伪随机数;pkiD为第k代粒子i经历过的历史最好位置,为第k代粒子i的位置,gkiD为第k代种群内全部粒子历史最佳位置。基于本专利技术的再一方面,本专利技术提供一种存储介质,其上存储有程序,所述程序被处理器执行时实现前文所述的谱聚类算法中心点的选取方法。基于本专利技术的再一方面,本专利技术提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行前文所述的谱聚类算法中心点的选取方法。借由上述技术方案,本专利技术提供的谱聚类算法中心点的选取方法和装置中,将莱维飞行策略引入粒子群算法中,在粒子群算法中充分利用莱维飞行策略具备的能够保证最终收敛值较小的特性,使得改进后的粒子群算法获得的最终收敛值较小。且具体地,本专利技术将采用莱维飞行策略生成的步长作为选择更新种群中粒子速度的公式的条件,针对步长大于预设阈值和不大于预设阈值的两种情况,分别采用预设的第一公式或第二公式来更新种群中各个粒子的速度,其中步长不引入该第一公式和第二公式。具体地,第一公式针对的是大步长的情况,该第一公式中减弱了粒子自身历史经验的决策能力,而增加了全局最优解对粒子速度更新的影响力,使其具有较强的全局搜索能力,从而提高跳出原始算法中陷入局部最优解的概率;第二公式则针对的是小步长的情况,该第二公式中减弱了对全局的学习能力,而增加了粒子自身历史经验的决策能力,使得选取方法在局部范围内具有更强的搜索能力。因此,本专利技术利用预设的第一公式或第二公式更新种群中各个粒子的速度,能够使得选取方法具有较强的全局搜索能力或较强的局部搜索能力,保证了收敛速度。因此,本专利技术能够同时保证收敛速度快且最终收敛值较小。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种谱聚类算法中心点的选取方法的流程图;图2示出了本专利技术实施例提供的另一种谱聚类算法中心点的选取方法的流程图;本文档来自技高网...

【技术保护点】
1.一种谱聚类算法中心点的选取方法,其特征在于,所述选取方法包括:/n采用莱维飞行策略生成一个步长;/n判断所述步长是否大于预设阈值;/n如果大于,采用预设的第一公式更新种群中各个粒子的速度;/n如果不大于,采用预设的第二公式更新种群中各个粒子的速度,其中所述步长不引入所述第一公式和所述第二公式;/n依据种群中各个粒子更新后的速度,确定各个粒子的位置;/n针对种群中的每一个粒子,将该粒子的位置代入预设的目标函数,计算得到该粒子的适应度值;/n判断当前是否满足终止条件;/n如果满足,将种群中适应度值最优的粒子确定为谱聚类算法中心点。/n

【技术特征摘要】
1.一种谱聚类算法中心点的选取方法,其特征在于,所述选取方法包括:
采用莱维飞行策略生成一个步长;
判断所述步长是否大于预设阈值;
如果大于,采用预设的第一公式更新种群中各个粒子的速度;
如果不大于,采用预设的第二公式更新种群中各个粒子的速度,其中所述步长不引入所述第一公式和所述第二公式;
依据种群中各个粒子更新后的速度,确定各个粒子的位置;
针对种群中的每一个粒子,将该粒子的位置代入预设的目标函数,计算得到该粒子的适应度值;
判断当前是否满足终止条件;
如果满足,将种群中适应度值最优的粒子确定为谱聚类算法中心点。


2.根据权利要求1所述的选取方法,其特征在于,
所述第一公式为
所述第二公式为
其中,D表示D维向量,表示第k+1代粒子i的速度,表示第k代粒子i的速度,D、k均为正整数;l_factor为预设的局部影响因子,g_factor为预设的全局影响因子,其中,c1、c2为学习因子;r1、r2取值范围是[0,1]区间内均匀分布的伪随机数;pkiD为第k代粒子i经历过的历史最好位置,为第k代粒子i的位置,gkiD为第k代种群内全部粒子历史最佳位置。


3.根据权利要求1所述的选取方法,其特征在于,所述依据种群中各个粒子更新后的速度,确定各个粒子的位置包括:
采用公式确定各个粒子的位置;
其中,为第k+1代粒子i的位置,为第k代粒子i的位置。


4.根据权利要求1所述的选取方法,其特征在于,所述判断当前是否满足终止条件包括:
判断当前的迭代次数是否达到设定的迭代次数;或,
判断粒子的适应度值是否达到收敛阈值。


5.根据权利要求1-4任一项所述的选取方法,其特征在于,在采用莱维飞行策略生成一个步长之前,所述选取方法还包括:
设置全局参数并初始化所述种群,使得所述种群中的每个粒子具备初始速度和初始位置;
分别将所述种群中每个粒子的初始位置代入所述预设的目标函数,计算得到每个粒子的初始适应度值;
确定每个粒子的历史最优解和全局最优解。


6.根据权利要...

【专利技术属性】
技术研发人员:孙颢宁
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1