一种基于人工智能半监督聚类目标下的粒子群算法制造技术

技术编号:27255117 阅读:9 留言:0更新日期:2021-02-04 12:34
本发明专利技术提供了一种基于人工智能半监督聚类目标下的粒子群算法,包括:S1、输入数据集合,随机选取K个元素作为聚类中心;S2、更新聚类中心,计算当前K值的自适应量,与上一次进行对比,保留自适应量较高的K值;S3、重复执行S1

【技术实现步骤摘要】
一种基于人工智能半监督聚类目标下的粒子群算法


[0001]本专利技术涉及数据统计
,特别涉及一种基于人工智能半监督聚类目 标下的粒子群算法。

技术介绍

[0002]粒子群算法是通过模拟鸟群中个体之间相互协作的寻优能力,从而形成 的一种群智能优化算法,作为群智能算法的典型代表,粒子群优化算法已被 证明是一种有效的全局优化算法,原理简单、容易实现、参数少等优点,一 经提出就收到许多研究者的关注。母亲,该算法已经被广泛运用于工程优化、 图像处理、数据控制等领域。
[0003]传统粒子群算法优点较为明显,但是随着环境复杂度的增高,传统算法 在使用时,聚类中心敏感度提高,空聚类过多,类标号对聚类结果影响不足 等问题的表现也日趋严重。本文提出了一种改进算法,以半监督K均值聚类为 目标;首先以自适应K值的方式,随机的计算初始化聚类中心,并根据均值聚 类算法的需要编码成粒子,同时引入软性约束概念重新构造目标函数,最后 使用改进后的算法进行寻优。
[0004]本专利技术粒子群算法中,改进了自适应参数,引入了免疫扰动和混沌扰动 两种扰动方式,同时应用了退火策略和动态聚类策略,实验结果表明,该算 法在很大程度上解决了上述问题。

技术实现思路

[0005]在
技术实现思路
部分中引入了一系列简化形式的概念,这将在具体实施方式 部分中进一步详细说明。本专利技术的
技术实现思路
部分并不意味着要试图限定出所 要求保护的技术方案的关键特征和必要技术特征,更不意味着试图确定所要 求保护的技术方案的保护范围。
[0006]为至少部分地解决上述问题,本专利技术提供了一种基于人工智能半监督聚 类目标下的粒子群算法,包括:
[0007]S1、输入数据集合U,并在数据集合U中随机选取K个元素作为聚类中心;
[0008]S2、更新聚类中心,计算当前K值的自适应量,并与上一次K值的自适应 量进行对比,保留自自适应量较高的K值;
[0009]S3、重复执行S1-S2,直至得到最佳的K个聚类中心;
[0010]S4、根据得到的最佳的K个聚类中心,将粒子进行编码并归一化,然后获 取个体最优和全局最优解;
[0011]S5、将粒子进行动态聚类,获取粒子新的位置,并判断粒子位置是否需要 更新;
[0012]S6、选择粒子并对其进行免疫扰动和混沌扰动处理;
[0013]S7、计算当前粒子的个体最优解和全局最优解,与上次的个体最优解和全 局最优解进行对比,判断是否更新个体最优解和全局最优解;
[0014]S8、重复S5-S7步,如果当前迭代次数达到预设值,退出算法。
[0015]进一步地,所述S2中,通过以下公式进行更新聚类中心:
[0016][0017]上述公式中,α代表隶属度控制因子,α>0时,α=0时, 不考虑隶属度影响,μ
i,j
代表第i个数据点对第j个聚类中心的隶属度,μ
i,l
代表 第i个数据点对第l个聚类中心的隶属度,C
l
代表第l个聚类中心,X
i
代表第i数 据点,d
i,l
代表第i个数据点到第l个聚类中心的欧氏距离的倒数,K代表聚类数, N代表数据集合U中数据点的数目,d
i,j
代表第i个数据点到第j个聚类中心的欧 氏距离的倒数;
[0018]其中,所述数据点i对聚类中心j的隶属度计算公式如下:
[0019][0020]进一步地,所述S2中,通过以下公式进行计算当前K值的自适应量:
[0021][0022]上述公式中,C
j
代表第j个聚类中心,C
q
代表第q个聚类中心,F代表适应 度,K代表聚类数,Fit(K)代表当前K值的自适应量。
[0023]进一步地,所述S3还包括每次重复迭代时K值加1,从K值为2增加到N 代表数据集合U中数据点的数目。
[0024]进一步地,所述S4包括:
[0025]A1、根据得到的最佳的K个聚类中心,将粒子编码为K
×
M维向量,M代 表数据点维数,初始化粒子数目记住n,n∈[50,100],并将编码后的粒子进 行初始化;
[0026]A2、根据以下公式获取适应度:
[0027][0028]上述公式中,N
label
代表带有标签的数据点数量,λ代表自设权重,F代表 适应度,μ
a,A
代表第a个聚类中心数据点对第A个聚类中心的隶属度,μ
b,B
代表 第b个聚类中心数据点对第B个聚类中心的隶属度,C
a
代表第a个聚类中心,C
b
代表第b个聚类中心,C
j
代表第j个聚类中心,C
q
代表第q个聚类中心;
[0029]A3,根据适应度获取粒子个体最优而全局最优解。
[0030]进一步地,所述S5中,通过以下公式对粒子进行动态聚类:
[0031][0032]d
il
=min{d
ij
}j=1,2

K`
[0033][0034]上述公式中,K、代表阈值为的聚类数,n代表初始化粒子数目,x
i
代 表第i个粒子位置,C
l
代表第l个聚类中心,d
il
代表第i个粒子到第l个聚类中心 的欧氏距离的倒数,d
ij
代表第i个粒子到第j个聚类中心的欧氏距离的倒数。
[0035]进一步地,通过以下公式获取粒子新的位置:
[0036]x
id
(t+1)=x
id
(t)+v
id
(t+1)
[0037]上述公式中,x
id
(t+1)代表第d维上第i个粒子在第t+1次迭代时的位置, x
id
(t)代表第d维上第i个粒子在第t次迭代时的位置,v
id
(t+1)代表第d维上第 i个粒子在第t+1次迭代时的速度,d代表第d维的粒子属性,t代表当前迭代 次数;
[0038]其中,第d维上第i个粒子在第t+1次迭代时的速度通过以下公式进行计 算:
[0039]v
id
(t+1)=ωv
id
(t)+c1r1(t)[pi
d
(t)-x
id
(t)][0040]+c2r2(t)[pg
d
(t)-x
id
(t)][0041]上述公式中,v
id
(t+1)代表第d维上第i个粒子在第t+1次迭代时的速度, c1,c1均是常数(非负),代表社会学习因子和个体学习因子,ω代表惯性权 重,r1(t)和r2(t)则代表以相互独立的方式在[0,1]之间随机所取的值,pi
d
(t)代 表第i个粒子具备最佳适应度的位置,pg
d<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,包括:S1、输入数据集合U,并在数据集合U中随机选取K个元素作为聚类中心;S2、更新聚类中心,计算当前K值的自适应量,并与上一次K值的自适应量进行对比,保留自适应量较高的K值;S3、重复执行S1-S2,直至得到最佳的K个聚类中心;S4、根据得到的最佳的K个聚类中心,将粒子进行编码并归一化,然后获取个体最优和全局最优解;S5、将粒子进行动态聚类,获取粒子新的位置,并判断粒子位置是否需要更新;S6、选择粒子并对其进行免疫扰动和混沌扰动处理;S7、计算当前粒子的个体最优解和全局最优解,与上次的个体最优解和全局最优解进行对比,判断是否更新个体最优解和全局最优解;S8、重复S5-S7步,如果当前迭代次数达到预设值,退出算法。2.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,所述S2中,通过以下公式进行更新聚类中心:上述公式中,α代表隶属度控制因子,α&gt;0时,α=0时,不考虑隶属度影响,μ
i,j
代表第i个数据点对第j个聚类中心的隶属度,μ
i,l
代表第i个数据点对第l个聚类中心的隶属度,C
l
代表第l个聚类中心,X
i
代表第i数据点,d
i,l
代表第i个数据点到第l个聚类中心的欧氏距离的倒数,K代表聚类数,N代表数据集合U中数据点的数目,d
i,j
代表第i个数据点到第j个聚类中心的欧氏距离的倒数;其中,所述数据点i对聚类中心j的隶属度计算公式如下:3.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,所述S2中,通过以下公式进行计算当前K值的自适应量:
上述公式中,C
j
代表第j个聚类中心,C
q
代表第q个聚类中心,F代表适应度,K代表聚类数,Fit(K)代表当前K值的自适应量。4.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,所述S3还包括每次重复迭代时K值加1,从K值为2增加到N代表数据集合U中数据点的数目。5.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,所述S4包括:A1、根据得到的最佳的K个聚类中心,将粒子编码为K
×
M维向量,M代表数据点维数,初始化粒子数目记住n,n∈[50,100],并将编码后的粒子进行初始化;A2、根据以下公式获取适应度:上述公式中,N
label
代表带有标签的数据点数量,λ代表自设权重,F代表适应度,μ
a,A
代表第a个聚类中心数据点对第A个聚类中心的隶属度,μ
b,B
代表第b个聚类中心数据点对第B个聚类中心的隶属度,C
a
代表第a个聚类中心,C
b
代表第b个聚类中心,C
j
代表第j个聚类中心,C
q
代表第q个聚类中心;A3,根据适应度获取粒子个体最优而全局最优解。6.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征在于,所述S5中,通过以下公式对粒子进行动态聚类:所述S5中,通过以下公式对粒子进行动态聚类:上述公式中,K、代表阈值为的聚类数,n代表初始化粒子数目,x
i
代表第i个粒子位置,C
l
代表第l个聚类中心,d
il
代表第i个粒子到第l个聚类中心的欧氏距离的倒数,d
ij
代表第i个粒子到第j个聚类中心的欧氏距离的倒数。7.根据权利要求1所述的一种基于人工智能半监督聚类目标下的粒子群算法,其特征
在于,所述S5中,通过以下公式获取粒子新的位置:...

【专利技术属性】
技术研发人员:孙艺王天棋姜堃孙学慧张长波
申请(专利权)人:汉唐智华深圳科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1