一种基于层次聚类的SOM算法改进方法技术

技术编号:35457762 阅读:25 留言:0更新日期:2022-11-03 12:19
本发明专利技术公开了一种基于层次聚类的SOM算法改进方法,包括:基于层次聚类法,确定SOM算法的初始权重值;基于初始权重值将SOM算法神经元数据进行初始化;基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。加快SOM收敛速度,能够降低数据量较大时的算法时间复杂度,同时,还可以应对数据集不平衡等问题。问题。问题。

【技术实现步骤摘要】
一种基于层次聚类的SOM算法改进方法


[0001]本专利技术涉及SOM算法
,尤其涉及一种基于层次聚类的SOM算法改进方法。

技术介绍

[0002]聚类分析是将数据分组到子集的过程,集群中的每个项目与同一集群中的项目的相似程度要高于集群外部的其他项目。通常,距离度量如欧氏距离、曼哈顿距离被用来评估数据点之间的差异。聚类分析是机器学习和数据挖掘中最有用的任务之一,已被广泛应用于市场营销、银行、医药和电信等领域。它被广泛应用于降维、信息提取、密度近似和数据压缩等领域。
[0003]SOM方法的性能对随机分配的初始权重敏感。而且在大规模应用中,随机分配的初始值使它的速度非常慢。

技术实现思路

[0004]本专利技术提供了一种基于层次聚类的SOM算法改进方法,以解决现有技术中存在的聚类分析初始值敏感、收敛速度慢的问题,集群中的每个项目与同一集群中的项目的相似程度要高于集群外部的其他项目。通常,距离度量如欧氏距离、曼哈顿距离被用来评估数据点之间的差异。聚类分析是机器学习和数据挖掘中最有用的任务之一,已被广泛应用于市场营销、银行、医药和电信等领域。它被广泛应用于降维、信息提取、密度近似和数据压缩等领域。SOM方法的性能对随机分配的初始权重敏感。而且在大规模应用中,随机分配的初始值使它的速度非常慢。
[0005]为了达到上述目的,本专利技术提供如下技术方案:
[0006]一种基于层次聚类的SOM算法改进方法,包括:
[0007]S101:基于层次聚类法,确定SOM算法的初始权重值;
[0008]S102:基于初始权重值将SOM算法神经元数据进行初始化;
[0009]S103:基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。
[0010]其中,所述S101步骤包括:
[0011]S1011:对数据进行初始化处理,获取对应的簇数q;
[0012]S1012:基于重复中心点集合D的计算过程获取q=N
×
M;
[0013]S1013:通过公式确定N
×
M个聚类中心,即D={{x1},{x2},...,{x
N
×
M
}},其中,N
×
M个聚类中心为层次聚类的储存结果,r表示第r个簇,1≤r≤N
×
M,k表示第r个簇的样本点的个数。
[0014]其中,所述S1013步骤之后包括:
[0015]查询中心点集合D中最边缘的中心点L,
[0016]从与L最相似到最不相似以及欧氏距离由近到远的方式将所有簇中心的D进行排序,其中D不变,将排序结果放入神经元集合θ中;
[0017]将排序中心的属性值按顺序进行初始化,通过初始化形成映射神经元的权重值。
[0018]其中,所述S102步骤包括:
[0019]S1021:基于SOM算法,将对应的权值进行初始化处理;
[0020]S1022:基于欧氏距离,计算输出神经元和输入向量之间的距离,获取获胜神经元,所述获胜神经元为距离最短的输出神经元;
[0021]S1023:通过更新神经元权重公式和高斯函数公式对优胜邻域内神经元调整权值大小,其中,学习率随迭代次数增加而减小,学习邻域缩小;
[0022]S1024:查看学习率是否小于预设阈值,若小于预设阀值则结束检查。
[0023]其中,所述S1021步骤包括:
[0024]通过顺序赋值将竞争层的神经元权重赋值为层次聚类中心点,对竞争层的神经元权重进行归一化处理,通过邻域函数公式和高斯函数公式建立优胜领域,通过优胜领域初始化学习率;
[0025]所述邻域函数公式如下:
[0026]h(t)=αGF
[0027]所述高斯函数公式如下:
[0028][0029]其中,h(t)表示邻域函数,α表示学习率,GF表示高斯函数,表示邻域宽度参数,wui表示获胜神经元,cui表示输入神经元。
[0030]其中,所述S1021步骤包括:
[0031]基于SOM算法,输入神经元与输出神经元相连,每个连接对应一个权重值;
[0032]将SOM算法神经元数据初始化的过程中,每个神经元与输入向量(x
i
=x
i1
,x
i2
,...,x
in
)的随机权重向量(w
i
=w
i1
,w
i2
,...,w
in
)相关联,其中,随机权重向量包括相同维数n。
[0033]其中,所述S1023包括:
[0034]基于邻域函数公式,根据w
ij
(t+1)=w
ij
+h(t)(x
i

w
ij
)更新神经元权重,其中,w
ij
(t)表示在时间t从输入i到输出神经元j的连接权重,x
i
表示输入向量X的元素i,h表示邻域函数。
[0035]其中,所述S1012步骤包括:
[0036]基于中心点集合D中任意两组(C
i
,C
j
),计算最小距离d
min
(C
i
,C
j
);
[0037]合并C
i
,C
j
,取q=q

1作为新的q值;
[0038]重复上述计算直至q=N
×
M。
[0039]其中,所述S1011步骤包括:
[0040]对数据进行初始化处理,即M={{x1},{x2},...,{x
m
}},将每个数据分为一个簇,其中,簇数q=m,m表示初始样本数目。
[0041]其中,所述S1013步骤包括:
[0042]将聚类个数进行初始化,通过初始化获取与初始样本数目m相关的较大数值,初始化后为结合层次聚类获取神经元权重值,通过SOM算法进行聚类,在SOM算法中,对通过化整处理进行修正,当SOM算法结束时,将N
×
M初始化作为神经元的个数。
[0043]与现有技术相比,本专利技术具有以下优点:
[0044]一种基于层次聚类的SOM算法改进方法,包括:基于层次聚类法,确定SOM算法的初始权重值;基于初始权重值将SOM算法神经元数据进行初始化;基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。加快SOM收敛速度,能够降低数据量较大时的算法时间复杂度,同时,还可以应对数据集不平衡等问题。
[0045]本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0046]下面通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于层次聚类的SOM算法改进方法,其特征在于,包括:S101:基于层次聚类法,确定SOM算法的初始权重值;S102:基于初始权重值将SOM算法神经元数据进行初始化;S103:基于初始化后的SOM算法神经元数据,通过SOM算法获取对应的聚类方案。2.根据权利要求1所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S101步骤包括:S1011:对数据进行初始化处理,获取对应的簇数q;S1012:基于重复中心点集合D的计算过程获取q=N
×
M;S1013:通过公式确定N
×
M个聚类中心,即D={{x1},{x2},...,{x
N
×
M
}},其中,N
×
M个聚类中心为层次聚类的储存结果,r表示第r个簇,1≤r≤N
×
M,k表示第r个簇的样本点的个数。3.根据权利要求2所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S1013步骤之后包括:查询中心点集合D中最边缘的中心点L,从与L最相似到最不相似以及欧氏距离由近到远的方式将所有簇中心的D进行排序,其中D不变,将排序结果放入神经元集合θ中;将排序中心的属性值按顺序进行初始化,通过初始化形成映射神经元的权重值。4.根据权利要求1所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S102步骤包括:S1021:基于SOM算法,将对应的权值进行初始化处理;S1022:基于欧氏距离,计算输出神经元和输入向量之间的距离,获取获胜神经元,所述获胜神经元为距离最短的输出神经元;S1023:通过更新神经元权重公式和高斯函数公式对优胜邻域内神经元调整权值大小,其中,学习率随迭代次数增加而减小,学习邻域缩小;S1024:查看学习率是否小于预设阈值,若小于预设阀值则结束检查。5.根据权利要求4所述的一种基于层次聚类的SOM算法改进方法,其特征在于,所述S1021步骤包括:通过顺序赋值将竞争层的神经元权重赋值为层次聚类中心点,对竞争层的神经元权重进行归一化处理,通过邻域函数公式和高斯函数公式建立优胜领域,通过优胜领域初始化学习率;所述邻域函数公式如下:h(t)=αGF所述高斯函数公式如下:其中,h(t)表示邻域函数,α表示学习率,GF表示高斯函数,表示邻域宽度参数,wui表示获胜神经元,cui表示输入神经元。6.根据权利要求4所述的一种基于层次聚类的SOM算法改进方法,其特征...

【专利技术属性】
技术研发人员:杨永全管佩琪魏志强
申请(专利权)人:青岛海洋科学与技术国家实验室发展中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1