【技术实现步骤摘要】
一种基于确定性退火的模糊划分聚类方法及装置
本专利技术涉及计算机
,特别是涉及一种基于确定性退火的模糊划分聚类方法及装置。
技术介绍
随着网络和多媒体的蓬勃发展,收集到的海量文本信息、图像信息、视频信息、音频信息等等数据使得人工处理这些数据变得越来越难。机器学习研究的崛起使得人们有可能通过机器学习的方式处理这些数据。机器学习研究中,聚类作为一种无监督学习方式,得到了来自各个领域研究者的关注。数据聚类算法在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。在聚类算法的发展历程中,研究工作者们尝试从不同角度来描述聚类问题,并提出了许多基于不同理论、适用于不同应用的聚类算法。近年来,聚类问题受到了学术界的广泛关注,机器学习和数据挖掘领域专家们在IEEETrans.、PatternRecognition、AAAI、ICML等权威杂志及学术会上,对聚类算法进行了深入地探索与研究,从聚类算法从相似度(相异度)计算以及参数选择两方面对提出了不同的聚类算法。通过计算相似度(相异度)可以挖掘出数据的内在结构,为进一步的数据分析提供信息,因此聚类结果 ...
【技术保护点】
1.一种基于确定性退火的模糊划分聚类方法,其特征在于,包括:步骤一、通过计算样本与各聚类中心间的马氏距离,建立相异度矩阵;步骤二、根据相异度矩阵建立加入熵约束后的聚类算法目标函数,所述聚类算法目标函数为:
【技术特征摘要】
1.一种基于确定性退火的模糊划分聚类方法,其特征在于,包括:步骤一、通过计算样本与各聚类中心间的马氏距离,建立相异度矩阵;步骤二、根据相异度矩阵建立加入熵约束后的聚类算法目标函数,所述聚类算法目标函数为:其中,隶属度矩阵U=[uik]c×n∈M,所述熵为通过最大化熵得到限制条件下的样本集最优模糊划分,其中uik∈[0,1],k=1,…,n,i=1,…,c,n为样本个数,c为类个数,参数β为预设值;步骤三、优化聚类算法的目标函数得到隶属度及聚类中心的迭代更新公式,通过迭代更新过程,得到样本的模糊划分结果,所述迭代更新公式为:其中,s为样本维度。2.根据权利要求1所述的方法,其特征在于,所述步骤一具体包括:样本和聚类中心间的相异度计算公式为:其中,X={x1,x2,…,xn}代表样本数量为n、样本维度为s的数据集,数据集中的每个样本,均由一个s维特征向量表示,聚类的目标是将这n个数据点分为c类,用V={v1,v2,…,vc}表示类中心。3.根据权利要求1所述的方法,其特征在于,还包括:预设参数β在预定的范围内变动。4.根据权利要求3所述的方法,其特征在于,预设参数β在预定的范围内变动,包括:所述预设参数β在预定范围内以β的预定倍数进行变动。5.一种基于确定性退火的模糊划分聚类装置,其特征在于,包括:第一处理单元,用于通过计算样本与各聚...
【专利技术属性】
技术研发人员:超木日力格,张博,杨云祥,郭静,吉祥,张雪莹,唐先超,
申请(专利权)人:中国电子科技集团公司电子科学研究院,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。