当前位置: 首页 > 专利查询>天津大学专利>正文

改进的多径簇聚类方法技术

技术编号:14916072 阅读:364 留言:0更新日期:2017-03-30 04:52
本发明专利技术属于数据挖掘领域,为提出根据多径的属性对于分类的不同的贡献度,利用信息熵原理对多径分量距离进行特征加权以提高分类精度。本发明专利技术采用的技术方案是,改进的多径簇聚类方法,首先采用小波变换的尖峰检测技术代替随机选择,获得稳定的聚类效果;接下来在考虑了多径功率的影响的基础上,引入信息熵原理计算多径属性自适应加权的多径分量距离MCD(Multipath Component Distance);最后依据不同的MCD将不同的多径分配给不同的簇。本发明专利技术主要应用于数据处理场合。

【技术实现步骤摘要】

本专利技术属于数据挖掘领域,模式识别领域,机器学习中的无监督学习领域,以及信道建模和信道特性研究领域,具体讲,涉及改进的多径簇聚类方法。
技术介绍
聚类算法在数据挖掘中是一种非常重要的数据分析方法,该算法的目标是将数据集合中的大量数据分成不同的簇,使得同一簇内的各个数据间的差别尽可能小,不同簇内数据之间的差别尽可能大,从而对数据进行分析,以便应用与实际的研究内容中。聚类算法历史悠久,早在1967年MacQueen就提出了KMeans聚类算法,该算法以不同数据的欧氏距离平方和作为目标函数,之后Hartigan在1975年时发表专著《ClusteringAlgorithms》对聚类算法进行了详细的论述,证明了目标函数的收敛性。此时的聚类算法易于理解易于描述,但是存在许多缺陷,例如:需要预先确定聚类中心数K,聚类的效果会受到初始聚类中心设置的影响,简单基于欧氏距离的目标函数存在局部最小值点,从而会使算法陷入局部最小值等等。根据聚类算法的基本思想,聚类不仅要使同一簇内的相似度尽可能大,还要使簇间的相似度尽可能小,因而之后提出了一系列改进都是使用类内紧密型与类间分散性的比值作为收敛函数,当收敛函数收敛至极小值时,可以使簇内相似度小,簇间相似度大。如DB(Davies—Bouldin)指数就是计算类内距离之和与类间距离之和的比值。在无线通信中,电磁波的传播可以用传播径近似表征。传播径可以通过一个多维参数集描述,该参数集一般包括能量、时延、到达角和离开角等多径特性。一般将具有相近参数的多径归为一个簇进行统计特性研究,一些主流的无线宽带信道模型(SCM/SCME/WINNER)都是基于多径散射簇进行建模的。对传播径进行簇识别的准确性有助于分析多径簇的生灭过程和多径分量的簇统计特性,进而影响信道建模的准确性。文献《AFrameworkforAutomaticClusteringofParametricMIMOChannelDataIncludingPathPowers》中提出了一种基于KMeans算法的改进的簇识别算法KPowerMeans,此算法在计算相互邻近的多径的距离时除了考虑信道参数之间的差异性,还考虑了多径功率的影响,并且引入了衡量聚类效果的参数DB参数来确定多径簇的数目。但该算法没有考虑多径属性的差异性对多径加权因子的影响,并且该算法仍存在严重依赖于对初始聚类中心的选择、容易陷入局部最优解等缺陷。针对这些不足,本专利技术引入了小波变换和信息熵自适应加权技术以改进KPowerMeans聚类算法。
技术实现思路
为克服现有技术的不足,克服KPowerMeans算法对初始聚类中心的敏感性,本专利技术旨在提出根据多径的属性对于分类的不同的贡献度,利用信息熵原理对多径分量距离进行特征加权以提高分类精度。本专利技术采用的技术方案是,改进的多径簇聚类方法,首先采用小波变换的尖峰检测技术代替随机选择,获得稳定的聚类效果;接下来在考虑了多径功率的影响的基础上,引入信息熵原理计算多径属性自适应加权的多径分量距离MCD(MultipathComponentDistance);最后依据不同的MCD将不同的多径分配给不同的簇。本专利技术一个实例中具体步骤是:具体运算步骤如下:(1)使用小波尖峰检测技术寻找K个初始聚类中心位置并令i=1;(2)将不同的多径分量分配给不同的簇,并保存索引值MCD()是用来衡量簇心之间、多径分量和簇心之间的距离;(3)重新计算K个簇中心的位置根据新分配的每一个簇内的多径信息,使得簇内多径的差异性之和D最小:其中,xl表示一条多径分量,存放的是第i次迭代第l条多径分量所属的多径散射簇簇号,存放的是第i次迭代第k个多径散射簇中的多径分量的编号,Pl为第l条多径分量的功率,Lk表示第k个聚类中心的多径分量个数;(4)如果对于所有的K个簇存在即新旧簇中心不再变化,则认为算法已经找到收敛的稳定的解,退出循环返回否则i=i+1,并进入步骤2进行下一次的循环直至收敛。小波基函数用尺度参数α和位移参数β来表示,对信道冲击响应CIR进行小波变换得到:其中ψ(t)是母小波,h(z)为信道冲击响应,选择Daubechies小波来进行多径能量的峰值检测。多径分量距离MCD,即多径分量i与j之间的距离可表示为:wAOA,wAOD,wτ分别表示dAOA,ij,dAOD,ij,dτ,ij属性参数所对应的权值,dAOA,ij和dAOD,ij分别表示到达角、离开角的角度距离MCD值,表示为:dτ,ij为多径时延的多径分量距离,表示为:上式中,τi和τj为第i条多径分量和第j条多径分量的时延,△τmax=maxi,j{|τi-τj|本文档来自技高网
...

【技术保护点】
一种改进的多径簇聚类方法,其特征是,首先采用小波变换的尖峰检测技术代替随机选择,获得稳定的聚类效果;接下来在考虑了多径功率的影响的基础上,引入信息熵原理计算多径属性自适应加权的多径分量距离MCD(Multipath Component Distance);最后依据不同的MCD将不同的多径分配给不同的簇。

【技术特征摘要】
1.一种改进的多径簇聚类方法,其特征是,首先采用小波变换的尖峰检测技术代替随机选择,获得稳定的聚类效果;接下来在考虑了多径功率的影响的基础上,引入信息熵原理计算多径属性自适应加权的多径分量距离MCD(MultipathComponentDistance);最后依据不同的MCD将不同的多...

【专利技术属性】
技术研发人员:杨晋生赵月秋吴旭曌陈为刚
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1