当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于无参数网格的无线电信号数据聚类方法技术

技术编号:20449255 阅读:11 留言:0更新日期:2019-02-27 03:12
本发明专利技术提供了一种基于无参数网格的无线电信号数据聚类方法,根据无线电信号数据集中的数据个数及该批数据的采集时长,计算网格划分值k,将信号数据的中心频率维度划分为k个等长但不相交的网格单元,根据每个信号数据的中心频率值,将其划分至对应的网格单元,并且统计每个网格单元的密度,计算密度阈值,并依据密度阈值对网格单元进行划分,检测相邻的高密网格单元,并将其连接形成聚类;从边界网格单元中提取聚类边界点,并根据边界处理方法将其放至所属聚类。该方法基于无线电信号的数据特征,自动计算网格划分值和密度阈值两个参数,在网格聚类算法高效性的基础上提升了该算法对无线电信号数据聚类的准确性,且减少了分析人员的分析负担。

【技术实现步骤摘要】
一种基于无参数网格的无线电信号数据聚类方法
本专利技术属于计算机信息处理
,涉及到一种基于无参数网格的无线电信号数据聚类方法。
技术介绍
在无线电信号分析领域经常面临的一个问题就是怎么样将属于同一个信号源的信号分选出来并进行后续分析。在信号环境越来越复杂的情况下,传统的信号分选方法已不能满足准确性和高效性的需求。因此,我们需要借助一些智能的机器学习算法对信号进行处理。网格聚类算法的基本思想是将数据维度划分为多个相邻的区间,创建网格单元集合,然后基于网格结构对数据进行聚类。网格聚类算法的优点是它的处理速度很快,其处理时间独立于数据对象的数目,只和量化空间中的每一维的单元数目有关。由此可以看出网格聚类方法非常适合对大规模的无线电信号数据进行聚类分析,可以满足信号聚类的高效性需求。通常情况下,网格聚类算法需要人为确定两个参数——网格划分值和密度阈值,其中网格划分值一般只需要和数据个数保持一致,但密度阈值的取值却需要对数据的分布情况进行详细分析之后才能确定。网格聚类算法聚类结果的正确与否与这两个参数的设定有相当紧密的关系。
技术实现思路
本专利技术所解决的技术问题是,针对现有技术的不足,提供一种基于无参数网格的无线电信号数据聚类方法,根据无线电信号数据的采集时长、信号数据点个数等信息自动计算参数k及Minpts,以解决聚类结果对参数的依赖性问题。本专利技术所提供的技术方案为:一种基于无参数网格的无线电信号数据聚类方法,包括以下步骤:步骤1):以无线电信号数据集中的数据个数除以该批数据的采集时长,得到网格划分值k;步骤2):根据步骤1)得到的网格划分值k,将该批信号数据的中心频率维度划分为k个等长但不相交的网格单元;以信号数据中心频率属性的分布范围除以网格划分值得到单个网格单元的长度,然后根据单个单元的长度和信号数据中心频率属性的分布范围计算得到每个网格单元的中心频率范围;步骤3):根据已知的每个信号数据中心频率值,将其划分至对应的网格单元,并且统计每个网格单元的数据点个数作为网格单元密度值;步骤4):根据已统计的网格单元密度值,计算密度阈值,并依据密度阈值对网格单元进行划分,其中网格密度高于密度阈值的为高密网格,反之为低密网格即边界网格;步骤5):根据步骤4)得到的高密网格集合,将其中相邻的高密网格单元连接起来,形成多个聚类。即假设A高密网格单元与B高密网格单元相邻,C高密网格单元与D高密网格单元相邻,但是AB和CD之间不相邻,那么这里会形成AB和CD两个聚类。步骤6):从边界网格单元中提取聚类边界点,并根据边界处理方法将其放至所属聚类,以该步骤之后所得聚类结果为[c1,c2,...,ct,...,ck],其中1≤t≤k;所述的边界处理方法是对低密网格单元中的所有信号数据即信号点,计算其到所有相邻高密网格单元中心位置的距离,最后将小于阈值的信号点放置相应的聚类。步骤7):通过信号的带宽属性,对信号聚类结果进行噪声检测。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤1)包括以下步骤:步骤1.1):采集包括中心频率、带宽和采集时间这三个属性在内的无线电信号数据,统计无线电信号数据集的信号点个数m,在此=count(j);其中j表示一个信号;步骤1.2):根据信号数据的采集时间t(j),计算该信号数据集的采集时长t=Max(t(j))-Min(t(j));步骤1.3):根据步骤1.1)和步骤1.2)得到的信号点个数m和采集时长t,计算得出网格划分值k,其中k的计算公式为k=m/t。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤2)具体步骤如下:步骤2.1):以信号数据中心频率属性的分布范围为[startfreq,endfreq],则单个网格单元的长度δ=(endfreq-startfreq)/k;步骤2.2):在步骤2.1)的基础上,以i来表示任意一个网格单元,则中心频率范围的计算公式为freq(i)=(startfreq+(i-1)*δ,startfreq+i*δ],其中1≤i≤n,n为网格单元的全部数量,依次计算得到所有网格单元的中心频率范围。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤3)具体步骤如下:步骤3.1):根据每个信号数据的中心频率值,将其划分至包含有该中心频率值的网格单元中,以j表示一个信号数据,则网格单元i中的信号数据为一个集合,表示为point(i)={j|f(j)∈freq(i)},其中1≤j≤m,m为信号数据个数,f(j)为第j个信号数据的频率属性;步骤3.2):在步骤3.1)的基础上对每个网格单元中的信号个数进行统计来作为网格单元密度值,计算公式为size(i)=count(point(i))。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤4)具体步骤如下:表示密度步骤4.1):根据网格单元密度值,查找具有最多数据点的网格单元MaxCount=Max(size(i)),并记录其数据点个数;步骤4.2):统计非空的网格单元个数Gn。:首先,统计非空网格单元的集合U={i|size(i)>0},则Gn=count(U);步骤4.3):根据信号数据个数m和非空单元格个数Gn,计算一个中间值C=m/Gn;步骤4.4):令A1=MaxCount,计算An=An-1-H,其中1<n≤H。;H取值必须大于1,如果计算得出的H值小于等于1,则令H其取值为2;步骤4.5):根据步骤4.4)所得结果,计算Bm=(Am+Am+1)/2,其中1≤m≤H-1;步骤4.6):计算密度阈值步骤4.7):通过对比每个网格单元密度和密度阈值之间的大小,计算得到高密网格集合HighDenGrid={i|size(i)>Minpts},同时得到低密网格集合LowDenGrid={i|size(i)≤Minpts}。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤5)具体步骤如下:步骤5.1):基于所得的高密网格集合,寻找所有出现相邻情况的高密网格单元,并将这些高密网格单元连接起来形成聚类。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤6)具体步骤如下:步骤6.1):对于低密网格单元lowi∈LowDenGrid,统计其相邻的高密网格单元集合步骤6.2):通过计算集合中每个网格单元中所有信号中心频率属性的均值,来作为网格单元的中心位置c(i),即网格单元内所有信号的数据中心,其中步骤6.3):对于每个属于低密网格单元lowi的信号点p,计算其到所有相邻高密网格单元中心位置的距离,计算公式为步骤6.4):根据步骤6.3)所得内容,计算信号点p到每个相邻高密网格单元数据中心距离的最小值步骤6.5):设定阈值ε,默认取值δ/2,即为网格单元宽度的一半,如果则信号点p为边界点,需将该数据点加入到对应的高密网格单元所属聚类中,反之点p为噪声点;步骤6.6):以经过上述所有步骤之后,所得聚类结果为{c1,c2,...,ct,...,ck},其中1≤t≤k。所述的一种基于无参数网格的无线电信号数据聚类方法,所述步骤7)具体如下:步骤7.1):以聚类ct中包含nt条数据步骤7.2):对于属于聚类ct的所有数据点pi,计算该点到聚类ct中其他所有数据点的距离之和,其计算本文档来自技高网...

【技术保护点】
1.一种基于无参数网格的无线电信号数据聚类方法,其特征在于,包括以下步骤:步骤1):以无线电信号数据集中的数据个数除以该批数据的采集时长,得到网格划分值k;步骤2):根据步骤1)得到的网格划分值k,将该批信号数据的中心频率维度划分为k个等长但不相交的网格单元;以信号数据中心频率属性的分布范围除以网格划分值得到单个网格单元的长度,然后根据单个单元的长度和信号数据中心频率属性的分布范围计算得到每个网格单元的中心频率范围;步骤3):根据已知的每个信号数据中心频率值,将其划分至对应的网格单元,并且统计每个网格单元的数据点个数作为网格单元密度值;步骤4):根据已统计的网格单元密度值,计算密度阈值,并依据密度阈值对网格单元进行划分,其中网格密度高于密度阈值的为高密网格,反之为低密网格即边界网格;步骤5):根据步骤4)得到的高密网格集合,将其中相邻的高密网格单元连接起来,形成多个聚类;步骤6):从边界网格单元中提取聚类边界点,并根据边界处理方法将其放至所属聚类,以该步骤之后所得聚类结果为[c1,c2,...,ct,...,ck],其中1≤t≤k;所述的边界处理方法是对低密网格单元中的所有信号数据即信号点,计算其到所有相邻高密网格单元中心位置的距离,最后将小于阈值的信号点放置相应的聚类;步骤7):通过信号的带宽属性,对信号聚类结果进行噪声检测。...

【技术特征摘要】
1.一种基于无参数网格的无线电信号数据聚类方法,其特征在于,包括以下步骤:步骤1):以无线电信号数据集中的数据个数除以该批数据的采集时长,得到网格划分值k;步骤2):根据步骤1)得到的网格划分值k,将该批信号数据的中心频率维度划分为k个等长但不相交的网格单元;以信号数据中心频率属性的分布范围除以网格划分值得到单个网格单元的长度,然后根据单个单元的长度和信号数据中心频率属性的分布范围计算得到每个网格单元的中心频率范围;步骤3):根据已知的每个信号数据中心频率值,将其划分至对应的网格单元,并且统计每个网格单元的数据点个数作为网格单元密度值;步骤4):根据已统计的网格单元密度值,计算密度阈值,并依据密度阈值对网格单元进行划分,其中网格密度高于密度阈值的为高密网格,反之为低密网格即边界网格;步骤5):根据步骤4)得到的高密网格集合,将其中相邻的高密网格单元连接起来,形成多个聚类;步骤6):从边界网格单元中提取聚类边界点,并根据边界处理方法将其放至所属聚类,以该步骤之后所得聚类结果为[c1,c2,...,ct,...,ck],其中1≤t≤k;所述的边界处理方法是对低密网格单元中的所有信号数据即信号点,计算其到所有相邻高密网格单元中心位置的距离,最后将小于阈值的信号点放置相应的聚类;步骤7):通过信号的带宽属性,对信号聚类结果进行噪声检测。2.根据权利要求1所述的一种基于无参数网格的无线电信号数据聚类方法,其特征在于,所述步骤1)包括以下步骤:步骤1.1):采集包括中心频率、带宽和采集时间这三个属性在内的无线电信号数据,统计无线电信号数据集的信号点个数m,在此=count(j);其中j表示一个信号;步骤1.2):根据信号数据的采集时间t(j),计算该信号数据集的采集时长t=Max(t(j))-Min(t(j));步骤1.3):根据步骤1.1)和步骤1.2)得到的信号点个数m和采集时长t,计算得出网格划分值k,其中k的计算公式为k=m/t。3.根据权利要求1所述的一种基于无参数网格的无线电信号数据聚类方法,其特征在于,所述步骤2)具体步骤如下:步骤2.1):以信号数据中心频率属性的分布范围为[startfreq,endfreq],则单个网格单元的长度δ=(endfreq-startfreq)/k;步骤2.2):在步骤2.1)的基础上,以i来表示任意一个网格单元,则中心频率范围的计算公式为freq(i)=(startfreq+(i-1)*δ,startfreq+i*δ],其中1≤i≤n,n为网格单元的全部数量,依次计算得到所有网格单元的中心频率范围。4.根据权利要求1所述的一种基于无参数网格的无线电信号数据聚类方法,其特征在于,所述步骤3)具体步骤如下:步骤3.1):根据每个信号数据的中心频率值,将其划分至包含有该中心频率值的网格单元中,以j表示一个信号数据,则网格单元i中的信号数据为一个集合,表示为point(i)={j|f(j)∈freq(i)},其中1≤j≤m,m为信号数据个数,f(j)为第j个信号数据的频率属性;步骤3.2):在步骤3.1)的基础上对每个网格单元中的信号个数进行统计来作为...

【专利技术属性】
技术研发人员:赵颖张蓉罗晓波周芳芳
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1