基于随机森林的超宽带非视距鉴别方法技术

技术编号:17008694 阅读:92 留言:0更新日期:2018-01-11 04:42
本发明专利技术涉及一种基于随机森林的超宽带非视距鉴别方法,包括如下步骤:步骤(1):采集不同环境下超宽带数据,获得原始数据,根据真实的距离信息标注类别标签;并分别随机抽取若干个数据作为训练集和测试集;步骤(2):基于所测超宽带信号特征,进行特征重构;步骤(3):随机抽取基于所重构的特征,建立二分递归决策树;步骤(4):有放回的选择所述步骤(1)中的训练集中的样本,建立CART决策树模型;步骤(5):从训练集中有放回的抽取M组数据作为训练样本,利用所述步骤(4)建立的CART决策树模型进行分类判断,重复此过程N次,N≥30,从而形成随机森林模型。可在线实时有效的鉴别超宽带数据是否为非视距,实用效果非常好。

【技术实现步骤摘要】
基于随机森林的超宽带非视距鉴别方法
本专利技术涉及机器学习以及室内定位领域,尤其涉及一种基于随机森林的超宽带非视距鉴别方法。
技术介绍
超宽带(UltraWideBand,UWB)技术是目前备受关注的一种新型短距离高速率无线通信技术。2002年2月,美国联邦通信委员会(FCC)规定准许UWB技术在民用领域使用,但发送功率低于-41.3dBm/MHz,可将3.1GHz-10.6GHz的频带用于对地下和隔墙之物进行扫描的成像系统、汽车防撞雷达及在家电终端和便携式终端间进行测距和无线数据通信,还可用于室内定位技术。在脉冲无线电超宽带定位方法中,TDOA方法因其硬件要求较低,定位精度较高的特性得到大规模应用。一般做法是通过对UWB多径信号中直射路径(Directpath)进行时延轨迹来获得时间戳信息,并进而得到TDOA信息。对于视距环境(Line-of-sight,LOS),直射路径最先到达并且能量最强,只要保证足够的接收信噪比,就能获得较准确的时间戳估计。但是对于非视距环境(NLOS),由于存在各种障碍物,传播环境变得复杂。首径信号在穿透障碍物时经历衰减,并且会引入附加时延。反射信号在此环境中变得更加复杂。因此NLOS环境下的UWB定位是应用中的难点问题。目前对NLOS鉴别的研究主要有以下几种方法:1,根据接收信号强度的变化来判断LOS/NLOS状态,该方法鲁棒性不强,易受噪声影响。2,通过分析UWB多径信道幅度和时延的统计特性来进行状态判断,该方法能获得较好的鉴别效果,但是鉴别特征选取的有效性需要获得准确的信道特征,而这在实际中是很难获取到的。3,在定位过程中,通过残差加权的方法,减轻非视距造成的影响。该方法所需冗余基站较多,并且不能完全消除非视距的影响,只能部分减弱。综上所述,目前仍然没有一种特别有效并且实用的方法来鉴别超宽带数据是否受非视距影响。
技术实现思路
本专利技术要解决的技术问题是,提供一种有效并且实用的方法来鉴别超宽带数据是否为非视距的基于随机森林的超宽带非视距鉴别方法。为解决上述技术问题,本专利技术采用的技术方案是,该基于随机森林的超宽带非视距鉴别方法,包括如下步骤:步骤(1):采集不同环境下超宽带数据,获得原始数据,根据真实的距离信息标注类别标签;并分别随机抽取若干个数据作为训练集和测试集;步骤(2):基于所测超宽带信号特征,进行特征重构;步骤(3):随机抽取基于所重构的特征,建立二分递归决策树;步骤(4):有放回的选择所述步骤(1)中的训练集中的样本,建立CART决策树模型;步骤(5):从训练集中有放回的抽取M组数据作为训练样本,利用所述步骤(4)建立的CART决策树模型进行分类判断,重复此过程N次,N≥30,从而形成随机森林模型。采用上述技术方案,通过在训练样本和特征选择两个环节引入随机抽取,使得随机森林泛化能力增强,不至于陷于过拟合,通过大量数据的离线训练得到模型,之后利用步骤(5)建立的随机森林模型即可在线实时有效的鉴别超宽带数据是否为非视距,实用效果非常好。现有鉴别非视距的方法要么鲁棒性不强,如基于信号强度的方法,要么需要非常详细的信道特征信息并采用统计的方法做出判断,实际可操作性不强;而基于随机森林的非视距鉴别可以采用先离线训练,后在线判断的方法,判断准确度高,实施简单;随机森林广泛应用于医学,图像等领域,还没有应用于超宽带数据非视距鉴别的,本专利技术拓展了随机森林的应用领域。其中步骤(1)中的随机抽取若干个数据作为训练集和测试集;和步骤(2)中的基于所测超宽带信号特征,进行特征重构,步骤顺序可以互换,即可以先对全部原始数据进行特征重构,再随机抽取若干个数据作为训练集和测试集,不影响本专利技术方法的最后结果。优选的,在所述步骤(1)中,采集不同环境下超宽带数据,选取一个基站作为主基站,那么就有ri,1=ri-r1,其中,ri是标签到第i个基站的距离,r1是标签到主基站的距离;ri,1即是标签到从基站和到主基站的距离差,即距差;根据采集得到数据获得距差,与真实距差对比如果偏差小于100cm,即为正常数据,否则即为非视距影响下产生偏差的数据。优选的,在所述步骤(2)中,对所测超宽带信号特征进行特征重构的方法如下:IDiff=|firstpathposition–peakpathposition|其中firstpathposition代表首径索引位置;peakpathposition代表信号峰值索引位置;IDiff代表首径索引位置与信号峰值索引位置的差值的绝对值;MC=fpAmpl/pkAmp;其中fpAmpl=max{fpAmpl1,fpAmpl2,fpAmpl3};fpAmpl1,fpAmpl2,fpAmpl3分别是首径索引位置处抽头3,抽头2,抽头1所检测到的信号幅度;pkAmp代表信号峰值;fpAmpl代表首径索引位置处三个抽头的最大值;MC代表首径索引位置处三个抽头的最大值与信号峰值的比值;FNR=median{fpAmpl1,fpAmpl2,fpAmpl3}/stdnoise;其中,stdnoise代表检测到的信号噪声水平;FNR代表首径索引位置处三个抽头的中值与信号噪声水平的比值;FF1=fpAmpl2/fpAmpl1;FF2=fpAmpl2/fpAmpl3;Noise=std_noise;FF1代表首径索引位置处抽头2与抽头1处信号幅值的比值,FF2代表首径索引位置处抽头2与抽头3处信号幅值的比值,Noise代表信号噪声水平。优选的,所述步骤(3)中,建立二分递归决策树的方法为:从所述训练集中随机抽取M个数据样本,从每个样本中随机抽取4维特征,sk代表第k维特征,建立二分递归分类决策树;选择4维特征在所有值区间最小基尼增益的节点划分决策树,假设特征sk在点K处是分裂节点,那么特征sk小于此节点的即被分到左边,大于此节点的即被分到右边,递归的对左右节点进行划分,就产生了二分递归分类决策树。优选的,在所述步骤(5)中,重复此过程100次,从而形成随机森林模型。优选的,在所述步骤(5)形成的随机森林模型中输入所述步骤(1)中测试集中的数据,判别该超宽带数据是否为非视距,具体的方法为,步骤(5-1),输入测试数据,对输入数据的特征进行重构;步骤(5-2),从随机森林模型当前树的根节点开始进行判断,遍历整个CART树,从而做出预测;步骤(5-3),选择下一棵决策树,重复执行所述步骤(5-2),直到所有CART决策树都输出了预测类别值,输出类别数最多的一类作为结果。附图说明下面结合附图和具体实施方式对本专利技术做进一步的说明,本专利技术的上述和/或其他方面的优点将会变得更加清楚。图1为本专利技术基于随机森林的超宽带非视距鉴别方法的流程图;图2是未经过非视距鉴别的原始数据图(真实距差677cm);图3是经过非视距鉴别后的数据图(真实距差677cm)。具体实施方式本专利技术通过建立随机森林模型,将样本数据分为正常数据和受非视距影响的数据两类。通过离线训练获得模型,在线实时鉴别非视距。本专利技术的具体流程如图1所示。本专利技术的基于随机森林的超宽带非视距鉴别方法,包括如下步骤:步骤(1):采集不同环境下超宽带数据,获得原始数据,根据真实的距离信息标注类别标签;并分别随机抽取若干个数据作为训练集和测试集;步骤(2):基本文档来自技高网
...
基于随机森林的超宽带非视距鉴别方法

【技术保护点】
一种基于随机森林的超宽带非视距鉴别方法,其特征在于,包括如下步骤:步骤(1):采集不同环境下超宽带数据,获得原始数据,根据真实的距离信息标注类别标签;并分别随机抽取若干个数据作为训练集和测试集;步骤(2):基于所测超宽带信号特征,进行特征重构;步骤(3):随机抽取基于所重构的特征,建立二分递归决策树;步骤(4):有放回的选择所述步骤(1)中的训练集中的样本,建立CART决策树模型;步骤(5):从训练集中有放回的抽取M组数据作为训练样本,利用所述步骤(4)建立的CART决策树模型进行分类判断,重复此过程N次,N≥30,从而形成随机森林模型。

【技术特征摘要】
1.一种基于随机森林的超宽带非视距鉴别方法,其特征在于,包括如下步骤:步骤(1):采集不同环境下超宽带数据,获得原始数据,根据真实的距离信息标注类别标签;并分别随机抽取若干个数据作为训练集和测试集;步骤(2):基于所测超宽带信号特征,进行特征重构;步骤(3):随机抽取基于所重构的特征,建立二分递归决策树;步骤(4):有放回的选择所述步骤(1)中的训练集中的样本,建立CART决策树模型;步骤(5):从训练集中有放回的抽取M组数据作为训练样本,利用所述步骤(4)建立的CART决策树模型进行分类判断,重复此过程N次,N≥30,从而形成随机森林模型。2.根据权利要求1所述的基于随机森林的超宽带非视距鉴别方法,其特征在于,在所述步骤(1)中,采集不同环境下超宽带数据,选取一个基站作为主基站,那么就有ri,1=ri-r1,其中,ri是标签到第i个基站的距离,r1是标签到主基站的距离;ri,1即是标签到从基站和到主基站的距离差,即距差;根据采集得到数据获得距差,与真实距差对比如果偏差小于100cm,即为正常数据,否则即为非视距影响下产生偏差的数据。3.根据权利要求1所述的基于随机森林的超宽带非视距鉴别方法,其特征在于,在所述步骤(2)中,对所测超宽带信号特征进行特征重构的方法如下:IDiff=|firstpathposition–peakpathposition|其中firstpathposition代表首径索引位置;peakpathposition代表信号峰值索引位置;IDiff代表首径索引位置与信号峰值索引位置的差值的绝对值;MC=fpAmpl/pkAmp;其中fpAmpl=max{fpAmpl1,fpAmpl2,fpAmpl3};fpAmpl1,fpAmpl2,fpAmpl3分别是首径索引位置处抽头3,抽头2,抽头1所检测到的信号幅度;pkAmp代表信号峰值;fp...

【专利技术属性】
技术研发人员:许连杰何雪锋袁子伦信金龙李威赵真真
申请(专利权)人:广州中海达定位技术有限公司郑州联睿电子科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1