一种基于DDPG算法获得最优资源分配以提升定位精度的方法技术

技术编号：30556493 阅读：31 留言：0更新日期：2021-10-30 13:38

本发明专利技术公开了一种基于DDPG算法获得最优资源分配以提升定位精度的方法，目的是在尽可能短的时间内获得最优的分配方案以提高定位精度，该方法主要包括两个部分：第一部分主要执行的操作是测距，而第二部分又由两个相关的操作组成

全部详细技术资料下载

【技术实现步骤摘要】
一种基于DDPG算法获得最优资源分配以提升定位精度的方法

[0001]本专利技术涉及无线定位
，尤其是涉及一种基于DDPG算法获得最优资源分配以提升定位精度的方法。

技术介绍

[0002]随着无线通信技术的快速发展，基于位置信息的服务和应用被广泛研究。通过使用GNSS，人们在户外可以达到米级的精度。但是由于卫星信号很有可能受到障碍物阻挡，这就使得GNSS可能在室内、城市街道或茂密的森林环境中失效。而在这样的对GNSS有挑战的环境中，无线网络定位是一个很有前途的替代方案。
[0003]常见的无线定位网络使用的定位方法主要可以分为基于测距和不基于测距的定位方法，其中不基于测距的定位方法主要是指纹定位法，该方法需要先建立一个指纹数据库，而基于测距的定位方法主要包括到达时间(TOA)，到达时间差(TDOA)等方法，基于测距的方法无需建立指纹库且定位精度较高。
[0004]传统的无线定位网络主要采用的是非协同定位，它只允许位置已知的锚节点和位置未知的代理节点之间进行通信，而使用TOA进行定位时一般需要代理节点至少和三种不同的锚节点进行测距来获得自身位置，要想获得较高的定位精度就要求锚节点部署的密度能足够大，这就不可避免的提高了成本。此外，当锚节点和代理节点之间的通信距离较大时，容易出现中断通信的问题，不能保证通信的连续性，从而降低定位精度。

技术实现思路

[0005]有鉴于此，本专利技术的目的在于提供一种基于DDPG算法获得最优资源分配以提升定位精度的方法，主要采用的是基于测距的定位方法中...

【技术保护点】

【技术特征摘要】
1.一种基于DDPG算法获得最优资源分配以提升定位精度的方法，主要利用DDPG算法来分配带宽和功率，其特征在于，所述方法包括以下步骤：步骤一、获取测距信息，估计代理节点位置：假设无线定位网络中具有N
a
个代理节点和N
b
个锚节点，则整个网络可以使用的总带宽和总功率分别为B
total
，P
total
，无线定位网络中的各个节点根据带宽和功率的分配方案测量自身和其他节点之间的距离，利用TOA定位方法来确定代理节点的具体位置；步骤二、获取DDPG网络状态空间：所述DDPG算法的状态空间是指各个节点之间的距离以及信道参数，通过步骤一中的测距操作获得各个节点之间的距离信息，通过信道估计获得信道参数；步骤三、开始网络训练：采用强化学习中的DDPG算法以获得最优的资源分配方案，采用均方误差下界SPEB来衡量带宽和功率分配方案的优异度，单个代理节点的SPEB可表示为其中，J
e
(p
i
)是代理节点p
i
的等价费舍尔信息矩阵EFIM，是p
i
的估计值，协同定位网络的全局EFIM可表示为代理节点i从所有的N
b
个锚节点处获得的测距信息为个锚节点处获得的测距信息为从代理节点k处获得的测距信息为节点k处获得的测距信息为其中其中表示从节点i到节点k的角度值，λ
ik
是指测距信息密度，表示为其中ξ
ik
是指代理节点i和节点k之间测距信道参数，d
ik
代表的是代理节点i和节点k之间距离，P
k
和B
k
分别表示节点k分配到的功率和带宽资源，当协同定位网络的全局EFIM中的C
ik
＝0便可得到非协同定位网络的EFIM，再对非协同定位网络的EFIM求逆取迹便可得到整个网络的SPEB，整个无线定位网络的SPEB值可以表达为步骤四、在线阶段位置的预测：在线测试阶段，代理节点通过均匀分配的方案获得代理节点和其他节点之间的距离信息，再通过TOA定位方法估算出代理节点的位置信息，根据代理节点的位置信息可以获得步骤二中所述的状态空间，将获得的状态空间输入到步骤三里训练后的网络中，便可得到最
优的资源分配方案，利用输出的资源分配方案再进行测距进而获得最终的位置估计。2.根据权利要求1所述的一种基于DDPG算法获得最优资源分配以提升定位精度的方法，其特征在于，所述步骤一中：无线定位网络中的各个节点初始的分配方案是均匀分配，即每个节点分配到的资源是相同的，节点i分配到的带宽资源节点i分配到的功率资源其中i∈{1,2,
…
,N
a
+N
...

【专利技术属性】
技术研发人员：向晨路，张舜卿，徐树公，
申请(专利权)人：苏州云享阁智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人