基于异步优势动作评价的RFID室内定位算法制造技术

技术编号：21142140 阅读：25 留言：0更新日期：2019-05-18 05:27

本发明专利技术涉及一种基于异步优势动作评价的RFID室内定位算法，将定位目标的信号强度值作为输入数据，建立全局动作网络和全局评价网络，建立多个线程子动作网络和线程子评价网络。多个线程并行学习，互不干扰，再将学习到的经验异步更新到全局网络，全局网络最后输出参考标签的具体位置，得到异步优势动作评价定位模型；当有待测目标进入检测区域时，定位模型自动预测出目标具体位置。由于室内定位动作是连续的，异步优势动作评价方法与RFID室内定位相结合，很好的解决了定位连续性问题，有效解决了室内定位模型训练时间长，定位精度低以及环境噪声影响等问题，特别适用于定位目标数量庞大的情况。

全部详细技术资料下载

【技术实现步骤摘要】
基于异步优势动作评价的RFID室内定位算法
本专利技术涉及无线识别中的室内定位技术，具体地说是一种基于异步优势动作评价的RFID室内定位算法。
技术介绍
近年来，随着人们对空间位置信息的需求不断增大，定位技术得到越来越多人的关注，尤其是基于GPS定位系统、移动互联网、智能手机等技术提供位置信息的服务，给人们的生活带来了极大的便利。在没有障碍物的室外，GPS的技术已经相对成熟，应用比较广泛。但是由于建筑物、植物、墙壁等障碍物能够将GPS信号减弱或是分散信号，造成GPS无法定位。因此，定位系统也从室外定位发展到室内定位。现有的室内定位方法主要有基于测距和非测距两类，基于测距定位的方法有基于信号到达时间(TOA)测距法，基于信号到达时间差(TDOA)测距法，基于信号到达角度(AOA)测距法；基于非测距定位的方法有基于信号到达强度(RSSI)测距法。本专利技术主要是基于信号到达强度(RSSI)测距方法。近年来，一些学者将机器学习或强化学习引入室内定位中，如K最邻近算法，通过计算距离的度量作为相似性度量。常用于指纹匹配阶段，在定位时利用KNN算法计算目标值与指纹库中样本值之间的欧式距离，按距离大小排序，选取前K个最小距离的参考点，然后以这个K个参考点的平均位置作为目标估计的位置。但是该算法需要遍历指纹库中所有样本的数据，因此会有较大的计算量。支持向量机SVM方法，利用SVM分类模型定位，将定位问题看做分类问题。前期通过数据训练分类模型，然后目标将目标样本数据输入训练好的分类模型中，对应输出一个最优分类结果，再利用具体的估计方法得出目标的位置。但是该算法计算成本较大，...

【技术保护点】
1.基于异步优势动作评价的RFID室内定位算法，包括以下步骤：步骤1)对读写区域内的参考标签的信号强度值进行采集，获得原始信号强度(RSSI)数据；步骤2)初始化：根据初始动作at，获得初始状态st并预处理得到相应的特征输入f(RSSItotal|st)，建立全局动作网络ψ(at|st；θψ)、全局评价网络V(st；θv)以及线程子动作网络ψ(at|st；θψ′)、线程子评价网络V(st；θv′)；初始化全局动作网络参数θψ＝0、全局评价网络参数θv＝0、线程子动作网络参数θψ′＝0、线程子评价网络参数θv′＝0、全局动作网络梯度dθψ＝0、全局评价网络梯度dθv＝0；步骤3)训练异步优势动作评价定位模型：执行线程子动作网络中的动作，并行训练学习并计算每个线程子评价网络的价值，计算线程总回报值R，累加线程子动作网络梯度，即总和为全局动作网络梯度dθψ，累加线程子评价网络梯度，即总和为全局动作网络梯度dθv，再对全局动作网络参数θψ和全局评价网络参数θv进行异步更新，使其跟踪学习，输出参考标签对应的具体位置，最终得到异步优势动作评价定位模型；步骤4)精准定位：当携带有RFID标签的待定位...

【技术特征摘要】
1.基于异步优势动作评价的RFID室内定位算法，包括以下步骤：步骤1)对读写区域内的参考标签的信号强度值进行采集，获得原始信号强度(RSSI)数据；步骤2)初始化：根据初始动作at，获得初始状态st并预处理得到相应的特征输入f(RSSItotal|st)，建立全局动作网络ψ(at|st；θψ)、全局评价网络V(st；θv)以及线程子动作网络ψ(at|st；θψ′)、线程子评价网络V(st；θv′)；初始化全局动作网络参数θψ＝0、全局评价网络参数θv＝0、线程子动作网络参数θψ′＝0、线程子评价网络参数θv′＝0、全局动作网络梯度dθψ＝0、全局评价网络梯度dθv＝0；步骤3)训练异步优势动作评价定位模型：执行线程子动作网络中的动作，并行训练学习并计算每个线程子评价网络的价值，计算线程总回报值R，累加线程子动作网络梯度，即总和为全局动作网络梯度dθψ，累加线程子评价网络梯度，即总和为全局动作网络梯度dθv，再对全局动作网络参数θψ和全局评价网络参数θv进行异步更新，使其跟踪学习，输出参考标签对应的具体位置，最终得到异步优势动作评价定位模型；步骤4)精准定位：当携带有RFID标签的待定位目标进入检测区域时，读写器获取目标信息及信号强度值，并将这些数据输入到训练完成的异步优势动作评价定位模型中，定位模型准确识别数据并输出待定位目标的具体位置。2.根据权利要求1所述的基于异步优势动作评价的RFID室内定位算法，其特征在于，所述步骤2)中的特征输入使用动作决策函数来表示，具体表示如下：其中，RSSItotal表示在状态st下获取的所有RSSI值，σ为标准差，表示为：N表示标签总数，RSSIi表示第i个RSSI值，B表示平均值：3.根据权利要求1所述的基于异步优势动作评价的RFID室内定位算法，其特征在于，所述步骤2)的初始化具体包括：建立全局动作网络ψ(at|st；θψ)，表示为：其中，ω(st，θψ)、τ(st，θψ)为动作网络输出参数，表示为：ω(st，θψ)＝θψTf(RSSItotal|st)，τ(st，θψ)＝exp(θψTf(RSSItotal|st))...

【专利技术属性】
技术研发人员：郑嘉利，李丽，
申请(专利权)人：广西大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人