一种面向众包的强化协同训练室内定位方法技术

技术编号：38319799 阅读：21 留言：0更新日期：2023-07-29 09:01

本发明专利技术属于室内定位技术领域，具体的说是涉及一种面向众包的强化协同训练室内定位方法。本发明专利技术提出在协同训练中引入强化学习作为候选集样本选择的策略工具，因为DQN算法是一种离线策略算法，需要先对DQN网络进行训练再用于候选集样本的选择。DQN算法通过与环境的充分互动探索可以让网络对数据空间有整体的感知，这种策略相比于传统的固定策略更能防止局部最优解的情况发生。局部最优解的情况发生。局部最优解的情况发生。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向众包的强化协同训练室内定位方法

[0001]本专利技术属于室内定位
，具体的说是涉及一种面向众包的强化协同训练室内定位方法。

技术介绍

[0002]随着近些年智能终端和物联网的发展，室内的定位信息可以为用户提供更多个性化的服务，相关研究得到的越来越多的关注。基于无线信号RSSI的指纹室内定位技术，更是由于其不受限于多径效应和非视距遮挡等优点被广泛的关注。基于信号强度RSSI的指纹室内定位技术通常需要事先构建带标签的指纹数据库，需要对环境划分网格后并对采集到的RSSI指纹信息人工打上标签，这一过程需要花费的时间成本和人力成本是巨大的。随着半监督和无监督技术的发展，人们尝试用少量的带标签数据配合大量众包无标签数据构建指纹数据库。文献“Zhou Z H,Li M.Semi
‑
Supervised Regression with Co
‑
Training[C]IJCAI
‑
05,Proceedings of the Nineteenth International Joint Conference on Artificial Intelligence,Edinburgh,Scotland,UK,July 30
‑
August 5,2005.Morgan Kaufmann Publishers Inc.2005”中的协同训练就是一种使用广泛的半监督学习方法，该方法通过在数据中建立两个不同的分类器，利用两个分类器来“互补”地为无标签数据打上标签...

【技术保护点】

【技术特征摘要】
1.一种面向众包的强化协同训练室内定位方法，其特征在于，包括以下步骤：S1、在目标定位环境采集带标签的指纹数据集L，通过众包的方式采集无标签的指纹数据集U，其中L＜U；从L中选择出测试集T；S2、训练决策网络，具体包括：S21、构建分类器C，分类器C的输入为指纹数据，输出为估计的坐标值；S22、采用L的数据初步训练分类器，得到定位模型；S23、利用定位模型为无标签的指纹数据打上标签得到候选样本，将候选样本分为N组得到K组候选集：K＝[k1，k2...k
N
]，将每一组候选集中第一个被划分进的候选样本定义为质心S
i
；S24、构建DQN网络，DQN网络的输入为当前观测到的状态s
t
，该状态表示一个候选集分组中的质心在分类器分类结果中的置信度：s
t
＝[P1，P2，P2...P
N
]
t
DQN网络的输出为1
×
N的向量，表示选择每个分组得到的Q值，根据输出选择Q最大的编号，作为此轮决策的动作a
t
，其对应的批次的候选集作为加入指纹库的候选集S25、用分类器C在测试集T中完成一轮测试，并记录下分类器的定位精度Acc
C
(T)；用L
′
完成分类器的更新得到C
′
并得到Acc
C
′

【专利技术属性】
技术研发人员：郭贤生，张明恒，段林甫，司皓楠，钱博诚，纪文静，
申请(专利权)人：四川混构定位科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人