【技术实现步骤摘要】
一种基于众包的定位指纹库更新方法及装置
[0001]本专利技术涉及数据处理
,尤其是一种基于众包的定位指纹库更新方法及装置。
技术介绍
[0002]目前的全球定位系统可以提供较高精度的室外定位信息,但当定位目标活动到室内区域,这些卫星定位技术无法再提供高精度的位置信息,为满足大量基于室内位置的服务,如人员逃生,室内定位技术应运而生。
[0003]如今的室内人员定位技术普遍基于蓝牙或WIFI技术,通过在目标区域设置采样点,并收集各AP接入点的接收信号强度(Received Signal Strength,RSS),到达时间(Time of Arrival,ToA)值作为特征,把当前位置作为标签,构建大规模的位置指纹库,用于后期定位模型的训练和人员位置的匹配。但这种方法需要大量的现场勘测数据构建指纹数据库,目前使用人工勘测构建指纹数据库的过程中需要专业人士携带专用设备对目标区域进行逐一感知,成本较高,耗时较长。同时,由于室内环境多变,指纹库需要定期更新,人工数据采集需要定期进行,成本巨大。
[0004]一个 ...
【技术保护点】
【技术特征摘要】
1.一种基于众包的定位指纹库更新方法,其特征在于,包括:初始化经验回放池;其中,所述经验回放池用于保存用户与平台之间的交易经验信息;为每个用户初始化Online Critic网络和Online Actor网络;利用所述Online Actor网络为每个用户生成自身的报价;根据每个用户自身的报价,由每个用户同时执行动作,计算出每个用户购买的感知时间;获取每个用户的交易信息以及奖励信息;将所述交易信息以及所述奖励信息添加到经验回放池;计算所述Online Critic网络的损失;利用梯度下降法更新所述Online Critic网络,使用梯度上升法更新Online Actor网络,并更新Target Critic网络和Target Actor网络的参数;当训练次数达到预设值后停止训练,得到训练结果;根据所述训练结果进行指纹数据库更新。2.根据权利要求1所述的一种基于众包的定位指纹库更新方法,其特征在于,所述每个用户生成自身的报价的计算公式为:其中,代表每个用户i在当前时刻t生成自身的报价;代表Online Actor网络以为观测,以为参数的输出;μ
i
代表Online Actor网络的输出;代表每个用户i根据自身在当前时刻t的观测信息;代表Online Actor网络的参数;N
t
代表添加的探索噪声。3.根据权利要求1所述的一种基于众包的定位指纹库更新方法,其特征在于,所述获取每个用户的交易信息以及奖励信息,包括:获取所有用户在各个时刻之前的交易记录信息;获取所有用户选择的动作信息;获取所有用户获取的奖励信息;获取所有用户在各个时刻之后的最新交易记录信息。4.根据权利要求1所述的一种基于众包的定位指纹库更新方法,其特征在于,所述计算所述Online Critic网络的损失这一步骤中,所述损失的计算公式为:其中,L
i
代表用户i的critic损失;B代表每次训练采样的批量大小;代表利用时序差分法计算的目标Q值;代表当前网络以o
b
,a
b
为输入,以为参数的Q值输出;Q
i
代表critic网络的输出;o
b
代表样本b的观测;a
b
代表样本b中的动作;代表online critic网络的参数。5.根据权利要求1所述的一种基于众包的定位指纹库更新方法,其特征在于,所述利用梯度下降法更新所述Online Critic网络,使用梯度上升法更新Online Actor网络,并更新Target Critic网络和Target Actor网络的参数,包括:
所述Online Critic网络的梯度的表达式为:其中,代表Q值对online critic参数θ
Q
的梯度;B代表每次训练采样的批量大小;b代表每次训练采样中的第b条样本;代表利用时序差分法计算的目标Q值;Q(o
b
,a
b
|θ
...
【专利技术属性】
技术研发人员:张秀林,吕劲,梁海波,张林,武永锋,易涤非,王庆瑞,冯猛,范志锋,张湘跃,陈土顺,王斌,杨贵光,杨欣欣,宾志湘,林梓淇,彭卫芳,
申请(专利权)人:中海石油中国有限公司海南分公司中海油广东安全健康科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。