【技术实现步骤摘要】
一种RFID标签接入的多阅读器防碰撞方法、装置和设备
本专利技术涉及事件检测
,尤其涉及一种RFID标签接入的多阅读器防碰撞方法、装置和设备。
技术介绍
射频识别技术(RadioFrequencyIdentification,RFID)是一种非接触式的自动识别技术,主要是利用无线射频方式对记录媒体进行读写,从而达到识别目标和数据交换的目的,具有可靠性高、识别速度快、动态实时通信等优点。一个RFID系统主要是由RFID标签、阅读器以及软件系统所组成,由于RFID系统往往需要部署大量的阅读器,因此在RFID系统的通信过程中,极有可能会出现“阅读器-RFID标签”碰撞问题,“阅读器-RFID标签”碰撞指的是多个阅读器的识别区域发生重叠而导致处于重叠区域中的RFID标签不能做出正确的应答。这种碰撞问题的出现对于一个RFID系统来说是致命的,很有可能导致RFID系统无法正常运行,对于这种问题可以使用分配多时隙的思路进行解决。目前,解决该碰撞问题的具体方法主要有基于调度的方法和基于功率调整的方法两种类型,在基于调度的方法上 ...
【技术保护点】
1.一种RFID标签接入的多阅读器防碰撞方法,其特征在于,包括:/n利用每个阅读器的时隙状态,对预设的Actor-Critic网络模型进行M轮迭代训练,得到阅读器防碰撞模型;其中,所述M为大于1的整数;/n利用所述阅读器防碰撞模型对每个所述阅读器分配时隙,以便RFID标签按照每个阅读器分配的时隙接入;/n其中,每轮迭代训练过程中执行以下操作:/n依次将所述阅读器的相邻两个时隙状态的向量输入至Actor网络,并根据Actor网络的输出选择所要执行的时隙分配动作;/n计算执行所述时隙分配动作后所得到的两个奖赏值以及RFID系统反馈所得到的相邻两个时隙状态的状态值;/n将所述相邻 ...
【技术特征摘要】
1.一种RFID标签接入的多阅读器防碰撞方法,其特征在于,包括:
利用每个阅读器的时隙状态,对预设的Actor-Critic网络模型进行M轮迭代训练,得到阅读器防碰撞模型;其中,所述M为大于1的整数;
利用所述阅读器防碰撞模型对每个所述阅读器分配时隙,以便RFID标签按照每个阅读器分配的时隙接入;
其中,每轮迭代训练过程中执行以下操作:
依次将所述阅读器的相邻两个时隙状态的向量输入至Actor网络,并根据Actor网络的输出选择所要执行的时隙分配动作;
计算执行所述时隙分配动作后所得到的两个奖赏值以及RFID系统反馈所得到的相邻两个时隙状态的状态值;
将所述相邻两个时隙状态和所述两个奖赏值的第一个奖赏值输入Critic网络,得到所述阅读器的时间差分误差;
根据所述相邻两个时隙状态的状态值,确定Critic网络的第一损失函数;
根据所述第一损失函数对所述Critic网络的第一参数进行更新;
根据所述时间差分误差,确定所述Actor网络的第二损失函数;
根据所述第二损失函数对所述Actor网络的第二参数进行更新。
2.根据权利要求1所述的RFID标签接入的多阅读器防碰撞方法,其特征在于,所述根据Actor网络的输出选择所要执行的时隙分配动作,包括:
根据所述Actor网络输出的每个时隙分配动作的概率集合随机选择所要执行的时隙分配动作。
3.根据权利要求1所述的RFID标签接入的多阅读器防碰撞方法,其特征在于,所述奖赏值的计算公式为;
其中,r(s,a)为奖赏值,s为所述时隙状态,a为所述时隙分配动作;为阅读器在时隙i中未与其发生碰撞的阅读器数量;为阅读器在时隙i中与其发生碰撞的阅读器数量;c1为未发生碰撞的权重系数,且c1为正值;c2为发生碰撞的权重系数,且c2为负值。
4.根据权利要求1所述的RFID标签接入的多阅读器防碰撞方法,其特征在于,态值的计算公式为;
Vπ(s)=Eπ[r+γVπ(s')];
其中,Vπ(s)为所述相邻两个时隙状态的状态值中的第一个状态值,r为所述第一个奖赏值,γ为折扣因子,且为常数;Vπ(s')为所述相邻两个时隙状态的状态值中的第二个状态值。
5.根据权利要求4所述的RFID标签接入的多阅读器防碰撞方法,其特征在于,所述根据相邻两个时隙状态的状态值,确定Critic网络的第一损失函数,包括:
根据所述第一个...
【专利技术属性】
技术研发人员:双锴,王哲,姚顺雨,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。