一种共生网络中用户关联的方法技术

技术编号：21613439 阅读：61 留言：0更新日期：2019-07-13 21:09

本发明专利技术属于无线通信技术领域，涉及一种共生网络中用户关联的方法。本发明专利技术目标是找出一种有效的用户关联方案使所有蜂窝用户的速率和最大。因想要获得全部的实时信道信息非常困难，本发明专利技术提出利用深度强化学习来进行用户关联，然后根据当前总速率大小自适应地调整用户关联方案。基于深度强化学习的用户关联方法：利用在上一帧采集得到的历史信息，通过深度强化学习来进行当前信道预测，进而为在下一帧作出合适的用户关联决策。本发明专利技术不需要实时得到所有链路的信道信息，而是根据历史信息进行预测当前决策的有效信息，进而得到使所有IoT设备合速率最大的用户关联策略。

A Method of User Association in Symbiotic Networks

全部详细技术资料下载

【技术实现步骤摘要】
一种共生网络中用户关联的方法
本专利技术属于无线通信
，涉及一种共生网络中基于深度强化学习的用户关联的方法。
技术介绍
物联网(IoT)设备数量的指数增长将导致未来对无线频谱和网络基础设施的巨大需求。为了支持大规模IoT设备连接，这非常需要设计一种频谱，能源和基础设施高效的通信技术。共生无线电(SR)被是一种可行的解决方案，在SR中，IoT传输寄生在传统网络中。特别地，IoT设备通过反射从传统发射机接收的信号来发送它们的消息，而不需要有源射频(RF)链。这意味着物联网设备的数据传输使用无源无线电技术，并且不需要专用频谱和基础设施。SR系统有三个节点：RF源，IoT设备和接收机。IoT设备通过改变反射系数来反射环境RF源信号来将信息传输到接收机。接收机接收两种类型的信号：来自RF源的直接链路信号和来自IoT设备的反向散射链路信号。反向散射链路信号包含RF源消息，并且IoT设备的传输速率低于传统系统的传输速率，这意味着反向散射链路可以被视为传统传输的附加路径，来提高传统通信系统的性能。因此SR系统可以实现传统通信系统和IoT通信的互利共生。
技术实现思路
本专利技术考虑蜂窝网络和IoT网络的共生模型，本专利技术设计了如图1所示的共生网络，蜂窝网络中的基站(BS)服务M个蜂窝用户，而IoT网络中的N个IoT设备通过反射来自BS的接收信号来将它们的消息发送到相关的蜂窝用户。本专利技术设计了在此SR网络中的传输协议，如图2所示，BS通过时间多址接入(TDMA)的方式服务多个蜂窝用户，IoT设备仅在一个关联的时隙中发送信息。蜂窝用户使用连续干扰消除(SIC)策略对来...

【技术保护点】
1.一种共生网络中用户关联的方法，所述共生网络为由蜂窝网络和物联网IoT网络构成的共生系统，其中，蜂窝网络中的基站BS服务M个蜂窝用户，IoT网络中的N个IoT设备通过反射来自BS的接收信号来将它们的消息发送到相关的蜂窝用户；定义BS在一帧中的一个时隙给用户m传输的信息为xm，IoT设备n将自己的信息cn传送给关联的蜂窝用户，令IoT设备的传输周期是BS传输周期的K倍，则用户m接收到的信号为：

【技术特征摘要】
1.一种共生网络中用户关联的方法，所述共生网络为由蜂窝网络和物联网IoT网络构成的共生系统，其中，蜂窝网络中的基站BS服务M个蜂窝用户，IoT网络中的N个IoT设备通过反射来自BS的接收信号来将它们的消息发送到相关的蜂窝用户；定义BS在一帧中的一个时隙给用户m传输的信息为xm，IoT设备n将自己的信息cn传送给关联的蜂窝用户，令IoT设备的传输周期是BS传输周期的K倍，则用户m接收到的信号为：其中，p是BS的传输功率，αn表示IoT设备n的反射系数，um表示用户m端的复高斯噪声，服从分布并且am,n∈{0,1}表示用户关联指数，定义是若am,n＝1，则与IoT设备n关联的是用户m；表示从BS到用户m的信道系数，表示从BS到IoT设备n的信道系数，表示从IoT设备n到用户m的信道系数，其中λm,λn,λm,n分别表示大尺度衰落，大尺度衰落和两个通信节点的距离有关；分别表示对应的小尺度衰落，采用Jakes模型表述第t帧的小尺度衰落的变化为：其中m＝1,…,M,n＝1,…,N并且em(t),en(t),em,n(t)是服从的独立同分布的随机变量；是指均值为μ方差为σ2的复高斯，ρ是指不同帧之间的信道相关系数；其特征在于，所述用户关联的方法为：以所有蜂窝用户的速率和最大为目标，建立模型：其中为用户关联指数am,n的集合，γm,n为用户m端的IoT设备n的信干噪比：集合中存放的是信道强度小于hm,n的IoT设备编号，其中采用中心式深度强化学习来进行用户关联，具体为：BS根据ε-贪婪策略做出决策，IoT设备基于来自BS的决策来接入相关联的蜂窝用户，蜂窝用户解码相关联的IoT设备信号并将rc(t)和sc(t+1)反馈给BS，BS将经验数据存储到存储器D中，并随机地对D中的经验数据进行小片采样以训练深度Q-网络；ε-贪婪策略是指以ε概率采取随机决策，以1-ε概率采取深度Q-网络获得的结果；rc(t)为中心式深度强化学习的的奖励函数：sc(t)为中心式深度强化学习在第t帧的状态：其中是第(t-1)帧的能获得的所有反射链路的历史信道信息，每次和环境进行交互后，用户m将与之相关联的IoT设备的信道信息上传给基站，基站更新现有的历史信道信息中心式深度强化学习的动作为：其中bn∈{1,…,M}表示与IoT设备n关联...

【专利技术属性】
技术研发人员：梁应敞，张倩倩，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人