一种小小区动态时分双工结合Q学习的上下行子帧的配置方法技术

技术编号：16841810 阅读：62 留言：0更新日期：2017-12-20 00:26

本发明专利技术公开了一种小小区动态时分双工结合Q学习的上下行子帧的配置方法，其特征是，包括如下步骤：1）构建动态时分双工小小区系统模型；2）定义系统模型的状态转移函数P和回报函数R；3）设置上下行子帧重配置周期；4）配置单位周期内小小区上下行子帧；5）构造系统模型目标函数；6）优化目标函数。这种方法能使小小区频谱高效地用在智能终端、能提高小小区频谱效率和能量效率。

A method of configuring up and down subframe in a small cell dynamic time division duplex combined with Q learning

The invention discloses a configuration method of small cell dynamic time division duplex combined with Q learning on the downlink sub frame, and is characterized in comprising the following steps: 1) to construct dynamic TDD small cell system model; 2) P transfer function and reward function definition of R system model; 3) arranged on the downlink sub frame reconfiguration cycle; 4) downlink sub frame small cell configuration period; 5) model of target system structure function; 6) objective function optimization. This method can make the small cell spectrum efficiently used in the intelligent terminal, and can improve the frequency efficiency and energy efficiency of small cell.

全部详细技术资料下载

【技术实现步骤摘要】
一种小小区动态时分双工结合Q学习的上下行子帧的配置方法
本专利技术涉及无线通信
，具体是一种小小区动态时分双工结合Q学习的上下行子帧的配置方法。
技术介绍
小小区网络技术被认为是一种解决当前移动数据流量爆炸式增长的通信技术手段之一，也是移动通信技术演进及下一代移动通信网络的关键技术之一。但由于小小区网络所服务的移动终端较少，移动终端在小区间的切换较为频繁，导致了小小区网络中数据业务的变化难以计算，上下行业务量很难维持在一个相对比较稳定的比例，因此，传统宏蜂窝小区里的半静态子帧重配置将无法使用，不能满足不同移动终端的业务量需求，造成频谱资源的巨大浪费。如何使小小区网络能够及时有效地调整其子帧配置成为当前急需解决的问题。动态时分双工技术为克服这一问题提供了很好的方向，动态时分双工作为当前热门的移动通信技术，其特点为不需要成对的频率、能使用各种频率资源、适用于不对称的上下行数据传输速率，能明显的表现出频谱资源丰富的优势。
技术实现思路
本专利技术的目的是针对现有技术的不足，而提供一种小小区动态时分双工结合Q学习的上下行子帧的配置方法。这种方法能使小小区频谱高效地用在智能终端、能提高小小区频谱效率和能量效率。实现本专利技术目的的技术方案是：一种小小区动态时分双工结合Q学习的上下行子帧的配置方法，包括如下步骤：1)构建动态时分双工小小区系统模型：定义系统模型中，宏蜂窝网络和小小区网络使用不同的频谱，将动态时分双工技术运用在小小区网络中，在这种系统模型场景中，宏蜂窝网络和宏蜂窝网络所连接的移动终端对小小区网络以及小小区网络所连接的移动终端的影响可以忽略不计，为实际应...
一种小小区动态时分双工结合Q学习的上下行子帧的配置方法

【技术保护点】
一种小小区动态时分双工结合Q学习的上下行子帧的配置方法，其特征是，包括如下步骤：1)构建动态时分双工小小区系统模型：定义系统模型中，宏蜂窝网络和小小区网络使用不同的频谱，将动态时分双工技术运用在小小区网络中，在固定时刻内，每一个小小区的上下行子帧重配置决策独立于其他小小区，系统模型中包含(S,A,P,R)四个集合,其中S是环境状态的离散集合，S＝{s0,s10,L stL s100}，每个环境状态的下标表示在固定周期内，小小区网络接收到其连接的移动终端所反馈的下行缓存中待传总比特数的百分比，A是动作状态的离散集合A＝{ai,aj}，ai表示小小区网络保持之前的子帧配置不变，aj表示小小区网络改变之前的子帧配置，P是一个状态转移函数:P＝S*A*S∈[0,1]，R是回报函数，R＝{r‑5,r‑4,L rdL r5}，(‑5≤d≤5)；2)定义系统模型的状态转移函数P和回报函数R：系统模型假设小小区网络不知道状态转移函数P和回报函数R，回报函数R表示为公式(1):

【技术特征摘要】
1.一种小小区动态时分双工结合Q学习的上下行子帧的配置方法，其特征是，包括如下步骤：1)构建动态时分双工小小区系统模型：定义系统模型中，宏蜂窝网络和小小区网络使用不同的频谱，将动态时分双工技术运用在小小区网络中，在固定时刻内，每一个小小区的上下行子帧重配置决策独立于其他小小区，系统模型中包含(S,A,P,R)四个集合,其中S是环境状态的离散集合，S＝{s0,s10,LstLs100}，每个环境状态的下标表示在固定周期内，小小区网络接收到其连接的移动终端所反馈的下行缓存中待传总比特数的百分比，A是动作状态的离散集合A＝{ai,aj}，ai表示小小区网络保持之前的子帧配置不变，aj表示小小区网络改变之前的子帧配置，P是一个状态转移函数:P＝S*A*S∈[0,1]，R是回报函数，R＝{r-5,r-4,LrdLr5}，(-5≤d≤5)；2)定义系统模型的状态转移函数P和回报函数R：系统模型假设小小区网络不知道状态转移函数P和回报函数R，回报函数R表示为公式(1):式中，γ为折扣因子(0<γ<1)，用来调整小小区在系统中的配置周期，当γ＝0时，表示小小区网络只考虑立即回报；γ越接近1，表示小小区网络考虑了长期回报，系统中的最终目标即为小小区获得最佳的回报函数R，在状态转移函数P中，小小区设备从状态t到状态t+1的转移概率只依赖于状态t的动作，即为一个随机过程X，用At,(At∈A)表示在小小区设备在状态t时的所有可能的动作集，则状态转移概率函数表示为公式(2):Ptt+1(at)＝Pr(Xt+1＝st+1|Xt＝st,a(t)＝at)(2)；3)设置上下行子帧重配置周期：设置系统模型中动态时分双工技术的上下行子帧重配置周期为10ms-200ms；4)配置单位周期内小小区上下行子帧：在每一个周期内，小小区网络根据连接的移动终端所反馈的业务类型中得到一个环境状态信号st,st∈S，通过这个环境状态信号在动作状态的离散集合中选择一个动作a,a∈A，一旦动作a执行，小小区就针对性的调整上下行子帧配置并产生一个回报信号rd,rd∈R，即rd表示在状态st时选择动作a后的回报；5)构造系统模型目标函数：系统模型的最终的目标是小小区获得最佳的回报函数R。即小小区在固定周期内寻求一个策略π，考量策略的标准是根据策略在未来的折扣回报期望值，即值函数Vπ(st)，值函数Vπ(st)在状态st，策略π下表示为公式(3):

【专利技术属性】
技术研发人员：赵峰，刘博，陈宏滨，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人