Massive MIMO的优化方法、装置、设备及介质制造方法及图纸

技术编号：20431554 阅读：28 留言：0更新日期：2019-02-23 11:08

本发明专利技术实施例提供的Massive MIMO的优化方法、装置、设备及介质，根据专家经验模式对状态信息矩阵的特征进行识别和判断，确定优化策略，在线强化学习生成多个马克可夫决策过程MDP训练序列，并将MDP训练序列存入每个波束扇区的处理缓存中；根据异步优势加权的行动者‑评论家Actor‑Critic深度增强学习网络并行计算MDP训练序列，并将学习到的最优的优化策略函数和状态值函数的权值信息，通过全局共享模式进行更新和复制；根据行动者‑评论家深度增强学习网络学习到的优化策略，确定Massive MIMO系统最优的天线权值和无线参数配置组合，实现优化调整与现网性能评估的在线实时交互，实时采用最优的天线权值和无线参数配置组合，实现网络性能最佳。

Massive MIMO optimization methods, devices, equipment and media

The optimization method, device, equipment and medium of Massive MIMO provided by the embodiment of the present invention identify and judge the characteristics of the state information matrix according to the expert experience mode, determine the optimization strategy, generate multiple Markov decision-making process MDP training sequences by online reinforcement learning, and store the MDP training sequences in the processing buffer of each beam sector; weighted according to the asynchronous advantage; Actor Critic Deep Enhanced Learning Network (DELEN) calculates MDP training sequence in parallel, updates and replicates the weight information of the optimal optimization strategy function and state value function through global sharing mode, and determines the optimal antenna weights and none of Massive MIMO system according to the optimization strategy learned by the actor Critic DELEN. The online parameter configuration combination realizes the online real-time interaction between the optimization adjustment and the performance evaluation of the existing network. The optimal combination of antenna weight and wireless parameter configuration is used in real-time to achieve the best network performance.

全部详细技术资料下载

【技术实现步骤摘要】
MassiveMIMO的优化方法、装置、设备及介质
本专利技术涉及通信
，尤其涉及一种大规模多输入多输出(MassiveMultipleInputMultipleOutput，MassiveMIMO，MM)的优化方法、装置、设备及介质。
技术介绍
MassiveMIMO技术是第五代移动通信技术5G中提高网络覆盖和系统容量的关键技术。在大规模MIMO系统中，基站配置有大量的天线，数目通常有几十、几百甚至几千根，是现有MIMO系统天线数目的数倍、数十倍以上。MassiveMIMO充分利用大规模天线阵列和空间自由度，改进了长期演进(LongTermEvolution，LTE)的广播机制，通过波束赋形的机制发射多个波束扇区，提高发射电磁波的功率密度，增强了覆盖范围。但是，MassiveMIMO系统的权值参数，随着波束扇区数目和动态扫描维度的增加，波束扇区天线权值和无线参数的组合数由200多个增加至10000多个，再加上小区重选参数、小区切换参数，使波束扇区天线权值和无线参数的组合数量更多，导致MassiveMIMO系统的优化调整变得异常复杂。已有的针对MassiveMIMO网络扇区的优化方案大致有三种，以下分别做简要介绍：第一种，按照网络规划中的仿真模型进行MassiveMIMO网络扇区优化调整。按照网络规划中使用的地图匹配，利用热点场景模型进行业务预测、覆盖仿真和干扰仿真等处理，模型可输出规划仿真后的波束扇区天线权值。规划仿真的目的是尽量使MassiveMIMO基站的各个扇区的主瓣方向指向用户需求集中的方向，使用户获得尽可能强的信号，同时还可规划仿真同频、...

【技术保护点】
1.一种大规模多入多出Massive MIMO系统优化方法，其特征在于，所述方法包括：为用户设备UE配置多个波束扇区，接收UE上报的测量报告MR数据和统计波束扇区性能KPI数据，并根据所述MR数据和所述KPI数据生成波束扇区状态信息矩阵；根据专家经验模式对所述状态信息矩阵的特征进行识别和判断，确定优化策略，在线强化学习生成多个马克可夫决策过程MDP训练序列，并将所述MDP训练序列存入每个波束扇区的处理缓存中；根据异步优势加权的行动者‑评论家Actor‑Critic深度增强学习网络并行计算所述MDP训练序列，并将学习到的最优的优化策略函数和状态值函数的权值信息，通过全局共享模式进行更新和复制；根据所述行动者‑评论家深度增强学习网络学习到的优化策略，确定Massive MIMO系统最优的天线权值和无线参数配置组合。

【技术特征摘要】
1.一种大规模多入多出MassiveMIMO系统优化方法，其特征在于，所述方法包括：为用户设备UE配置多个波束扇区，接收UE上报的测量报告MR数据和统计波束扇区性能KPI数据，并根据所述MR数据和所述KPI数据生成波束扇区状态信息矩阵；根据专家经验模式对所述状态信息矩阵的特征进行识别和判断，确定优化策略，在线强化学习生成多个马克可夫决策过程MDP训练序列，并将所述MDP训练序列存入每个波束扇区的处理缓存中；根据异步优势加权的行动者-评论家Actor-Critic深度增强学习网络并行计算所述MDP训练序列，并将学习到的最优的优化策略函数和状态值函数的权值信息，通过全局共享模式进行更新和复制；根据所述行动者-评论家深度增强学习网络学习到的优化策略，确定MassiveMIMO系统最优的天线权值和无线参数配置组合。2.根据权利要求1所述的方法，其特征在于，所述为用户设备UE配置多个波束扇区，包括：采用波束赋形的方式形成多个所述波束扇区覆盖不同空间区域的UE；根据所述波束扇区的参考信号接收功率强度，确定所述UE接入的波束扇区。3.根据权利要求1所述的方法，其特征在于，所述波束扇区状态信息矩阵的方程为：Xt＝{X_throughput，X_rsrp，X_Ni，X_TA，X_AOA，...}T，其中，X_throughput为波束扇区的吞吐量效率，X_rsrp为波束扇区的覆盖水平，X_Ni为波束扇区的干扰水平，X_TA为在该波束扇区下UE用于调整其主小区物理上行链路控制信道PUCCH/物理上行链路共享信道PUSCH/探测参考信号SRS上行发送的时间，X_AOA为确定UE的波达角度，t为时刻，t＝1,2,3…T。4.根据权利要求1所述的方法，其特征在于，所述根据专家经验模式对所述状态信息矩阵的特征进行识别和判断，确定优化策略，包括：根据专家经验模式对所述波束扇区不同状态信息进行识别和判断；从天线权值和无线参数的集合中选取相应的天线权值和无线参数；对选取的所述天线权值和无线参数进行优化；根据贪婪算法进行所述优化，确定优化策略。5.根据权利要求4所述的方法，其特征在于，所述天线权值和无线参数的集合的方程为：A＝{ɑ_SS-RSRP/CSI-RSRP_power，ɑ_azimuth_angle，ɑ_elevation_angle，ɑ_horizontal_HPBW，ɑ_vertical_HPBW，ɑ_handover_parameter，ɑ_reselection_parameter，…}，其中，ɑ_SS-RS/CSI_RS_power为同步信号参考信号接收功率SS-RSRP/信道信息状态参考信号接收功率CSI_RSRP功率参数优化调整，ɑ_azimuth_angle为波束方位角优化调整，ɑ_elevation_angle为波束俯仰角优化调整，ɑ_horizontal_HPBW为波束水平波瓣宽度优化调整，ɑ_vertical_HPBW为波束垂直波瓣宽度优化调整，ɑ_handover_parameter为MassiveMIMO小区切换参数优化调整，ɑ_reselection_parameter为MassiveMIMO小区重选参数的优化调整；所述优化策略的表达式为：π(ɑt|St)，其中，π为优化策略函数，ɑt为天线权值和无线参数优化调整，St为波束扇区的网络状态函数。6.根据权利要求1-5任一项所述的方法，其特征在于，所述MDP训练序列的方程为：(S1，ɑ1，S2，r1，…,St，ɑt，St+1，rt，…,ST-1，ɑT-1，ST，rT)，其中，rt为性能回报，ɑt为选取的所述天线权值和无线参数优化调整，St为波束扇区的网络状态函数。7.根据权利要求6所述的方法，其特征在于，所述性能回报的方程为：rt＝η×r_CASEt+(1-η)×r_CESEt，其中，r_CASEt为小区平均吞吐效率，r_CESEt为小区边缘吞吐效率，η为小区平均吞吐效率和小区边缘吞吐量频谱效率的期望平衡的权重系数，且0≤η≤1。8.根据权利要求1所述的方法，其特征在于，所述根据专家经验模式对所述状态信息矩阵的特征进行识别和判断，确定优化策略，包括：根据专家经验模式对有助于优化网络性能的特征进行识别和判断，确定优化策略；其中，所述有助于优化网络性能的特征包括所述波束扇区的弱覆盖特征、波束扇区间干扰特征、波束扇区方向与业务UE分布特征。9.根据权利要求1所述的方法，其特征在于，所述异步优势加权的行动者-评论家深度增强学习网络并行计算所述MD...

【专利技术属性】
技术研发人员：乔勇，
申请(专利权)人：中国移动通信集团江苏有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人