基于深度强化学习的毫米波混合波束成形设计方法技术

技术编号：24215055 阅读：38 留言：0更新日期：2020-05-20 18:42

本发明专利技术公开了一种基于深度强化学习的毫米波混合波束成形设计方法，该方法中基站利用获取的用户信道状态信息，通过计算互相关得到用户的模拟预编码矩阵；构建一个用于联合优化用户数字预编码矩阵和模拟合并矩阵的深度强化学习智能体，将用户信道信息及模拟预编码矩阵输入智能体，输出相应的数字预编码矩阵和模拟合并矩阵；基于最小均方误差准则计算用户的数字合并矩阵；本发明专利技术给出的基于深度强化学习的毫米波混合波束成形设计方法收敛速度快，具有较好的鲁棒性，能有效提高系统频谱效率。

Design method of MMW hybrid beamforming based on deep reinforcement learning

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的毫米波混合波束成形设计方法
本专利技术涉及一种基于深度强化学习的毫米波混合波束成形设计方法，属于基站配置均匀线性天线阵的点对点MIMO下行系统自适应传输

技术介绍
毫米波通信作为一种可以提高网络传输速率和缓解频谱资源短缺问题的有效方法被视作新一代无线通信网络的关键技术之一。结合大规模多输入多输出(MIMO)的毫米波通信系统能充分利用空间资源，通过多个天线实现多发多收，在不增加频谱资源和天线发射功率的情况下，成倍的提高系统信道容量，同时有效解决毫米波系穿透力弱，衰减快等问题。然而，在实际应用中，大规模MIMO毫米波无线通信仍面临着诸多挑战。毫米波系统中波束成形矩阵的设计受到昂贵的射频硬件的约束。传统的全数字波束成形结构需要为每一根发射天线和接收天线配备一个射频链路用于模数转换和上下变频，结合大规模MIMO之后，所需射频链路数极大，导致系统复杂度不可接受。已有的混合预编码技术将全数字预编码拆分为高维的模拟预编码和低维的数字预编码，模拟预编码可由简单的相移器实现，数字预编码维数较低，仅使用很少的射频链路即可，可在一定程度上缓解这一问题。但现存混合预编码技术主要基于压缩感知技术和高发射信噪比的假设，将原始系统速率最大问题转化为矩阵间欧氏距离最小问题，导致局部最优解；且算法的时间复杂度较高，会引入较大的通信处理时延，因此需要有新的低复杂度和高性能混合波束成形算法来进一步解决这些问题。现有针对低复杂度毫米波混合预编码算法的研究主要基于对矩阵求逆运算的简化或使用深度监督学习方法。虽然应用...

【技术保护点】
1.一种基于深度强化学习的毫米波混合波束成形设计方法，其特征在于，包括以下步骤：/n步骤一、t＝0时刻，基站配置N

【技术特征摘要】
1.一种基于深度强化学习的毫米波混合波束成形设计方法，其特征在于，包括以下步骤：
步骤一、t＝0时刻，基站配置Nt个天线单元的均匀线性天线阵列，发送Ns路独立数据流，用户侧配备Nr个天线单元的均匀线性天线阵列；基站与用户侧分别配备和个射频链路；基站已知其与用户间的信道矩阵其中Ncl为散射簇数目，Nray为每个散射簇的散射与反射径数，αij为第i簇中第j径的路径增益，归一化发射端信道响应向量归一化接收端信道响应向量d为天线阵元间距，λ为载波波长，和分别为第i簇中第j径信号的出发角和到达角；计算发射端信道响应矩阵与信道右酉矩阵的互相关矩阵T＝ΩΩH，其中Vopt＝SVDright(H)，SVDright(·)表示求矩阵奇异值分解后的右酉矩阵，并从互相关矩阵T的对角元T(i，i)，i＝1，2，...，NclNray，中选出最大的前Ns个对角元，选出的下标集合记作选择中索引属于τ的Ns个列向量组成发射端模拟预编码矩阵VRF；随机初始化由神经网络构成的深度强化学习智能体X，用于学习数字预编码矩阵VBB和模拟合并矩阵WRF；随机初始化数字预编码矩阵VBB、模拟合并矩阵WRF和数字合并矩阵WBB，令t＝t+1；
所述深度强化学习智能体包括以下元素：动作输出现实网络A，根据来自环境的状态产生当前最优的动作；动作输出目标网络其参数复制自动作现实网络A，每隔NT个时隙更新一次；状态动作评价现实网络C，输出对当前的状态动作的价值函数；状态动作评价目标网络其参数复制自评价现实网络C，每隔NT个时隙更新一次；容量为ND的经验池D，用于存储智能体学习过程中产生的样本；
步骤二、在时刻t，智能体X执行如下操作：智能体X的状态

其中为前一时刻的数字预编码矩阵，为前一时刻的模拟合并矩阵，Re(·)，Im(·)分别表示取实部和虚部，vec(·)表示将矩阵转换为列向量；将状态s(t)输入智能体X的动作现实网络A，输出为其中将A(s(t))与服从标准正态分布的噪声相加得到智能体的动作a(t)＝A(s(t))+n(t)，将向量a(t)的前个元素作为当前时刻数字预编码矩阵的实部和虚部，将a(t)的后个元素作为当前时刻模拟合并矩阵的实部和虚部，并将a(t)重排得到当前时刻的数字预编码矩阵和模拟合并矩阵对中所有元素做模归一化处理其中表示矩阵中的第(i，j)个元素；
步骤三、基站利用最小均方误差准则更新数字合并矩阵其中为用户端噪声方差；然后按照下式计算此时的系统频谱效率

其中ρ为平均发射功率，智...

【专利技术属性】
技术研发人员：李潇，王琪胜，金石，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人