【技术实现步骤摘要】
一种可重构智能表面增强的MISO
‑
OFDM传输方法
[0001]本专利技术属于可重构智能表面辅助的多用户多输入单输出正交频分复用(multiple
‑
input single
‑
output orthogonal frequency division multiplexing,MISO
‑
OFDM)下行系统自适应传输
,特别涉及一种可重构智能表面增强的MISO
‑
OFDM传输方法。
技术介绍
[0002]可重构智能表面(reconfigurable intelligent surface,RIS)得益于超材料的快速发展被视为新一代无线通信中可以低成本和低能量消耗获得高频谱效率的关键技术之一。RIS是一种由大量无源且可重构的反射元件组成的软件可控的平面阵列超表面,通过实时动态调整反射信号的幅度和/或相位,反射信号能量在特定方向被加强或减弱,因而目标用户的信噪比性能被极大改善,同时用户间干扰可得到有效控制。此外,RIS仅依赖于无源信 ...
【技术保护点】
【技术特征摘要】
1.一种可重构智能表面增强的MISO
‑
OFDM传输方法,其特征在于,包括以下步骤:步骤一、基站配置均匀线性天线阵,该天线阵包括N
t
个天线阵元,服务K个单天线用户,可重构智能表面配置均匀平面反射阵,共M=x
×
y个反射单元,包括垂直方向x行反射单元,水平方向每行y个反射单元;系统整体带宽被划分为N个子载波,K个单天线用户共享全部子载波,基站和可重构智能表面已知用户的时域信道状态信息;步骤二、利用时域信道状态信息构建从基站到用户k的频域子载波信道i上的向量从可重构智能表面到用户k的频域子载波信道i上的向量和从基站到可重构智能表面的频域子载波信道i上的矩阵G
i
,k=1,2,
…
,K,i=0,1,
…
,N
‑
1;步骤三、构建智能体X的经验池及深度强化学习神经网络,包括:动作输出在线网络A、动作输出目标网络状态动作评价在线网络C
ρ
,ρ=1,2,即C1和C2,以及状态动作评价目标网络即和所述动作输出在线网络A和动作输出目标网络构成智能体X的动作网络;所述状态动作评价在线网络C1和C2以及状态动作评价目标网络和构成智能体X的评价网络;智能体X在t时刻的环境状态为其中为智能体X在t
‑
1时刻输出的可重构智能表面各个反射元件的相移参数,C
(t
‑
1)
是t
‑
1时刻的系统频谱效率,环境输出奖励值r
(t)
评价动作输出在线网络A在当前状态s
(t)
下输出的动作;步骤四、随机初始化动作输出在线网络A的网络参数及状态动作评价在线网络C
ρ
的网络参数并令动作输出目标网络的网络参数和状态动作评价目标网络的网络参数分别满足和初始化单次随机采样数量N
B
;初始化t=0;可重构智能表面在t=0时刻的相移矩阵中的各个相移参数从[
‑
π,π]中随机选取;计算得到t=0时刻的系统频谱效率C
(0)
;令t=t+1,得到t时刻的环境状态步骤五、将t时刻的环境状态s
(t)
作为动作输出在线网络的输入,计算得到t时刻的可重构智能表面的相移偏置矩阵Φ
(t)
、子载波i上的基站端预编码矩阵和基站端发射功率向量以及t+1时刻的环境状态且t时刻的系统频谱效率C
(t)
作为环境输出奖励值r
(t)
;将最终得到的四元组{s
(t)
,a
(t)
,r
(t)
,s
(t+1)
}作为一个经验样本存入经验池中,若经验池已存满后,则用该经验样本覆盖经验池中最早的一个经验样本;步骤六、智能体X将状态动作对(s
(t)
,a
(t)
)输入状态动作评价在线网络C1和C2中,输出状态动作对(s
(t)
,a
(t)
)的评价值和其中,和表示状态动作评价在线网络C1和C2的状态动作对的评价值函数;
随后从经验池随机采样N
B
个样本,随机采样按如下步骤进行:若t≥N
B
,则从经验池D中随机选择N
B
个样本其中每个样本均为学习过程中存入经验池中的四元组,进入步骤七;若t<N
B
,则不采样并令t=t+1,转到步骤五;步骤七、利用采样结果对动作输出在线网络和状态动作评价在线网络进行更新,并对动作输出目标网络和状态动作评价目标网络进行软更新;若|C
(t)
‑
C
(t
‑
1)
|≤ε,是网络收敛条件,则停止迭代转到步骤八,否则令t=t+1并转到步骤五;步骤八、将当前时刻t所得的可重构智能表面的相移偏置矩阵Φ
(t)
,用户共享子载波时各子载波i上的基站端预编码矩阵和基站端发射功率向量作为当前信道状态信息下的可重构智能表面的最佳相移偏置矩阵Φ
opt
,以及相应的最佳基站预编码方案和功率分配方案。2.根据权利要求1所述的一种可重构智能表面增强的MISO
‑
OFDM传输方法,其特征在于,步骤一所述时域信道状态信息包括:基站到用户k的时域块循环信道矩阵表示为:其中,是基站到用户k的具有L0个抽头的直接路径时域基带等效多径信道矩阵,(
·
)
T
表示转置,(
·
)
H
表示共轭转置;从基站到可重构智能表面的时域块循环信道矩阵表示为:
其中,为基站到可重构智能表面的具有L1个抽头的时域等效多径信道矩阵,从可重构智能表面到用户k的时域块循环矩阵表示为:其中,是可重构智能表面到用户k的具有L2个抽头的时域等效多径信道矩阵,3.根据权利要求1所述的一种可重构智能表面增强的MISO
‑
OFDM传输方法,其特征在于,步骤二所述构建从基站到用户k的频域子载波信道i上的向量从可重构智能表面到用户k的频域子载波信道i上的向量和从基站到可重构智能表面的频域子载波信道i上的矩阵G
i
,具体包括以下步骤:步骤2.1、按下式计算中间矩阵和和和和其中,表示矩阵的第n列向量,表示矩阵的第n
t
+(n
‑
1)
×
N
t
列向量,表示矩阵的第p行第q列元素,表示矩阵的第m+(p
‑
1)
×
M行第n
t
+(q
‑
1)
×
N
t
列元素,表示矩阵的第n列向量,表示矩阵的第m+(n
‑
1)
×
M列向量,n,p,q=1,2,
…
,N;步骤2.2、利用和计算过渡对角矩阵:计算过渡...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。