一种物理层参数智能决策与动态配置的方法技术

技术编号:37863747 阅读:50 留言:0更新日期:2023-06-15 20:53
本发明专利技术涉及一种物理层参数智能决策与动态配置的方法,属于移动通信技术领域,包括以下步骤:S1:基于媒体访问控制层智能决策模型MID,智能决策出物理层调制参数,得到调制类型;S2:通过选择调制类型来配置FTN系统中发送端的调制阶数;S3:基于深度学习,设计FTN系统的接收端,实现不同信号的动态解调。本发明专利技术提供了一种考虑延迟、可靠性、可用性、可扩展性和不确定性下的决策的动态架构,本发明专利技术具有超强灵活性的网络,可以巧妙地整合不同的技术,同时满足各种不同的业务需求可以根据用户需求进行优化。进行优化。进行优化。

【技术实现步骤摘要】
一种物理层参数智能决策与动态配置的方法


[0001]本专利技术属于移动通信
,涉及一种物理层参数智能决策与动态配置的方法。

技术介绍

[0002]随着智能终端和基础设施的快速发展,以及多样化应用的多样化需求,人类对通信体验提出更高的个性化需求。目前5G已经步入商用,工业界和学术界的研究人员已经开始对6G网络进行研究,可见未来通信技术的应用趋势必将向智能化、自适应化方向发展。
[0003]在过去的几十年里,无线设备和数据流量呈指数级增长。如今,频谱效率已经变得非常宝贵。随着对频谱资源需求的日益增加,一项名为FTN的很有前途的技术被重新发现,并在工业和学术界引起了广泛的关注。FTN是一个很有前途的范例,通过牺牲额外的符号间干扰(Inter Symbol Interference,ISI)为代价来提高带宽利用率。在传统的奈奎特准则传输中,当带宽为WHz时,符号间隔T设置为T≥T
N
=1/(2W),传输符号之间的严格正交性保证了接收机中的信号恢复。相比之下,FTN信号中的符号间隔减少到了T<T
N
,从而实现了更高的传输速率,同时破坏了正交性,引入了不可避免的ISI和在接收端恢复原始信号的复杂性。Mazo极限证明,在不扩大带宽和损失误码率性能的前提下,在加性高斯白噪声信道中,FTN信号可以比传统的奈奎斯特准则设计实现高达25%的传输速率。
[0004]为了满足更复杂和多样化的需求,AI被视为向6G系统的范式转变,网络智能将从收发器到接收器实现,考虑了智能的端到端系统实现。在未来6G系统中实现网络智能化,需要从通信角度研究ML。ML技术不仅将提供引人注目的系统性能,还将深刻改变未来6G网络的设计和配置。目前缺乏一个考虑延迟、可靠性、可用性、可扩展性和不确定性下的决策的整体框架。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种物理层参数智能决策与动态配置的方法,该方法的核心思想:首先,先提出物理层参数智能决策模型,然后,将该智能决策模型应用到超奈奎斯特传输(Faster

than

Nyquist,FTN)系统中。最后,实现FTN系统中的动态配置,验证物理层参数配置的完整性。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种物理层参数智能决策与动态配置的方法,包括以下步骤:
[0008]S1:基于媒体访问控制层智能决策模型(Medium Access Control Intelligent Decision,MID),智能决策出物理层调制参数,得到调制类型;
[0009]S2:通过选择调制类型来配置FTN系统中发送端的调制阶数;
[0010]S3:基于深度学习,设计FTN系统的接收端,实现不同信号的动态解调。
[0011]进一步,步骤S1中,所述媒体访问控制层智能决策模型MID将优化问题建模为马尔可夫决策过程(Marko Decision Processes,MDP),将决策问题转化成一个深度强化学习
(Deep Reinforcement learning,DRL)过程,通过实时交互当前网络各层环境变量,智能决策物理层调制参数,优化通信系统的传输速度。
[0012]进一步,定义用户在t时刻第j(j∈{1,2,...,J})个业务请求时的无线链路控制层的缓冲状态信息B(t)、媒体访问控制层的HOL延迟时间信息D(t)={d1(t),d2(t),...,d
j
(t),...,d
J
(t)}和物理层的信道质量信息H(t)为状态空间,物理层调制阶数m(t)={m1(t),...,m
j
(t),...m
J
(t)|m
j
(t)∈[4,16,64]}为动作空间;MID模型根据优化问题设计奖励函数。
[0013]进一步,所述缓冲状态信息B(t)包括有数据和无数据两种状态,当有数据时,MAC层中的智能体根据状态信息来进行智能分配资源;当无数据时就等待用户下一时刻的请求业务数据到到达缓冲区时,再进行调度。
[0014]进一步,所述延迟约束条件包括以下延迟函数:
[0015][0016]其中d
th
为延迟阈值,当延迟时间低于延迟阈值时,业务数据包将从缓冲区中被丢弃。
[0017]进一步,MID模型根据优化问题设计奖励函数,具体包括:
[0018]所述优化目标为在单位时间内满足延迟约束条件下传输码元的个数变化;
[0019]将所述优化问题建模为马尔可夫决策过程,其中:
[0020]马尔可夫决策过程中的状态表示为s={B(t),D(t),H(t)},动作表示a=(m(t)),通过引入调节因子δ来设计奖励函数,所述奖励函数如下:
[0021][0022]其中,B为带宽,j∈{1,2,...,J}表示为用户发送的第j个请求,SNR为用户在t时刻第j个请求观察到的顺是信噪比,m(t)={m1(t),m2(t),...,m
j
(t),...,m
J
(t)|m
j
(t)∈[4,16,64]}为t时刻第j个请求下的调制阶数,B(t)为t时刻RLC层的缓冲区状态。δ为调节因子,即δ=1/β,即β为在选择当前调制阶数下的放大倍数,即在低信噪比下,选择QPSK调制阶数时δ=1/β,在中、高信噪比下δ=1。同理,在中信噪比下,选择16QAM调制阶数时δ=1/β,在低、高信噪比下δ=1。在高信噪比下,选择64QAM调制阶数时δ=1/β,在低、中信噪比下δ=1。
[0023]进一步,所述将决策问题转化成一个深度强化学习过程,通过实时交互当前网络各层环境变量,智能决策物理层调制参数,优化通信系统的传输速度,具体包括:
[0024]使用深度强化学习中的DQN算法来训练MID模型,并根据5G NR实例确定系统仿真参数,根据实验获得的动态环境下选择调制阶数获得的平均奖励值,来选择在不同环境下适合的调制阶数,当奖励值在(0,1]之间时,物理层配置为QPSK,奖励值在(1,3.1]之间时,物理层配置为16QAM,奖励值在(3.1,8.2]之间时,物理层配置为64QAM。
[0025]进一步,所述步骤S2具体包括以下步骤:
[0026]S21:考虑具有正交幅度调制(QAM)方案和AWGN信道的FTN通信系统,在星座映射之后,基带信号通过一个整形滤波器h(t),发送的信号s(t)为:
[0027][0028]其中,E
s
为星座符号的平均能量x
k
(k=0,
±
1,
±
2,...)为第k个传输符号,τ为满足0<τ≤1的加速因子,T
N
为奈奎斯特极限;
[0029]S22:通过PSK/QAM解调计算对数似然比检测(Log Likelihood Ratio,LLR)算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物理层参数智能决策与动态配置的方法,其特征在于:包括以下步骤:S1:基于媒体访问控制层智能决策模型MID,智能决策出物理层调制参数,得到调制类型;S2:通过选择调制类型来配置FTN系统中发送端的调制阶数;S3:基于深度学习,设计FTN系统的接收端,实现不同信号的动态解调。2.根据权利要求1所述的物理层参数智能决策与动态配置的方法,其特征在于:步骤S1中,所述媒体访问控制层智能决策模型MID将优化问题建模为马尔可夫决策过程MDP,将决策问题转化成一个深度强化学习DRL过程,通过实时交互当前网络各层环境变量,智能决策物理层调制参数,优化通信系统的传输速度。3.根据权利要求2所述的物理层参数智能决策与动态配置的方法,其特征在于:定义用户在t时刻第j(j∈{1,2,...,J})个业务请求时的无线链路控制层的缓冲状态信息B(t)、媒体访问控制层的HOL延迟时间信息D(t)={d1(t),d2(t),...,d
j
(t),...,d
J
(t)}和物理层的信道质量信息H(t)为状态空间,物理层调制阶数m(t)={m1(t),...,m
j
(t),...m
J
(t)|m
j
(t)∈[4,16,64]}为动作空间;MID模型根据优化问题设计奖励函数。4.根据权利要求3所述的物理层参数智能决策与动态配置的方法,其特征在于:所述缓冲状态信息B(t)包括有数据和无数据两种状态,当有数据时,MAC层中的智能体根据状态信息来进行智能分配资源;当无数据时就等待用户下一时刻的请求业务数据到到达缓冲区时,再进行调度。5.根据权利要求2所述的物理层参数智能决策与动态配置的方法,其特征在于:所述延迟约束条件包括以下延迟函数:其中d
th
为延迟阈值,当延迟时间低于延迟阈值时,业务数据包将从缓冲区中被丢弃。6.根据权利要求5所述的物理层参数智能决策与动态配置的方法,其特征在于:MID模型根据优化问题设计奖励函数,具体包括:所述优化目标为在单位时间内满足延迟约束条件下传输码元的个数变化;将所述优化问题建模为马尔可夫决策过程,其中:马尔可夫决策过程中的状态表示为s={B(t),D(t),H(t)},动作表示a=(m(t)),通过引入调节因子δ来设计奖励函数,所述奖励函数如下:其中,B为带宽,j∈{1,2,...,J}表示为用户发送的第j个请求,SNR为用户在t时刻第j个请求观察到的顺是信噪比,m(t)={m1(t),m2(t),...,m
j
(t),...,m
J
(t)|m
j
(t)∈[4,16,64]}为t时刻第j个请求下的调制阶数,B(t)为t时刻RLC层的缓冲区状态;δ为调节因子,即δ=1/β,即β为在选择当前调制阶数下的放大倍数,即在低信噪比下,选择QPSK调制阶数时δ=1/β,在中、高信噪比下δ=1。同理,在中信噪比下,选择16QAM调制阶数时δ=1/β,在低、高信噪比下δ=1。在高信噪比下,选择64QAM调制阶数时δ=1/β,在低、中信噪比下δ=1。
7.根据权利要求2所述的物理层参数智能决策与动态配置的方法,其特征在于:所述将决策问题转化成一个深度强化学习过程,通过实时交互当前网络各层环境变量,智能决策物理层调制参数,优化通信系统的传输速度,具体包括:使用深度强化学习中的DQN算法来训练MID模型,并根据5G NR实例确定系...

【专利技术属性】
技术研发人员:邵凯任化梅
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1