System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多用户下行调度方法、装置、设备及存储介质制造方法及图纸_技高网

多用户下行调度方法、装置、设备及存储介质制造方法及图纸

技术编号:40421911 阅读:6 留言:0更新日期:2024-02-20 22:41
本发明专利技术公开了一种多用户下行调度方法、装置、设备及存储介质,属于无线传输技术领域。本发明专利技术通过获取逻辑信道的优先级因子;基于所述优先级因子确定优先级因子的权重系数;使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果;通过所述评估结果确定目标逻辑信道,并通过所述目标逻辑信道进行多用户下行调度,可动态调整各用户调度优先级的资源分配方案,以尽可能降低用户时延,提高无线网络的性能和用户体验。

【技术实现步骤摘要】

本专利技术涉及无线传输,尤其涉及一种多用户下行调度方法、装置、设备及存储介质


技术介绍

1、在5g中,mac(medium access control,媒体接入)层起着至关重要的作用,它负责管理和分配无线信道资源,优化资源利用率,满足不同用户和服务类型的需求,以提供高速率、低延迟的无线数据传输。其中,mac层的调度策略是为了优化无线信道资源的使用和满足不同用户和服务类型的需求而制定的,旨在提高系统容量、带宽利用率和用户体验,同时保证公平性和服务质量。

2、5g mac层采用多种调度策略来优化无线资源的分配和管理。调度策略是在整个网络范围内确定资源分配的一般原则,需考虑网络中不同用户和服务类型的需求,并通过合理的资源分配来提高系统容量、覆盖范围和用户体验。

3、现有的多用户下行调度中调度策略一旦确定,则按照固定模式进行调度,无法根据用户需求、网络拥塞情况进行灵活动态调整。


技术实现思路

1、本专利技术的主要目的在于提供一种多用户下行调度方法、装置、设备及存储介质,旨在解决现有技术多用户下行调度不够灵活导致调度效果差的技术问题。

2、为实现上述目的,本专利技术提供了一种多用户下行调度方法,所述方法包括以下步骤:

3、获取逻辑信道的优先级因子;

4、基于所述优先级因子确定优先级因子的权重系数;

5、使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果;

6、通过所述评估结果确定目标逻辑信道,并通过所述目标逻辑信道进行多用户下行调度。

7、可选地,所述获取逻辑信道的优先级因子,包括:

8、获取在进行多用户下行调度的影响因素;

9、根据所述影响因素确定逻辑信道的调度优先级;

10、通过所述调度优先级设置逻辑信道的优先级因子。

11、可选地,所述使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果,包括:

12、基于预设强化学习策略设置学习次数上限阈值,并初始化奖励值、初始化时间以及初始化存储奖励值的奖励值表;

13、基于所述预设强化学习策略将所述优先级因子的权重系数作为智能体;

14、基于所述智能体使用预设贪婪策略选择动作,并计算立即回报;

15、基于所述立即回报计算目标奖励值;

16、通过所述目标奖励值对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果。

17、可选地,所述基于所述智能体使用预设贪婪策略选择动作,并计算立即回报,包括:

18、基于所述智能体使用预设贪婪策略选择动作,统计预设时间段内各逻辑信道的平均时延;

19、根据所述平均时延计算立即回报。

20、可选地,所述基于所述立即回报计算目标奖励值,包括:

21、获取预设强化学习策略设置的学习率以及折扣因子;

22、根据奖励值与立即回报、学习率以及折扣因子之间的关系、所述立即回报、所述学习率以及所述折扣因子计算目标奖励值。

23、可选地,所述通过所述目标奖励值对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果,包括:

24、通过所述目标奖励值得到优先级因子的目标权重系数;

25、通过所述目标权重系数对所述权重系数进行调整,计算出逻辑信道的目标调度优先级;

26、通过所述目标调度优先级计算逻辑信道的目标优先级;

27、基于所述目标优先级得到表征逻辑信道优先级的评估结果。

28、可选地,所述基于所述目标优先级得到表征逻辑信道优先级的评估结果,包括:

29、对所述目标优先级进行排序,得到排序结果;

30、通过所述排序结果选择对应的逻辑信道,得到表征逻辑信道优先级的评估结果。

31、此外,为实现上述目的,本专利技术还提出一种多用户下行调度装置,所述多用户下行调度装置包括:

32、获取模块,用于获取逻辑信道的优先级因子;

33、确定模块,用于基于所述优先级因子确定优先级因子的权重系数;

34、调整模块,用于使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果;

35、所述确定模块,还用于通过所述评估结果确定目标逻辑信道,并通过所述目标逻辑信道进行多用户下行调度。

36、此外,为实现上述目的,本专利技术还提出一种多用户下行调度设备,所述多用户下行调度设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多用户下行调度程序,所述多用户下行调度程序配置为实现如上文所述的多用户下行调度方法的步骤。

37、此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有多用户下行调度程序,所述多用户下行调度程序被处理器执行时实现如上文所述的多用户下行调度方法的步骤。

38、本专利技术通过获取逻辑信道的优先级因子;基于所述优先级因子确定优先级因子的权重系数;使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果;通过所述评估结果确定目标逻辑信道,并通过所述目标逻辑信道进行多用户下行调度,可动态调整各用户调度优先级的资源分配方案,以尽可能降低用户时延,提高无线网络的性能和用户体验。

本文档来自技高网...

【技术保护点】

1.一种多用户下行调度方法,其特征在于,所述多用户下行调度方法包括:

2.如权利要求1所述的多用户下行调度方法,其特征在于,所述获取逻辑信道的优先级因子,包括:

3.如权利要求1所述的多用户下行调度方法,其特征在于,所述使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果,包括:

4.如权利要求3所述的多用户下行调度方法,其特征在于,所述基于所述智能体使用预设贪婪策略选择动作,并计算立即回报,包括:

5.如权利要求3所述的多用户下行调度方法,其特征在于,所述基于所述立即回报计算目标奖励值,包括:

6.如权利要求3所述的多用户下行调度方法,其特征在于,所述通过所述目标奖励值对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果,包括:

7.如权利要求6所述的多用户下行调度方法,其特征在于,所述基于所述目标优先级得到表征逻辑信道优先级的评估结果,包括:

8.一种多用户下行调度装置,其特征在于,所述多用户下行调度装置包括:

9.一种多用户下行调度设备,其特征在于,所述多用户下行调度设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多用户下行调度程序,所述多用户下行调度程序配置为实现如权利要求1至7中任一项所述的多用户下行调度方法。

10.一种存储介质,其特征在于,所述存储介质上存储有多用户下行调度程序,所述多用户下行调度程序被处理器执行时实现如权利要求1至7中任一项所述的多用户下行调度方法。

...

【技术特征摘要】

1.一种多用户下行调度方法,其特征在于,所述多用户下行调度方法包括:

2.如权利要求1所述的多用户下行调度方法,其特征在于,所述获取逻辑信道的优先级因子,包括:

3.如权利要求1所述的多用户下行调度方法,其特征在于,所述使用预设强化学习策略对所述优先级因子的权重系数进行调整,得到表征逻辑信道优先级的评估结果,包括:

4.如权利要求3所述的多用户下行调度方法,其特征在于,所述基于所述智能体使用预设贪婪策略选择动作,并计算立即回报,包括:

5.如权利要求3所述的多用户下行调度方法,其特征在于,所述基于所述立即回报计算目标奖励值,包括:

6.如权利要求3所述的多用户下行调度方法,其特征在于,所述通过所述目标奖励值对所述优先级因子...

【专利技术属性】
技术研发人员:戴静陆宇涛鞠震宇郑康漆雨菂盛锋王坚
申请(专利权)人:中国移动紫金江苏创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1