调度方法、调度系统和调度装置制造方法及图纸

技术编号:31009735 阅读:8 留言:0更新日期:2021-11-30 00:05
本申请提供了一种调度方法、调度系统和调度装置,调度器在获取到终端设备发送的上一次调度决策的收益反馈后,可以在接收到收益反馈之后的N个时间单元发送根据该收益反馈计算的本次的调度决策,其中,N>1且N为整数,从而能够留给调度器充足的时间进行调度决策的计算与编码,有效解决了调度器无法及时获取上一次调度决策收益时,调度流程与空口时序卡滞冲突的问题。的问题。的问题。

【技术实现步骤摘要】
调度方法、调度系统和调度装置


[0001]本申请涉及通信领域,并且具体地,涉及一种调度方法、调度系统和调度装置。

技术介绍

[0002]在蜂窝网络中,介质访问控制(media access control,MAC)层调度主要解决时频资源的分配、调制与编码策略(modulation and coding scheme,MCS)选择、用户配对、预编码等问题,通过调度来实现系统吞吐和公平性的折中。
[0003]目前使用深度强化学习的基站(base station,BS)调度器可更好地实现系统吞吐和公平性的折中。在进行深度强化学习的过程中,调度器在接收到上次调度决策的收益反馈之后,要根据该收益反馈确定本次的调度决策,然后将本次的调度决策发送给BS进行下行控制信息(downlink control information,DCI)编码之后由BS在约定的时间发送给终端设备,在实际中,可能由于调度器无法及时获取到上次调度决策的收益,导致BS无法在系统约定时间发送本次的调度决策的DCI编码,从而造成空口反馈滞后,导致调度器无法在时序上有效地进行深度强化训练。

技术实现思路

[0004]本申请提供一种调度方法、调度系统和调度装置,有效解决了调度器无法及时获取上一次调度决策收益时,调度流程与空口时序卡滞冲突的问题。
[0005]第一方面,提供了一种调度方法,应用于由至少一个调度器组成的调度系统中,调度系统包括第一调度器,方法包括:第一调度器在第i个时间单元获取第一收益反馈,其中,i≥1且i为整数;第一调度器根据第一收益反馈确定第一调度决策,其中,第一收益反馈是终端设备根据第二调度决策确定的,第二调度决策为第一调度器在第一调度决策之前确定的上一次的调度决策;第一调度器在第i+N个时间单元发送第一调度决策,其中,N>1且N为整数。
[0006]上述技术方案中,调度器在获取到上一次调度决策的收益反馈时,可以在接收到收益反馈之后的N个时间单元发送根据该收益反馈计算的本次的调度决策,从而能够留给调度器充足的时间进行调度决策的计算与编码,有效解决了调度器无法及时获取上一次调度决策收益时,调度流程与空口时序卡滞冲突的问题。
[0007]结合第一方面,在第一方面的某些实现方式中,调度系统还包括一个或多个第二调度器,方法还包括:第二调度器在第i+j个时间单元获取第二收益反馈,其中,1≤j≤N-1且j为整数;第二调度器根据第二收益反馈确定第三调度决策,其中,第二收益反馈是终端设备根据第四调度决策确定的,第四调度决策为第二调度器在第三调度决策之前确定的上一次的调度决策,第一调度器确定的调度决策和第二调度器确定的调度决策分别为第一调度器和第二调度器对同一任务的调度决策;第二调度器在第i+j+M个时间单元发送第二调度决策,其中,M>1且M为整数。
[0008]上述技术方案中,相对于只使用1个调度器的使用场景更宽泛,采用多调度器协作
调度的调度流程方案,第一调度器和第二调度器交替获取上行收益反馈并输出调度策略,有效地提升调度器对空口环境的适应性。
[0009]结合第一方面,在第一方面的某些实现方式中,第一调度器向第二调度器发送第一信息,第一信息包括第一调度决策或第三收益反馈,第三收益反馈是终端设备根据第一调度决策确定的;第二调度器接收第一信息并根据第一信息调整之后对任务的调度决策。
[0010]上述技术方案中,调度器间具有信息交互功能,可以调整自身的调度参数,确保不同调度器的调度策略相近、相同,以及调度收益最大化。
[0011]结合第一方面,在第一方面的某些实现方式中,第二调度器向第一调度器发送第二信息,第二信息包括第二调度决策或第四收益反馈,第四收益反馈是终端设备根据第二调度决策确定的;第一调度器接收第二信息并根据第二信息调整之后对任务的调度决策。
[0012]上述技术方案中,调度器间具有信息交互功能,可以调整自身的调度参数,确保不同调度器的调度策略相近、相同,以及调度收益最大化。
[0013]第二方面,提供了一种调度方法,方法包括:终端设备在第i个时间单元发送第一收益反馈,其中,i≥1且i为整数;终端设备在第i+N个时间单元接收第一调度器根据第一收益反馈确定的第一调度决策,其中,第一收益反馈是终端设备根据第二调度决策确定的,第二调度决策为第一调度器在第一调度决策之前确定的上一次的调度决策,N>1且N为整数。
[0014]上述技术方案中,终端设备在发送收益反馈后,在一段时间之后再接收调度器针对该收益反馈的调度决策,这样可以留给调度器充足的时间进行调度决策的计算与编码,从而有效解决了调度器无法及时获取上一次调度决策收益时,调度流程与空口时序卡滞冲突的问题。
[0015]结合第二方面,在第二方面的某些实现方式中,终端设备在第i+j个时间单元发送第二收益反馈,其中,1≤j≤N-1且j为整数;终端设备在第i+j+M个时间单元接收第二调度器根据第二收益反馈确定的第三调度决策,其中,M>1且M为整数,第二收益反馈是终端设备根据第四调度决策确定的,第四调度决策为第二调度器在第三调度决策之前确定的上一次的调度决策,第一调度器确定的调度决策和第二调度器确定的调度决策分别为第一调度器和第二调度器对同一任务的调度决策。
[0016]上述技术方案中,采用多调度器协作调度的调度流程方案,终端设备交替接收不同调度器的调度决策并根据不同的调度器的调度决策确定收益反馈并发送给对应的调度器,有效地提升调度器对空口环境的适应性。
[0017]结合第二方面,在第二方面的某些实现方式中,N等于2。
[0018]结合第二方面,在第二方面的某些实现方式中,N的值是通信系统或通信协议规定的。
[0019]第三方面,提供了一种调度系统,调度系统包括:第一调度器,用于在第i个时间单元获取第一收益反馈,其中,i≥1且i为整数;第一调度器,还用于根据第一收益反馈确定第一调度决策,其中,第一收益反馈是终端设备根据第二调度决策确定的,第二调度决策为第一调度器在第一调度决策之前确定的上一次的调度决策;第一调度器,还用于在第i+N个时间单元发送第一调度决策,其中,N>1且N为整数。
[0020]结合第三方面,在第三方面的某些实现方式中,调度系统还包括一个或多个第二调度器,第二调度器,用于在第i+j个时间单元获取第二收益反馈,其中,1≤j≤N-1且j为整
数;第二调度器,还用于根据第二收益反馈确定第三调度决策,其中,第二收益反馈是终端设备根据第四调度决策确定的,第四调度决策为第二调度器在第三调度决策之前确定的上一次的调度决策,第一调度器确定的调度决策和第二调度器确定的调度决策分别为第一调度器和第二调度器对同一任务的调度决策;第二调度器,还用于在第i+j+M个时间单元发送第二调度决策,其中,M>1且M为整数。
[0021]结合第三方面,在第三方面的某些实现方式中,第一调度器,还用于向第二调度器发送第一信息,第一信息包括第一调度决策或第三收益反馈,第三收益反馈是终端设备根据第一调度决策确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种调度方法,其特征在于,应用于由至少一个调度器组成的调度系统中,所述调度系统包括第一调度器,所述方法包括:所述第一调度器在第i个时间单元获取第一收益反馈,其中,i≥1且i为整数;所述第一调度器根据所述第一收益反馈确定第一调度决策,其中,所述第一收益反馈是终端设备根据第二调度决策确定的,所述第二调度决策为所述第一调度器在所述第一调度决策之前确定的上一次的调度决策;所述第一调度器在第i+N个时间单元发送所述第一调度决策,其中,N>1且N为整数。2.根据权利要求1所述的方法,其特征在于,所述调度系统还包括一个或多个第二调度器,所述方法还包括:所述第二调度器在第i+j个时间单元获取第二收益反馈,其中,1≤j≤N-1且j为整数;所述第二调度器根据所述第二收益反馈确定第三调度决策,其中,所述第二收益反馈是所述终端设备根据第四调度决策确定的,所述第四调度决策为所述第二调度器在所述第三调度决策之前确定的上一次的调度决策,所述第一调度器确定的调度决策和所述第二调度器确定的调度决策分别为所述第一调度器和所述第二调度器对同一任务的调度决策;所述第二调度器在第i+j+M个时间单元发送所述第二调度决策,其中,M>1且M为整数。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:所述第一调度器向所述第二调度器发送第一信息,所述第一信息包括所述第一调度决策或第三收益反馈,所述第三收益反馈是所述终端设备根据所述第一调度决策确定的;所述第二调度器接收所述第一信息并根据所述第一信息调整之后对所述任务的调度决策。4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:所述第二调度器向所述第一调度器发送第二信息,所述第二信息包括所述第二调度决策或第四收益反馈,所述第四收益反馈是所述终端设备根据所述第二调度决策确定的;所述第一调度器接收所述第二信息并根据所述第二信息调整之后对所述任务的调度决策。5.一种调度方法,其特征在于,包括:终端设备在第i个时间单元发送第一收益反馈,其中,i≥1且i为整数;所述终端设备在第i+N个时间单元接收第一调度器根据所述第一收益反馈确定的第一调度决策,其中,所述第一收益反馈是所述终端设备根据第二调度决策确定的,所述第二调度决策为所述第一调度器在所述第一调度决策之前确定的上一次的调度决策,N>1且N为整数。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:所述终端设备在第i+j个时间单元发送第二收益反馈,其中,1≤j≤N-1且j为整数;所述终端设备在第i+j+M个时间单元接收第二调度器根据所述第二收益反馈确定的第三调度决策,其中,M>1且M为整数,所述第二收益反馈是所述终端设备根据第四调度决策确定的,所述第四调度决策为所述第二调度器在所述第三调度决策之前确定的上一次的调度决策,所述第一调度器确定的调度决策和所述第二调度器确定的调度决策分别为所述第一
调度器和所述第二调度器对同一任务的调度决策。7.根据权利要求5或6所述的方法,其特征在于,N等于2。8.根据权利要求5至7中任一项所述的方法,其特征在于,所述N的值是通信系统或通信协议规定的。9.一种调度系统,其特征在于,所述调度系统包括:第一调度器,用于在第i个时间单元获取第一收益反馈,其中,i≥1且i为整数;所述第一调度器,还用于根据所述第一收益反馈确定第一调度决策,其中,所述第一收益反馈是终端设备根据第二调度决策确定的,所述第二调度决策为所述第一调度器在所述第一调度决策之前确定的上一次的调度决策;所述第一调度器,还用于在第i+N个时间单元发送所述第一调度决策,其中,N>1且N为整数。10.根据权利要求9所述的调度系统,其特征在于,所述调度系统还包括一个或多个第二调度器,所述第二调度器,用于在第i+j个时间单元获取第二收益反馈,其中,1≤j≤N-1且...

【专利技术属性】
技术研发人员:韩育超金爱祥张倬钒王坚李榕杜颖钢
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1