【技术实现步骤摘要】
终端匹配方法、装置、电子设备及计算机可读存储介质
[0001]本公开涉及通信
,尤其涉及一种终端匹配方法
、
终端匹配装置
、
电子设备及计算机可读存储介质
。
技术介绍
[0002]在现有的移动通信系统中,一般采用频分双工
(Frequency Division Duplexing
,
FDD)
或时分双工
(Time Division Duplexing
,
TDD)
方式进行通信
。
在
FDD
模式的移动通信系统中,利用不同频率进行上下行通信,在分离的两个对称频率信道上进行接收和发送信号
。
采用
FDD
模式的移动通信系统在支持非对称业务时,频谱利用率将大大降低;且采用
FDD
模式的移动通信系统不能够灵活配置频率,对于零散频段不容易使用,也导致频谱利用率较低
。
在
TDD
模式的移动通信系统中,接收和传送是在同一频率信道的不同时隙进行,使用不同的时隙来分离接收和传送信道
。
由于采用
TDD
模式的移动通信系统的收发信道采用的是同频信道,需要预留较大的保护带,影响了整体频谱利用效率
。
即对于现有的移动通信系统经常采用的
FDD
模式和
TDD
模式,信号都只能在某一时间内或某一个具体频段上进行单向传输,导
【技术保护点】
【技术特征摘要】
1.
一种终端匹配方法,其特征在于,小区内包括上行终端和下行终端,所述方法包括:获得所述上行终端和所述下行终端的当前测量信息,以根据所述当前测量信息确定当前状态;根据所述小区的当前参数和所述当前测量信息确定所述当前状态的当前最大权值;基于所述当前最大权值确定当前奖励;根据所述当前状态和所述当前奖励对所述当前参数进行调节,获得目标参数;根据所述当前测量信息和所述目标参数确定所述上行终端和所述下行终端的终端对集合,其中所述终端对集合包括终端对,所述终端对中的上行终端和下行终端共用同一频率资源
。2.
如权利要求1所述的方法,其特征在于,基于所述当前最大权值确定当前奖励,包括:获取所述当前状态的前
n
个状态的历史最大权值,
n
为大于或等于1的正整数;根据所述当前状态的所述当前最大权值和所述前
n
个状态的历史最大权值确定所述当前奖励
。3.
如权利要求2所述的方法,其特征在于,根据所述当前状态的所述当前最大权值和所述前
n
个状态的历史最大权值确定所述当前奖励,包括:根据所述当前状态的所述当前最大权值
、
所述前
n
个状态的历史最大权值以及折扣因子,获得所述当前状态的最大权值差异值;基于所述当前状态的最大权值差异值确定所述当前奖励
。4.
如权利要求2所述的方法,其特征在于,
n
为大于或等于1且小于或等于3的正整数
。5.
如权利要求1所述的方法,其特征在于,根据所述当前状态和所述当前奖励对所述当前参数进行调节,获得目标参数,包括:根据所述当前状态和所述当前奖励获得所述当前状态的未来
m
个状态的预测奖励,
m
为大于或等于2的正整数;按照预设步长在调节范围内改变所述当前参数,确定使得所述未来
m
个状态的预测奖励之和的期望最大的当前参数为所述目标参数
。6.
如权利要求5所述的方法,其特征在于,根据所述当前状态和所述当前奖励获得所述当前状态的未来
m
个状态的预测奖励,包括:获得所述小区的当前状态奖励时间序列,所述当前状态奖励时间序列包括所述当前状态的所述当前奖励;根据所述当前状态奖励时间序列获得所述未来
m
个状态的预测奖励
。7.
如权利要求5所述的方法,其特征在于,
m
为大于或等于2且小于或等于5的正整数
。8.
如权利要求1至7任一项所述的方法,其特征在于,所述上行终端和所述下行终...
【专利技术属性】
技术研发人员:周阅天,蔡博文,南方,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。