【技术实现步骤摘要】
一种信道分配方法、信道分配装置及电子设备
本申请属于移动通信
,尤其涉及一种信道分配方法、信道分配装置、电子设备及计算机可读存储介质。
技术介绍
高空平台通信网络(HighAltitudePlatformStations,HAPS)是指在近地空间的高度约20-100Km,长驻空间5-10年,相对静止并装载有一定规模有效载荷的高空平台所构成的网络。高空平台利用其良好的电波传输特性实现地面用户之间、高空平台之间或者高空平台与卫星之间的通信连接,具有布局灵活、应用广泛、成本低廉和安全可靠等优点。近年来,高空平台通信受到广泛关注,但考虑到当前通信网络的进一步发展,未来HAPS将面临海量的数据连接,其所需要处理的信道分配也将是海量级的。然而,当前的信道分配方法不足以在短时间内实现海量级的信道分配操作。
技术实现思路
有鉴于此,本申请提供了一种信道分配方法、信道分配装置、电子设备及计算机可读存储介质,可提升信道分配的速度及效率,实现海量级的信道分配操作。本申请的第一方面提供了一种信道分配方法,包括:获取待训练的信道分配模型的训练数据集,上述训练数据集包括一个以上待训练业务,上述待训练业务关联有一个以上待训练信道;将上述训练数据集输入至上述待训练的信道分配模型后,针对任一待训练业务,初始化与上述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻上述一个以上待训练信道的状态,记为第一状态,并基于上述第一状态对上述状态模式矩阵进行更新;基于上述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定上述信道分配动作集合中的一个信道分配动作,记为第一动作,并 ...
【技术保护点】
1.一种信道分配方法,其特征在于,包括:获取待训练的信道分配模型的训练数据集,所述训练数据集包括一个以上待训练业务,所述待训练业务关联有一个以上待训练信道;将所述训练数据集输入至所述待训练的信道分配模型后,针对任一待训练业务,初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新;基于所述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定所述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行所述第一动作,获得瞬时回报值,其中,所述瞬时回报值与所述第一状态及所述第一动作相关联;根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值;基于计算得到的所述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;获取待分配业务及与所述待分配业务相关的一个以上待分配信道,将所述待分配业务及待分配信道输入至已训练的所述信道分配模型中,得到所述待分配业务在所述一个以上待分配信道上的分配结果。
【技术特征摘要】
1.一种信道分配方法,其特征在于,包括:获取待训练的信道分配模型的训练数据集,所述训练数据集包括一个以上待训练业务,所述待训练业务关联有一个以上待训练信道;将所述训练数据集输入至所述待训练的信道分配模型后,针对任一待训练业务,初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新;基于所述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定所述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行所述第一动作,获得瞬时回报值,其中,所述瞬时回报值与所述第一状态及所述第一动作相关联;根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值;基于计算得到的所述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;获取待分配业务及与所述待分配业务相关的一个以上待分配信道,将所述待分配业务及待分配信道输入至已训练的所述信道分配模型中,得到所述待分配业务在所述一个以上待分配信道上的分配结果。2.如权利要求1所述的信道分配方法,其特征在于,所述根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值之后,所述信道分配方法还包括:获取预设的缓存单元所缓存的交互数据,其中,所述交互数据包括信道状态、信道分配动作;将所述交互数据中的信道状态及信道分配动作输入至待训练的反向传播BP神经网络中,对计算得到的所述收益Q值进行训练;所述基于计算得到的所述收益Q值,对Q值记录表进行更新,包括:基于训练后所得到的收益Q值对所述Q值记录表进行更新。3.如权利要求1或2所述的信道分配方法,其特征在于,所述执行所述第一动作,获得瞬时回报值,包括:在所述第一动作执行完毕后,检测所述一个以上待训练信道是否满足预设的一个以上信道分配原则;根据所述一个以上信道分配原则的满足情况,计算所述瞬时回报值。4.如权利要求1或2所述的信道分配方法,其特征在于,所述初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵,包括:确定与所述待训练业务相关联的一个以上待训练信道的信道数量;基于所述信道数量创建状态模式矩阵,并将所述状态模式矩阵中的元素初始化为0;相应地,所述获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新,包括:针对一个以上待训练信道中的任一待训练信道,检测所述待训练信道的当前占用情况、当前冲突情况、当前信道质量及业务等级;基于所述当前占用情况、所述当前冲突情况、所述当前信道质量及所述业务等级,确定所述待训练信道的状态;将获取到的各个待训练信道的状态记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新。5.如权利要求1或2所述的信道分配方法,其...
【专利技术属性】
技术研发人员:吴舟,管明祥,崔英杰,叶剑峰,王乐,彭保,
申请(专利权)人:深圳信息职业技术学院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。