一种信道分配方法、信道分配装置及电子设备制造方法及图纸

技术编号:22105634 阅读:39 留言:0更新日期:2019-09-14 04:38
本申请公开了一种信道分配方法、信道分配装置、电子设备及计算机可读存储介质,该信道分配方法包括:在初始化与待训练业务相关联的一个以上待训练信道的状态模式矩阵后,获取当前时刻一个以上待训练信道的第一状态,基于第一状态对状态模式矩阵进行更新,随后基于第一状态以及预设的信道分配原则,获取信道分配动作集合,再选定信道分配动作集合中的一个信道分配动作执行,获得瞬时回报值,接着根据状态、动作及瞬时回报值计算收益Q值,并对Q值记录表进行更新,以训练得到信道分配模型。本申请方案通过信道的状态、动作及瞬时回报值完成对信道分配模型的训练,能够实现信道的快速智能分配。

A Channel Allocation Method, Channel Allocation Device and Electronic Equipment

【技术实现步骤摘要】
一种信道分配方法、信道分配装置及电子设备
本申请属于移动通信
,尤其涉及一种信道分配方法、信道分配装置、电子设备及计算机可读存储介质。
技术介绍
高空平台通信网络(HighAltitudePlatformStations,HAPS)是指在近地空间的高度约20-100Km,长驻空间5-10年,相对静止并装载有一定规模有效载荷的高空平台所构成的网络。高空平台利用其良好的电波传输特性实现地面用户之间、高空平台之间或者高空平台与卫星之间的通信连接,具有布局灵活、应用广泛、成本低廉和安全可靠等优点。近年来,高空平台通信受到广泛关注,但考虑到当前通信网络的进一步发展,未来HAPS将面临海量的数据连接,其所需要处理的信道分配也将是海量级的。然而,当前的信道分配方法不足以在短时间内实现海量级的信道分配操作。
技术实现思路
有鉴于此,本申请提供了一种信道分配方法、信道分配装置、电子设备及计算机可读存储介质,可提升信道分配的速度及效率,实现海量级的信道分配操作。本申请的第一方面提供了一种信道分配方法,包括:获取待训练的信道分配模型的训练数据集,上述训练数据集包括一个以上待训练业务,上述待训练业务关联有一个以上待训练信道;将上述训练数据集输入至上述待训练的信道分配模型后,针对任一待训练业务,初始化与上述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻上述一个以上待训练信道的状态,记为第一状态,并基于上述第一状态对上述状态模式矩阵进行更新;基于上述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定上述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行上述第一动作,获得瞬时回报值,其中,上述瞬时回报值与上述第一状态及上述第一动作相关联;根据上述第一状态、上述第一动作及上述瞬时回报值计算收益Q值;基于计算得到的上述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;获取待分配业务及与上述待分配业务相关的一个以上待分配信道,将上述待分配业务及待分配信道输入至已训练的上述信道分配模型中,得到上述待分配业务在上述一个以上待分配信道上的分配结果。本申请的第二方面提供了一种信道分配装置,包括:训练数据获取单元,用于获取待训练的信道分配模型的训练数据集,上述训练数据集包括一个以上待训练业务,上述待训练业务关联有一个以上待训练信道;初始化单元,用于将上述训练数据集输入至上述待训练的信道分配模型后,针对任一待训练业务,初始化与上述待训练业务相关联的一个以上待训练信道的状态模式矩阵;状态更新单元,用于获取当前时刻上述一个以上待训练信道的状态,记为第一状态,并基于上述第一状态对上述状态模式矩阵进行更新;集合获取单元,用于基于上述第一状态以及预设的信道分配原则,获取信道分配动作集合;动作执行单元,用于选定上述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行上述第一动作,获得瞬时回报值,其中,上述瞬时回报值与上述第一状态及上述第一动作相关联;收益计算单元,用于根据上述第一状态、上述第一动作及上述瞬时回报值计算收益Q值;收益更新单元,用于基于计算得到的上述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;模型应用单元,用于获取待分配业务及与上述待分配业务相关的一个以上待分配信道,将上述待分配业务及待分配信道输入至已训练的上述信道分配模型中,得到上述待分配业务在上述一个以上待分配信道上的分配结果。本申请的第三方面提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。本申请的第四方面提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。本申请的第五方面提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。由上可见,在本申请方案中,在信道分配模型的训练过程中,首先获取待训练的信道分配模型的训练数据集,上述训练数据集包括一个以上待训练业务,上述待训练业务关联有一个以上待训练信道,然后将上述训练数据集输入至上述待训练的信道分配模型后,针对任一待训练业务,初始化与上述待训练业务相关联的一个以上待训练信道的状态模式矩阵,接着获取当前时刻上述一个以上待训练信道的状态,记为第一状态,并基于上述第一状态对上述状态模式矩阵进行更新,并基于上述第一状态以及预设的信道分配原则,获取信道分配动作集合,随后选定上述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行上述第一动作,获得瞬时回报值,其中,上述瞬时回报值与上述第一状态及上述第一动作相关联,根据上述第一状态、上述第一动作及上述瞬时回报值计算收益Q值,再基于计算得到的上述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;当训练完成后,可应用该已训练的信道分配模型,获取待分配业务及与上述待分配业务相关的一个以上待分配信道,将上述待分配业务及待分配信道输入至已训练的上述信道分配模型中,得到上述待分配业务在上述一个以上待分配信道上的分配结果。本申请方案通过信道的状态、动作及瞬时回报值,实现对信道分配模型的训练,能够实现信道的快速智能分配。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的信道分配方法的实现流程示意图;图2是本申请实施例提供的信道分配装置的结构框图;图3是本申请实施例提供的电子设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请上述的技术方案,下面通过具体实施例来进行说明。实施例一下面对本申请实施例提供的一种信道分配方法进行描述,请参阅图1,本申请实施例中的信道分配方法包括信道分配模型的训练过程及应用过程,其具体流程如下:在步骤101中,获取待训练的信道分配模型的训练数据集,上述训练数据集包括一个以上待训练业务,上述待训练业务关联有一个以上待训练信道;在本申请实施例中,采用信道分配模型实现智能信道分配操作,因而,首先对信道分配模型的训练过程作出说明:在本申请实施例中,为了实现对待训练的信道分配模型的训练,可以先获取训练数据集,上述训练数据集中包含有一个以上待训练任务,具体地,该待训练任务中包含一个待训练业务及与该待训练业务相关的待训练信道,本文档来自技高网...

【技术保护点】
1.一种信道分配方法,其特征在于,包括:获取待训练的信道分配模型的训练数据集,所述训练数据集包括一个以上待训练业务,所述待训练业务关联有一个以上待训练信道;将所述训练数据集输入至所述待训练的信道分配模型后,针对任一待训练业务,初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新;基于所述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定所述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行所述第一动作,获得瞬时回报值,其中,所述瞬时回报值与所述第一状态及所述第一动作相关联;根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值;基于计算得到的所述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;获取待分配业务及与所述待分配业务相关的一个以上待分配信道,将所述待分配业务及待分配信道输入至已训练的所述信道分配模型中,得到所述待分配业务在所述一个以上待分配信道上的分配结果。

【技术特征摘要】
1.一种信道分配方法,其特征在于,包括:获取待训练的信道分配模型的训练数据集,所述训练数据集包括一个以上待训练业务,所述待训练业务关联有一个以上待训练信道;将所述训练数据集输入至所述待训练的信道分配模型后,针对任一待训练业务,初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵;获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新;基于所述第一状态以及预设的信道分配原则,获取信道分配动作集合;选定所述信道分配动作集合中的一个信道分配动作,记为第一动作,并执行所述第一动作,获得瞬时回报值,其中,所述瞬时回报值与所述第一状态及所述第一动作相关联;根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值;基于计算得到的所述收益Q值,对Q值记录表进行更新,直至各个待训练业务及与各个待训练业务相关联的一个以上待训练信道均被分配完成为止,得到已训练的信道分配模型;获取待分配业务及与所述待分配业务相关的一个以上待分配信道,将所述待分配业务及待分配信道输入至已训练的所述信道分配模型中,得到所述待分配业务在所述一个以上待分配信道上的分配结果。2.如权利要求1所述的信道分配方法,其特征在于,所述根据所述第一状态、所述第一动作及所述瞬时回报值计算收益Q值之后,所述信道分配方法还包括:获取预设的缓存单元所缓存的交互数据,其中,所述交互数据包括信道状态、信道分配动作;将所述交互数据中的信道状态及信道分配动作输入至待训练的反向传播BP神经网络中,对计算得到的所述收益Q值进行训练;所述基于计算得到的所述收益Q值,对Q值记录表进行更新,包括:基于训练后所得到的收益Q值对所述Q值记录表进行更新。3.如权利要求1或2所述的信道分配方法,其特征在于,所述执行所述第一动作,获得瞬时回报值,包括:在所述第一动作执行完毕后,检测所述一个以上待训练信道是否满足预设的一个以上信道分配原则;根据所述一个以上信道分配原则的满足情况,计算所述瞬时回报值。4.如权利要求1或2所述的信道分配方法,其特征在于,所述初始化与所述待训练业务相关联的一个以上待训练信道的状态模式矩阵,包括:确定与所述待训练业务相关联的一个以上待训练信道的信道数量;基于所述信道数量创建状态模式矩阵,并将所述状态模式矩阵中的元素初始化为0;相应地,所述获取当前时刻所述一个以上待训练信道的状态,记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新,包括:针对一个以上待训练信道中的任一待训练信道,检测所述待训练信道的当前占用情况、当前冲突情况、当前信道质量及业务等级;基于所述当前占用情况、所述当前冲突情况、所述当前信道质量及所述业务等级,确定所述待训练信道的状态;将获取到的各个待训练信道的状态记为第一状态,并基于所述第一状态对所述状态模式矩阵进行更新。5.如权利要求1或2所述的信道分配方法,其...

【专利技术属性】
技术研发人员:吴舟管明祥崔英杰叶剑峰王乐彭保
申请(专利权)人:深圳信息职业技术学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1