【技术实现步骤摘要】
一种面向天地一体化场景的智能时隙分配方法及系统
[0001]本专利技术涉及时隙分配
,具体涉及一种面向天地一体化场景的智能时隙分配方法及系统。
技术介绍
[0002]近年来,随着航空技术和无人机技术的高速发展,借助高空平台进行数据传输的空地一体化通信技术引起了学术界和工业界的广泛关注。空地一体化系统使用固定翼飞机或无人机作为升空基站,与地面网络融合,共同为用户提供应急通信服务。与卫星通信系统相比,它具有费用低,延迟小、架设快、容量大的优势;与地面通信系统相比,它具有多径衰落小、覆盖面积大、抗毁性强的优势。
[0003]但空地一体化网络所面临的网络架构和无线环境更为复杂,环境和业务的动态性和差异性也更为明显。一方面,不同于基于固定基站部署的地面通信技术,空地一体化网络的基站具有移动性。另一方面,地面、空中基站台联合为混合组网内的地面、空中移动台提供无缝接入服务,这些移动台共享无线资源,不同覆盖范围的小区形成了复杂异构的接入网。同时,网络中的业务负载种类繁多,包括话音、短报文、文件、视频等,各个业务在到达时间和空间 ...
【技术保护点】
【技术特征摘要】
1.一种面向天地一体化场景的智能时隙分配方法,其特征在于,该方法包括:不同用户根据业务需求实时向基站发送时隙请求信息,所述业务需求包括业务负载需求、业务类型需求和业务时延需求;基站基于收到所有用户的时隙请求信息和当前网络的时隙状态信息,采用基于强化学习的智能时隙分配法对所有用户的时隙请求信息进行时隙分配,得到用户的时隙分配策略;并将得到的时隙分配策略下发至相应用户,同时更新时隙状态信息。2.根据权利要求1所述的一种面向天地一体化场景的智能时隙分配方法,其特征在于,该方法还包括:基站周期性地更新与维护基站目前所属范围内所有用户的时隙状态信息和时隙请求信息。3.根据权利要求1所述的一种面向天地一体化场景的智能时隙分配方法,其特征在于,所述基于强化学习的智能时隙分配法对所有用户的时隙请求信息进行时隙分配的具体步骤为:搭建基于时隙分配的马尔可夫决策模型MDP,定义马尔可夫决策模型MDP的状态、动作、回报函数、转移概率集合、折扣因子、状态值函数和状态行为值函数;其中,所述马尔可夫决策模型MDP中以基站作为实体自主地收集环境状态信息,并根据用户的时隙请求信息决定时隙分配策略;在马尔可夫决策模型MDP中搭建基于强化学习的时隙分配算法,搜索使全局回报函数最大化的最佳动作,以得到最优的时隙分配策略。4.根据权利要求3所述的一种面向天地一体化场景的智能时隙分配方法,其特征在于,所述马尔可夫决策模型MDP的状态为用户的时隙请求信息和目前可用时隙状态信息,所述马尔可夫决策模型MDP的动作为每种业务被分配的时隙个数;所述马尔可夫决策模型MDP的动作向量构成动作空间,所述马尔可夫决策模型MDP采用回报函数来评价动作,优化目标是在满足不同业务需求的条件下最大化业务接入总数,从而最大化网络吞吐量。5.根据权利要求3所述的一种面向天地一体化场景的智能时隙分配方法,其特征在于,在马尔可夫决策模型MDP中搭建基于强化学习的时隙分配算法,搜索使全局回报函数最大化的最佳动作,以得到最优的时隙分配策略,包括:建立基于深度强化学习的智能时隙分配神经网络模型,并初始化模型参数;根据所述马尔可夫决策模型MDP和所有用户的时隙状态请求信息,收集网络中时隙的状态、动作和奖励信息,并将网络中时隙的状态、动作和奖励信息作为模型训练数据;使用模型训练数据训练所述基于深度强化学习的智能时隙分配神经网络模型,并基于AC算法搜索全局动作空间,输出使回报函数最大的时隙分配策略作为最优的时隙分配策略;根据所述最优的时隙分配策略,提取出每种业务被分配的总时隙个数;根据每种业务的时限请求信息得到可分配的用户数;以及根据业务到达时间,优先将时隙分配给等待...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。