【技术实现步骤摘要】
基于联邦学习的轨迹规划方法及装置
[0001]本申请涉及通信领域,具体而言,涉及一种基于联邦学习的轨迹规划方法及装置。
技术介绍
[0002]近年来,随着物联网以及相关智能设备的不断发展,越来越多的新兴移动技术逐渐进入到人们现实应用当中,如人脸识别、虚拟现实、智慧城市、车牌检测、智慧农业等。同时,随着现有设备应用智能化发展,智能手机、智能汽车、智能家具、智能传感器等数量呈现爆炸致增长。在这其中,计算密集型用户对于时延、能耗具有较强需求,因此对任务的计算方式提出了较高的要求。然而,考虑到现有硬件设备由于轻量化、便携性、经济性等技术需求,地面用户设备的计算能力较为有限,这极大程度限制了用户对于低时延能耗的性能需求,无法很好满足用户需求。
[0003]作为一种新技术,移动边缘计算(Mobile Edge Computing,MEC)通过将服务器从云端迁移到网络边缘,相较于更远端的云服务器,可以更贴近地面用户设备进行数据分析和处理。
[0004]传统移动通信通常依赖地面通信基础设施,此类对于预设地面用户有很好的覆盖效 ...
【技术保护点】
【技术特征摘要】
1.一种基于联邦学习的轨迹规划方法,其特征在于,包括:对无人机辅助地面通信网络中的通信环境、地面用户位置以及无人机初始位置进行初始化,并基于初始化得到的初始值计算所述无人机辅助地面通信网络的先验信息;基于所述先验信息,来建立覆盖无人机计算卸载优化模型,并利用深度强化学习通过训练过程求解所述覆盖无人机计算卸载优化模型,得到经深度强化学习训练而得的局部网络模型;基于所述局部网络模型,利用联邦学习迭代更新得到全局最优的无人机轨迹规划方案。2.根据权利要求1所述的方法,其特征在于,利用深度强化学习通过训练过程求解所述覆盖无人机计算卸载优化模型,包括循环执行以下步骤:基于预先设定的状态集、动作集和奖励函数,所述无人机根据当前状态选取动作,并根据当前网络环境的反馈计算所述无人机的所述当前状态的奖励值;获取所述无人机的下一状态的收益估计,根据所述收益估计和所述当前状态的奖励值更新所述当前状态的收益;从所述当前状态进入到下一状态,并将所述下一状态作为当前状态。3.根据权利要求2所述的方法,其特征在于,通过以下方式来定义所述状态集、动作集和奖励函数:确定优化无人机辅助地面通信网络中的设备的决策需求和约束条件;基于所确定的决策需求和约束条件,来定义所述设备中的无人机的状态集、动作集和奖励函数。4.根据权利要求3所述的方法,其特征在于,所述约束条件包括以下至少之一:在训练所述无人机计算卸载优化模型的过程中,通过所述联邦学习迭代一次的训练时间;在所述无人机的执行任务过程中,所述无人机执行所述任务的总能量消耗,其中,所述任务包括以下至少之一:移动、悬停、计算卸载;无人机辅助地面通信网络中的地面用户设备向所述无人机进行计算卸载的总消耗时间;所述地面用户设备进行本地卸载的计算时延。5.根据权利要求3所述的方法,其特征在于,所述决策需求包括以下至少之一:无人机负载公平性、服务地面用户地理公平性、和地面用户能量消耗最小化。...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。