一种通过动态调度无人终端最小化感知数据获取时延方法技术

技术编号:28633789 阅读:33 留言:0更新日期:2021-05-28 16:31
本发明专利技术的提出一种通过动态调度无人终端最小化感知数据获取时延方法,包括:步骤1、基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延;步骤2、基站开启子进程模拟无人终端轨迹数据获取时延上传至分布式优先经验复用池;步骤3、基站基于分布式优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹;步骤4、基站向无人终端发送最优轨迹动态调动指令获取感知区域内传感器的最新数据。本发明专利技术的技术方案可以通过基站动态调度无人终端,快速探索在移动群智感知技术场景中的未知情况,从而加快策略优化的速度,提高最小化感知数据获取时延的效果。

【技术实现步骤摘要】
一种通过动态调度无人终端最小化感知数据获取时延方法
本专利技术属于移动无人群智感知领域,具体涉及一种通过动态调度无人终端最小化感知数据获取时延方法。
技术介绍
移动群智感知技术支撑了智慧城市场景下的感知数据获取需求,该技术利用群体智能在城市环境中收集大量的数据,并在交通路况监管、自然灾害预警等问题上具有很高的实际应用价值。近年来,不同于以人为中心、以可携带终端(如iPhone、iWatch)为工具的传统群智感知技术,以移动无人终端(如无人机、无人车)为中心的移动无人群智感知技术能为智慧城市提供应用更广泛、数据更高质的感知数据获取服务。如图1所示,在一个智慧城市中分布着可生成不同类型数据的传感器节点,例如监控摄像头、WIFI路由以及楼内的温度传感器。与此同时,新一代无人终端搭载着多个智能天线,因此有能力在较快的传输速率下同时收集来自多个传感器节点的数据,这单靠传统群智感知技术是难以实现的。然而,在以移动无人终端为核心的移动无人群智感知技术中,绝大多数科研成果仅着眼于对终端轨迹的规划,试图找到一种能够在最小化能耗的同时尽可能提高感知数据采集量的行为模式。值得注意的是,现实场景的许多群智感知任务都需要尽可能实时地获取数据并上传到数据中心,例如环境监测与交通控制,因此这类场景中的数据获取过程通常都是要有强时效性的,这是需要通过动态调度无人终端来维护的。目前常用的基于随机过程的数据获取时延最小化算法、基于隐马尔科夫模型的期望最大化算法均只能处理单个无人终端的调度问题,且仅能服务少量节点,并且假设了每一个传感器都有相同的信道增益,同时数据的传输成功率基于一个伽玛分布下的随机过程。这类方法并不能保证在移动无人群智感知场景下感知数据获取时延最小。现有中国专利申请号为:202010374780.1,公开了一种无人机群路径规划方法,首先需要获取未知环境的信息,包括起始点和目标点的位置、障碍物的坐标、可能存在的雷达和导弹风险等;同时无人机群在规划路径时还需要考虑到无人机自身的性能,比如偏转角、俯仰角、飞行高度等;在此基础上,无人机通过粒子群优化算法的计算择优选取路径,实现对整个无人机群的路径规划。本专利技术能够实现无人机群在密集风险环境下的路径规划,使无人机群能够高效地飞行,协同完成任务。该专利技术围绕无人机群的路径规划,从提高空中交通系统安全性和高效性两方面出发,开展无人机群路径规划方法研究,这对于确保无人机飞行安全,降低飞行成本,增加空域容量,提高空中交通系统的运行效率具有重要意义。但是没有提出一种通过动态调度无人机、无人车等无人终端最小化感知数据获取时延的方法。又有中国专利申请号为:2020108210037,公开了一种无人机区域轨迹规划方法、装置及可读存储介质。该方法包括:获取无人机的飞行区域;判断飞行区域是否为凹多边形区域;若飞行区域为凹多边形区域,将凹多边形区域划分为相互垂直的横向飞行区域和纵向飞行区域;分别规划横向飞行区域和纵向飞行区域的区域轨迹;连接区域轨迹的轨迹点,生成规划后的飞行轨迹。通过实施该专利技术,对规划区域的凹凸性的判断,并对飞行区域进行划分,从而避免产生间隔区域,解决现有的直接往返飞行,但对无人机航行轨迹没有正确规划的问题,对不同区域的飞行区域的轨迹进行连接,完成轨迹规划,对凹多边形区域规划出最优的飞行轨迹,无人机正常作业时,提升作业效率,节约作业时间。同样没有提出一种通过动态调度无人机、无人车等无人终端最小化感知数据获取时延的方法。
技术实现思路
针对现有技术中的缺陷空白,本专利技术提出一种通过动态调度无人终端最小化感知数据获取时延方法。本专利技术解决问题的技术方案是:所述通过动态调度无人终端最小化感知数据获取时延方法包括:步骤1、基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延;步骤2、基站开启子进程模拟无人终端轨迹数据获取时延上传至分布式优先经验复用池;步骤3、基站基于分布式优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹;步骤4、基站向无人终端发送最优轨迹动态调动指令获取感知区域内传感器的最新数据。进一步的,步骤1所述基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延包括:在移动群智感知技术场景的基站上建立一个空的分布式优先级经验复用池,然后建立多个子进程,并初始化各子进程中仿真环境的参数,其中,仿真环境的参数包括无人终端位置、无人终端电量、传感器位置和各传感器的数据获取时延。进一步的,步骤2所述基站开启子进程模拟无人终端轨迹数据获取时延上传至优先经验复用池包括:步骤201、基站开启各个子进程,各子进程开启新回合并监测维护自身仿真环境,无人终端每一步均采取∈-greedy策略,基站以动态选取的∈参数动态调度环境中的所有无人终端;步骤202、各子进程以异步执行的方式对各自仿真环境中无人终端轨迹与传感器感知数据获取时延的变化进行模拟,当某一回合检测到存在无人终端撞到障碍物或者耗尽电量,则立即结束本次子进程这一回合,并重新初始化自身的仿真环境参数;否则,在当前时间t中,无人终端观察当前局面状态st,执行一次移动和数据获取动作at,移动到当前环境中需要重置数据获取时延的传感器位置,并将这些传感器的当前数据获取时延重置为1,其它传感器数据获取时延自动进行累加,根据各个传感器上数据获取时延的变化,计算当前局面奖励rt,然后将本次子进程的局面状态st、本次移动和数据获取动作at及计算的当前局面奖励rt发送至分布式优先经验复用池。进一步的,步骤3所述基站基于优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹包括:步骤301、基站判断分布式优先经验复用池是否收集10%存储空间的经验数据,当不满足时,各子进程还需要采用异步执行方式获取10%存储空间的经验数据;步骤302、当分布式优先经验复用池存在满足10%空间的经验数据,分布式优先级经验复用池中依照现有的优先级w采样出批量经验数据;步骤303、基站的主进程根据批量经验数据,按照第一计算模型计算当前最佳动作第一计算模型如下式(1):上式(1)中,为满足0到0.25间的均匀分布的一个随机乘子,为价值采样,G为采样次数,argmax表示选取期望值最大的向量元素操作;步骤304、基站将当前最佳动作发送至仿真环境中的无人终端,无人终端根据当前最佳动作更新到下一个局面状态st+1,基站的主进程按照第一计算模型计算下一最佳动作步骤305、基站的主进程根据当前局面状态st、本次移动和数据获取动作at、以及下一个局面状态st+1、下一最佳动作按照第二模型计算误差矩阵TD的各个元素TDij,第二计算模型如下式(2):上式(2)中,TDij为误差矩阵TD的各个元素,rt为当前局面奖励,为当前局面分布的独立均匀采样,为下一个局面分布的独立均匀采样,γ为衰减因子;步骤306、基站的主进程通过第三计算模型的梯度下降法更新参数,第三计算模型如下式(3):...

【技术保护点】
1.一种通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,包括:/n步骤1、基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延;/n步骤2、基站开启子进程模拟无人终端轨迹数据获取时延上传至分布式优先经验复用池;/n步骤3、基站基于分布式优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹;/n步骤4、基站向无人终端发送最优轨迹动态调动指令获取感知区域内传感器的最新数据。/n

【技术特征摘要】
1.一种通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,包括:
步骤1、基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延;
步骤2、基站开启子进程模拟无人终端轨迹数据获取时延上传至分布式优先经验复用池;
步骤3、基站基于分布式优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹;
步骤4、基站向无人终端发送最优轨迹动态调动指令获取感知区域内传感器的最新数据。


2.根据权利要求1所述的通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,步骤1所述基站主进程设立分布式优先经验复用池并初始化所有传感器的数据获取时延包括:
在移动群智感知技术场景的基站上建立一个空的分布式优先级经验复用池,然后建立多个子进程,并初始化各子进程中仿真环境的参数,其中,仿真环境的参数包括无人终端位置、无人终端电量、传感器位置和各传感器的数据获取时延。


3.根据权利要求1所述的通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,步骤2所述基站开启子进程模拟无人终端轨迹数据获取时延上传至优先经验复用池包括:
步骤201、基站开启各个子进程,各子进程开启新回合并监测维护自身仿真环境,无人终端每一步均采取∈-greedy策略,基站以动态选取的∈参数动态调度环境中的所有无人终端;
步骤202、各子进程以异步执行的方式对各自仿真环境中无人终端轨迹与传感器感知数据获取时延的变化进行模拟,当某一回合检测到存在无人终端撞到障碍物或者耗尽电量,则立即结束该子进程这一回合,并重新初始化自身的仿真环境参数;
否则,在当前时间t中,无人终端观察当前局面状态st,执行一次移动和数据获取动作at,移动到当前环境中需要重置数据获取时延的传感器位置,并将这些传感器的当前数据获取时延重置为1,其它传感器数据获取时延自动进行累加,根据各个传感器上数据获取时延的变化,计算当前局面奖励rt,然后将本次子进程的局面状态st、本次移动和数据获取动作at及计算的当前局面奖励rt发送至分布式优先经验复用池。


4.根据权利要求1所述的通过动态调度无人终端最小化感知数据获取时延方法,其特征在于,步骤3所述基站基于优先经验复用池采用分位数误差矩阵算法求解最小化感知数据获取时延的最优轨迹包括:
步骤301、基站判断分布式优先经验复用...

【专利技术属性】
技术研发人员:刘驰戴子彭
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1