【技术实现步骤摘要】
一种多无人机间数据智能组织与推送方法
[0001]本专利技术属于人工智能
,具体涉及一种多无人机间数据智能组织与推送方法。
技术介绍
[0002]数据智能推送:主要通过各个无人机携带的机载数据库进行数据的组织、管理、传输等操作,在有效数据准确传输的基础上,降低数据传输量,减少后续决策环节的计算负载和时延,高效完成任务。
[0003]OODA环:属于循环决策的一个概念,指代“观察O—判断O—决策D—行动A”的循环程序。基于观察,获取相关的外部信息,根据感知到的外部威胁,及时调整系统,做出应对决策,并采取相应行动。
[0004]强化学习:智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(Reinforcement Learning System)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式
【技术保护点】
【技术特征摘要】
1.一种多无人机间数据智能组织与推送方法,其步骤包括:步骤1):选取多个无人机,将其中至少一无人机作为数据接收端无人机DR
‑
UAV,其余无人机作为数据发送端DS
‑
UAV无人机;其中数据接收端无人机DR
‑
UAV具备同步对接多个数据发送端DS
‑
UAV无人机的能力,数据发送端DS
‑
UAV无人机具备与其对接的数据接收端无人机DR
‑
UAV单线联系的能力;设定强化学习算法的超参数以及任务完成性指标,每一个所述无人机上均配备强化学习算法,所述任务完成性指标为多无人机机群的共同目标;步骤2):初始化数据发送端无人机DS
‑
UAV和数据接收端无人机DR
‑
UAV的多无人机协同仿真环境,所述多无人机协同仿真环境具备获取数据发送端无人机与数据接收端无人机实时状态的能力;数据发送端无人机DS
‑
UAV中的步骤:步骤3):数据发送端无人机DS
‑
UAV与所述多无人机协同仿真环境进行交互,存储交互数据作为原始状态信息,然后根据所述原始状态信息形成强化学习算法中的状态空间;步骤4):数据发送端无人机DS
‑
UAV使用机载的一次判别模型对所述原始状态信息中的图像数据进行标注,添加图像标注结果至数据存储表中,称为一次判别结果;步骤5):数据发送端无人机DS
‑
UAV使用其机载强化学习算法的Actor节点,基于步骤4)所述一次判别结果生成推送列表;步骤6):数据发送端无人机DS
‑
UAV按照步骤5)所述数据推送列表将待传输数据发送给与其对接的数据接收端无人机DR
‑
UAV;数据接收端无人机DR
‑
UAV中的步骤:步骤7):数据接收端无人机DR
‑
UAV使用机载的二次判别模型对于已接收的数据进行处理,得到二次判别结果;步骤8):数据接收端无人机DR
‑
UAV基于该二次判别结果及接收的对应推送数据计算所述任务完成性指标的完成状态;步骤9):由所述任务完成性指标确定当前发送端无人机和接收端无人机协同任务的完成进度情况,进而判断当前任务的是否完成;若当前任务未完成则跳转到步骤10),若当前任务已完成则跳转到步骤12);步骤10):数据...
【专利技术属性】
技术研发人员:赵怡婧,刘雨蒙,王碧聪,万梓航,王潮,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。