System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种无人机和勤务车协同导航的动态规划方法技术_技高网

一种无人机和勤务车协同导航的动态规划方法技术

技术编号:41131269 阅读:2 留言:0更新日期:2024-04-30 18:00
本发明专利技术是一种无人机和勤务车协同导航的动态规划方法。本发明专利技术涉及无人机和勤务车协同导航的动态规划技术领域,本发明专利技术确定无人机和勤务车的状态和动作;采用MCMC方法确定无人机和勤务车的转移概率,并更新状态;确定奖励函数,确定任务完成度;进行动态规划,无人机的有效飞行距离最大化;进行迭代计算,获取最优策略,并根据最优策略更新无人机和勤务车导航路线。本发明专利技术的勤务车可以作为一个移动的起降平台,使无人机在需要的时候能够更快地到达指定地点,减少了无人机在飞行过程中的能量损失,从而提高了飞行效率。

【技术实现步骤摘要】

本专利技术涉及无人机和勤务车协同导航的动态规划,是一种无人机和勤务车协同导航的动态规划方法


技术介绍

1、无人机勤务车是为无人机提供支持服务的车辆,具备机舱、操控系统,提供换电、充电等保障服务。勤务车最大的优势是提高无人机的飞行效率,提高电池的利用率、有效航程,以及更好的管理、服务无人机的飞行任务。

2、首先,无人机配备勤务车的成本较高,需要投入大量的资金和资源进行研发和生产,而相应的管理模式和配套应用都几乎没有。其次,无人机和勤务车的配合使用需要一定的技术水平和操作经验,以目前的应用情况看,还没有成熟管理和操作模式,以及业务需求也在缓慢的几类之中。主要是这里面既需要专业的飞行操控技术人员,也需要应用到具体行业的领域专家配合。但可以预见在未来无人机+勤务车的应用模式必然会逐步而加速演进,并逐渐向各个行业领域渗透。

3、综上所述,勤务车在提高无人机飞行效率和电池利用率方面具有很大的优势,可以优化无人机的管理和服务,进一步扩大无人机的应用范围和效果。作为无人机的服务车辆,在无人机执行任务的时候,勤务车应该尽可能实时保持与无人机最近的直线距离,以便无人机最大限度执行任务,并在电源耗尽必须返航的时候飞行最短距离。也就是使得无人机的有效任务飞行距离占比最大。现实的问题是勤务车必须在有限的道路上行驶,不可能实时在无人机垂直下方,因此,无人机和勤务车的实时协同导航规划就需要算法来支撑。


技术实现思路

1、本专利技术采用一种动态规划方法,协同规划无人机和勤务车的行动路径和任务分配。基于此,本专利技术提出一种无人机和勤务车协同导航的动态规划方法。

2、需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

3、本专利技术提供了一种无人机和勤务车协同导航的动态规划方法,本专利技术提供了以下技术方案:

4、一种无人机和勤务车协同导航的动态规划方法,所述方法包括以下步骤:

5、步骤1:确定无人机和勤务车的状态和动作;

6、步骤2:采用mcmc方法确定无人机和勤务车的转移概率,并更新状态;

7、步骤3:确定奖励函数,确定任务完成度;

8、步骤4:进行动态规划,无人机的有效飞行距离最大化;

9、步骤5:进行迭代计算,获取最优策略,并根据最优策略更新无人机和勤务车导航路线。

10、优选地,所述步骤1具体为:

11、确定状态:

12、定义状态s_t表示在时间t时,无人机和勤务车的位置采用二维或三维坐标表示、无人机的速度、电量,以及勤务车的速度;

13、定义状态s_{t+1}是下一时刻的状态,依赖于当前状态和动作选择;

14、确定动作:

15、定义动作a_t是在时间t时,无人机和勤务车采取的行动,包括飞行方向、速度和地面车辆的行驶方向、速度。

16、优选地,所述步骤2具体为:

17、p(s_{t+1}|s_t,a_t)是从状态s_t转移到状态s_{t+1}的概率,取决于无人机和勤务车的动作选择;

18、根据无人机和勤务车的相对位置和无人机的飞行方向,使用马尔科夫链蒙特卡罗方法mcmc来计算转移概率,在每个时间步t,根据当前状态s_t和动作a_t来计算下一个状态s_{t+1}的概率分布,然后使用这个分布来更新状态s_t。

19、优选地,所述步骤3具体为:

20、定义r(s_t,a_t,s_{t+1})表示在状态s_t执行动作a_t并转移到状态s_{t+1}所获得的奖励,奖励函数r(s_t,a_t,s_{t+1})计算具体为:

21、确定有效飞行距离,当有效飞行距离较高,奖励函数表示为:r1=k1*(d_actual/d_required),其中,d_actual是实际飞行距离,d_required是任务要求距离,k1是一个常数,用于调整奖励的权重;

22、确定任务完成度,当任务完成度较高,奖励函数表示为:r2=k2*

23、(c_completed/c_total),其中c_completed是已完成的任务数量,c_total是总任务数量,k2是一个常数,用于调整奖励的权重;

24、添加一个加权平均公式来计算奖励函数:r=w1*r1+w2*r2,其中w1和w2是加权系数,用于调整两个因素的权重。

25、优选地,所述步骤4具体为:

26、采用贝尔曼方程,通过迭代优化找到最优策略π^*(s_t),使得无人机和勤务车能协同工作,使无人机的有效飞行距离最大化。

27、优选地,定义一个价值函数v_π(s),表示在状态s下按照策略π执行后的期望总回报,经过多次迭代,进行策略评估;

28、在这个阶段,用贝尔曼方程来更新本专利技术的价值函数估计,对于所有的状态s和动作a,有:

29、v_π(s)=e[r_{t+1}+γv_π(s_{t+1})|s_t=s,a_t=π(s)]

30、其中,v_π(s)是状态s下的价值函数,e[·]表示数学期望,r_{t+1}是在状态s_t执行动作a_t后立即获得的即时奖励,γ是一个介于0到1之间的折扣因子,用于平衡即时奖励和未来奖励的重要性,π(s)是策略π在状态s下的动作选择。

31、优选地,所述步骤5具体为:

32、根据更新的价值函数v_π(s)来调整策略π,对于所有状态s,有:π'(s)=argmax_aq_π(s,a)

33、其中,π'(s)是新策略在状态s下的动作选择,max_a指的是在给定状态下选择能够产生最大q值的动作,q_π(s,a)是状态s下采取动作a的价值函数,可以通过下式计算:

34、q_π(s,a)=r(s,a)+γe_s'[v_π(s')]

35、其中,e_s'表示在状态转移概率下对下一个状态的期望。

36、直到价值函数v_π(s)收敛。得到的策略π^*就是最优策略,使得无人机和勤务车能协同工作,并使无人机的有效飞行距离最大化。

37、一种无人机和勤务车协同导航的动态规划系统,所述系统包括:

38、状态和动作确定模块,所述状态和动作确定模块确定无人机和勤务车的状态和动作;

39、转移概率计算模块,所述转移概率计算模块采用mcmc方法确定无人机和勤务车的转移概率,并更新状态;

40、奖励函数模块,所述奖励函数模块确定奖励函数,确定任务完成度;

41、规划模块,所述规划模块进行动态规划,无人本文档来自技高网...

【技术保护点】

1.一种无人机和勤务车协同导航的动态规划方法,其特征是:所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:

3.根据权利要求2所述的方法,其特征是:所述步骤2具体为:

4.根据权利要求3所述的方法,其特征是:所述步骤3具体为:

5.根据权利要求4所述的方法,其特征是:所述步骤4具体为:

6.根据权利要求5所述的方法,其特征是:

7.根据权利要求4所述的方法,其特征是:所述步骤5具体为:

8.一种无人机和勤务车协同导航的动态规划系统,其特征是:所述系统包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任意一项所述的方法。

10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征是:所述处理器执行所述计算机程序时实现权利要求1-7任意一项所述的方法。

【技术特征摘要】

1.一种无人机和勤务车协同导航的动态规划方法,其特征是:所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征是:所述步骤1具体为:

3.根据权利要求2所述的方法,其特征是:所述步骤2具体为:

4.根据权利要求3所述的方法,其特征是:所述步骤3具体为:

5.根据权利要求4所述的方法,其特征是:所述步骤4具体为:

6.根据权利要求5所述的方法,其特征是:

7.根...

【专利技术属性】
技术研发人员:张军阙伟超崔日华姜永刚
申请(专利权)人:大庆安瑞达科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1