System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法技术_技高网

一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法技术

技术编号:40708275 阅读:5 留言:0更新日期:2024-03-22 11:08
本发明专利技术提供一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,涉及领域为无人机群智能碰撞避免技术领域,该方法通过借鉴神经系统的学习和决策过程,实现了智能化的无人机群体协同避障,首先,通过利用神经网络架构构建无人机间的信息传递网络,实现对群体的集体智能管理和调度;其次,引入脑启发决策规则,使无人机能够进行实时感知、判断和决策;最后,根据脑启发模式形成学习机制,使无人机能够从局部观测中学习,并根据学习到的知识做出协调的避障决策,本发明专利技术提供的基于奖励调制尖峰神经网络的无人机群智能碰撞避免方法及系统,实现了无人机群体的安全协同飞行,具有广阔的应用前景和市场价值。

【技术实现步骤摘要】

无人机群智能控制领域


技术介绍

0、技术背景

1、无人机群在执行任务时,易受外部环境影响和编队结构影响而产生碰撞,因此需要设计碰撞避免方案来保护无人机编队的安全。碰撞避免方案可以确保在多无人机群系统中避免无人机之间的碰撞,以确保安全的运动和导航。碰撞避免一般包括静态障碍物避免、动态障碍物避免和群体保持三个方面,通常可以通过自主学习和优化等方法来实现。

2、目前存在的碰撞避免技术主要基于深度神经网络的避障方法、运动进化算法和群数学优化方法。其中,基于深度神经网络的避障方法可以通过离线训练和大量数据来预测无人机之间的交互力,用于碰撞避免。运动进化算法和群数学优化则试图通过优化无人机的移动向量或行为参数,以避免碰撞。然而,这些现有技术还存在一些不足之处,包括:1.参数化复杂性:一些方法需要对大量参数进行离线训练和优化,限制了它们在真实环境中灵活应用的能力;2.缺乏自适应性:一些方法仅依赖于离线训练的数据,对于实时决策和适应复杂和动态的环境还不够灵活;3.中央控制限制:一些方法需要集中控制或全局信息,使得系统对中央节点的依赖性增加,限制了系统的鲁棒性和自适应性。

3、因此,为了克服这些限制,本领域正在寻找从生物界获取灵感的方法,利用分散的、自组织的和局部交互的策略来实现自组织的碰撞避免技术,以提高多无人机系统的性能和适应性。


技术实现思路

1、该专利技术介绍了一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避模型。该模型利用局部交互和神经网络学习来实现无人机群体的避撞行为。该专利技术还提出了一种基于奖励调制峰值神经网络的自我有组织的避碰撞模型,该模型考虑了生物启发的局部交互和奖励调制的神经网络。该研究为无人机群体在有界空间内进行稳定而安全的飞行提供了一种有效的解决方案。

2、该模型通过局部交互和学习实现无人机群体的避碰行为。每个无人机个体都具有奖励调制峰值神经网络,并且通过与邻居和环境的局部交互来获取信息。个体根据局部观测学习并做出决策,选择新的飞行方向来避免碰撞。这种局部交互和学习能力使得无人机群体能够在有界空间内实现稳定且安全的飞行行为。

3、该模型在多无人机群体的避碍问题上具有优越性和稳定性。与基于人工神经网络的在线学习方法相比,该模型展现出更高的性能和稳定性。该模型使用奖励调制尖峰神经网络作为决策系统,能够有效地实现反应扩散图灵模式,并且该模型通过基于局部交互学习实现群体智能行为。而且,该模型的决策过程利用了一个轻量级的奖励调制峰值神经网络来独立学习,具有更高的效率。

4、本专利技术采用如下技术方案,包括:一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,包括如下步骤:

5、步骤1、结合尖峰神经网络和奖励调节的尖峰时间依赖可塑条件,建立自组织碰撞避免决策模型,构建无人机间的信息交互网络,实现对群体的集体智能管理和调度

6、步骤2、建立脑启发强化学习模型,构建大脑启发自主学习机制,并在各无人机中设计奖励调节峰值神经网络,利用自主学习模式完成无人机群分散和自组织决策

7、步骤3、基于无人机群自主分散和自组织决策,利用奖励调节学习规则设计无人机机间避碰条件,在有界空间内得到多无人机群稳定、安全的飞行区间

8、具体的,步骤1中,建立自组织碰撞避免决策模型,包括:

9、基于多架自主无人机在有障碍物和其他机体的有限空间中自由飞行背景,各无人机在上下左右前后等方向运动,并随机以随机飞行方向在现场随机分散;

10、每架无人机都由一个独立的决策中心组成,可以根据邻居的局部观察与设计的决策算法,自主地学习安全飞行策略;

11、各机体决策中心根据飞行方向和构成潜在威胁的其他智能体的相对位置进行学习,当无人机靠近其他机体或障碍物时,当前无人机将执行决策中心的控制指令来优化飞行策略;

12、具体的,步骤1中,建立信息交互网络,包括:

13、构建个体大脑启发强化学习算法每个个体都根据自己的局部观察独立学习安全飞行策略;

14、无人机提能够在特定的局部范围内感知他们的邻居,并进行信息交互,当无人机从周围的邻居检测到靠近物时,无人机体会根据邻居的速度方向和相对位置更新其速度方向;

15、无人机的局部范围信息交互机制设置为,信息交互只发生在可见的、接近的智能体之间,定义了vij为无人机i与无人机j之间的可见度,如下式所示:

16、

17、其中,αj是智能体i和智能体j的速度方向之间的夹角。

18、同时定义无人机的机间碰撞危险度dij。设置可见度阈值tvis和碰撞阈值tcol;根据t时刻下的无人机体i与j之间的欧氏距离dij(t)和无人机体i与j之间的可见度vij计算碰撞系数cij,并在最大tvis=tcol和最小0处引入两个截止点。碰撞系数cij的具体算法如下:

19、

20、

21、其中,t为当前时刻。如果dij<tvis且vij=1,则判断智能体j对智能体i是可见的;如果dij<tcol则表示智能体i与智能体j会发生碰撞:

22、根据碰撞系数cij,碰撞危险度dij可以通过后续两个时间步计算得到,如下式所示:

23、dij=cij×(dij(t)-dij(t-1))          (15)

24、对于每个无人机i,将dij<0的邻居视为潜在危险,然后无人机i根据邻居的速度方向和相对位置独立更新策略。

25、具体的,步骤2中,脑启发的奖励调节峰值神经网络机制包括:

26、每个无人机都保持随机飞行,并同时监控本地环境,每个个体的自主学习组件受大脑决策机制的启发,集体智能行为由个体产生中,不受任何中央控制或全局信息的自发学习影响;

27、在决策中心设置基于脑启发的奖励调节峰值神经网络,当存在潜在的危险时(dij<0),处于危险中的无人机体将根据其决策中心选择一个新的方向并优化其行动策略。

28、脑启发的奖励调节峰值神经网络的定义为:

29、无人机个体的决策能力受到其他潜在威胁个体的速度方向和相对位置的影响,将前、后、左、右、左前、右前、左后、右后共8个方向定义动作空间:;输出层由8簇神经元组成,每簇神经元使用50个神经元来表示一个速度方向;对于输出层的尖峰神经元,第一组有超过一半的神经元放电将被标记为选择行为;输入层中的神经元数量为16个,其中速度方向数为8个,相对位置包含左右方向;

30、对于每个无人机体i,选择dij<0作为输入的无人机体的速度方向和相对位置;决策中心的输入强度iij与无人机间欧式距离dij呈线性负相关,设计为dij=-iij,表示当欧式距离越小时,其决策中心的输入强度越大,便于决策的判定;

31、脑启发的奖励调节峰值神经网络的奖励机制设计为由两个相邻时刻的价值函数的差值组成的;对于dij<0的智能体,以影响强度iij加权本文档来自技高网...

【技术保护点】

1.一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,建立自组织碰撞避免决策模型,包括:

3.根据权利要求1所述的基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,建立信息交互网络,包括:

4.根据权利要求1所述的方法,其特征在于,所述利用脑启发的奖励调节峰值神经网络机制,包括:

5.根据权利要求4所述的方法,其特征在于,

6.根据权利要求5所述的方法,其特征在于,所述利用突触可塑性,包括:

7.根据权利要求6所述的方法,其特征在于,

【技术特征摘要】

1.一种基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在于,建立自组织碰撞避免决策模型,包括:

3.根据权利要求1所述的基于奖励调制尖峰神经网络的无人机群自组织碰撞回避方法,其特征在...

【专利技术属性】
技术研发人员:熊师洵吴伟潘亚刚谭琪
申请(专利权)人:苏州移物智通科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1