城市环境中车载无人机群体感知方法技术

技术编号:37064401 阅读:11 留言:0更新日期:2023-03-29 19:42
本发明专利技术提出一种城市环境中车载无人机群体感知方法,基于多中心图卷积算法的无人车停靠站网络空间建模机制机制利用图结构来描述无人车停靠站与连接站点的道路,可以准确建模具有图结构的环境场景,增强全局环境感知的能力;利用自身的环境观测以及图网络的结构特性,推测其他无人车的关注点或行为意图并加以辨别,提高协同探索任务的工作效率;建立了以无人车为节点的通信图网络,引入与地理环境相关的位置与距离特征,用于感知无人车群在环境中实时位置以及相对位置的变换,解决了图结构在二维地理空间中对于几何形状旋转与平移变换不敏感的问题,增强协同探索环境下,智能体之间通信的效率与精度,保证智能体全面而准确地提取环境特征。地提取环境特征。地提取环境特征。

【技术实现步骤摘要】
城市环境中车载无人机群体感知方法


[0001]本专利技术属于物联网
,具体涉及一种城市环境中车载无人机群体感知方法。

技术介绍

[0002]群体感知是物联网和人工智能相结合的前沿研究方向,为智慧城市领域中的大数据应用场景提供了高效计算模式,它利用城市中普通用户使用的移动设备作为基本感知单元,通过物联网和移动互联网进行协作,实现感知任务分发和感知数据收集利用,最终完成大规模、复杂的城市和社会感知任务,在这类群体感知任务中,人们在特定空间内收集,分析和传播地理和社会信息,群体感知相关技术近年来催生了许多成功的商业案例,如滴滴打车和美团外卖,得益于移动网络以及无人设备的飞速发展,使用搭载高速网络传感器的移动无人设备在城市环境中采集并传播感知数据正在成为现实,相比于人类参与者,以无人车与无人机为代表的移动无人设备具有更高的灵活性以及更低的信息传输延迟,能够更好应对复杂城市环境下的群体感知任务。
[0003]在现有的应用中,无人车具有大装载容量以及长距离运输能力,但是只能在特定道路上进行移动,无人机具有在环境中灵活移动的能力,但是受电池容量的影响,移动范围受限。如果将二者结合构建车载无人机群,利用无人车的装载运输能力,由无人车将无人机运送到适合采集数据的区域,然后在无人车停靠站释放无人机来完成局部环境的数据采集任务,这样二者的优势都得到了充分发挥,有效提升了数据采集效率。
[0004]但是,在实际的应用过程中,城市环境车载无人机群体感知存在着两大挑战:
[0005]挑战一:环境空间广阔,空间状态变化快且难以预测,单一无人车无法实时得知全局节点信息,大部分节点信息未知,使得无人车很难准确且实时提取空间状态,现有方法中,图神经网络(GNN)可用于路网环境建模,在城市场景中,每个无人车停靠站可以视作一个图节点,并保存一定的特征,而连接两个站点的道路可以视作图上的边,节点间的信息通过边交换,图卷积网络(GCN)通过聚合一阶邻居的信息来更新节点信息,由于大多数节点由默认值表示,导致更新结果中大多数节点特征类似,难以用于决策,而图注意力网络(GAT)仅考虑在邻居节点的局部范围内做注意力机制计算,同样会导致大多数节点特征类似。
[0006]挑战二:由于各个无人车只能掌握环境局部信息,所以需要设计一个有效的通信机制,通过无人车之间的消息交换来实现合作,而现有的通信机制无法感知无人车群在数据分布不均的空间中的几何变化(如平移、旋转等),没有根据通信所在空间特征做出相应调整。
[0007]若将此群体感知任务考虑为时隙系统,并且在多个智能体合作探索的框架下,该系统能够被视为一个去中心化且部分可观测的马尔科夫决策过程(Dec

POMDP),在此基础之上,现有研究提出了一系列多智能体深度强化学习方法(MADRL)以解决智能体之间的协作问题,其中的代表方法MAPPO与IPPO都通过行为策略参数共享的方式实现多智能体之间的合作,为了在消息层面上实现多智能体的通信,一些方法在多智能体强化学习的框架中
加入额外的通信模块,I3CNet算法可以确定合适的时机与特定的智能体发生信息交换,而在ToM2C算法中,每个智能体能够根据自身对环境的观察,预测其他智能体的动作与意图,进而选择通信目标。
[0008]基于现有技术存在如上述技术问题,本专利技术提供一种城市环境中车载无人机群体感知方法。

技术实现思路

[0009]本专利技术提出一种城市环境中车载无人机群体感知方法。
[0010]本专利技术采用以下技术方案:
[0011]本专利技术提供一种城市环境中车载无人机群体感知方法,包括:
[0012]步骤1,车机协同仿真平台设立无人车与无人机的轨迹共享缓存,初始化无人车与无人机的基准探索策略;
[0013]步骤2,车机协同仿真平台创建模拟环境子进程,开始车载无人机群协同感知交互过程,环境子进程创建一个新的交互回合,清空轨迹共享缓存,并且设置时间步t=0;
[0014]步骤3,环境中的各个无人车基于无人车停靠站网络图建模机制,提取无人车对于全部停靠站的整体感知信息;
[0015]步骤4,各无人车利用自身的感知信息,基于多智能体通信机制在无人车通信图上与其他无人车进行信息交换与整合,获取环境全局感知信息;
[0016]步骤5,各无人车利用环境感知信息,决策是否要释放无人机,如释放,转入步骤6;如不释放,转入步骤7;
[0017]步骤6,无人车在当前停靠站等待无人机返回,各无人机在环境中飞行,采集传感器数据以及途经的无人车停靠站数据,采集完毕后返回无人车,此时无人车使用无人机获取的停靠站信息更新自身感知,转入步骤8;
[0018]步骤7,无人车行驶到下一目标停靠站点;
[0019]步骤8,判断交互回合是否达到预定的时间步T,如达到则回合结束,转入步骤9;否则进入到下一个模拟时间步,转入步骤3;
[0020]步骤9,无人车将行驶轨迹存入无人车轨迹共享缓存,无人机将飞行轨迹存入无人机轨迹共享缓存;
[0021]步骤10,车机协同仿真平台根据无人车与无人机轨迹共享缓存,利用近端策略算法优化无人车与无人机的探索策略;
[0022]步骤11,重复步骤2

10,直到预定的策略优化轮次M;
[0023]步骤12,车机协同仿真平台向无人车群发送无人车优化探索策略,向无人机群发送无人机优化探索策略,车载无人机群利用相应的探索策略在环境中运动,协同采集传感器数据。
[0024]进一步地,步骤2中,无人车与无人机共同在环境中采集传感器数据与移动轨迹数据,其中:
[0025]传感器p的初始数据量与t时刻的剩余数据量无人车停靠站b于t时刻具有的特征向量(x
b
,y
b
)代表站点的空间坐标,代表t时刻,无人车于停靠站b释
放无人机收集到的传感器数据量;无人车u于t时刻,对环境中所有无人车停靠站b构成的集合的观察向量其中其中观察向量为无人车的局部观察代表无人车u的某一个无人机最近一次到达该站点时所感知到的可收集数据量如尚未有无人机到达过该站点,则设置为一常数值;
[0026]无人机v的局部观察是一张以为中心,2l为边长的正方形图像,其中,表示无人机v在t时刻的位置坐标,l为无人机的感知距离,s
t
表示整个车机协同仿真平台当前的状态。
[0027]进一步地,步骤3包括:
[0028]步骤31、计算无人车所在停靠站到其他各个停靠站b的q

阈值最短路径距离:
[0029][0030]对路径距离大于q的两个停靠站,则认为两站不可通达,距离记为无穷大;
[0031]步骤32、利用距离计算无人车u所感知的全局结构相关性度量
[0032][0033][0034][0035]其中:代表除去无人车u之外的所有无人车构成的集合,U是所有无人车的总数,停靠站间的结构相关性度量与距离成反比;
[0036]步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种城市环境中车载无人机群体感知方法,其特征在于,包括:步骤1,车机协同仿真平台设立无人车与无人机的轨迹共享缓存,初始化无人车与无人机的基准探索策略;步骤2,车机协同仿真平台创建模拟环境子进程,开始车载无人机群协同感知交互过程,环境子进程创建一个新的交互回合,清空轨迹共享缓存,并且设置时间步t=0;步骤3,环境中的各个无人车基于无人车停靠站网络图建模机制,提取无人车对于全部停靠站的整体感知信息;步骤4,各无人车利用自身的感知信息,基于多智能体通信机制在无人车通信图上与其他无人车进行信息交换与整合,获取环境全局感知信息;步骤5,各无人车利用环境感知信息,决策是否要释放无人机,如释放,转入步骤6;如不释放,转入步骤7;步骤6,无人车在当前停靠站等待无人机返回,各无人机在环境中飞行,采集传感器数据以及途经的无人车停靠站数据,采集完毕后返回无人车,此时无人车使用无人机获取的停靠站信息更新自身感知,转入步骤8;步骤7,无人车行驶到下一目标停靠站点;步骤8,判断交互回合是否达到预定的时间步T,如达到则回合结束,转入步骤9;否则进入到下一个模拟时间步,转入步骤3;步骤9,无人车将行驶轨迹存入无人车轨迹共享缓存,无人机将飞行轨迹存入无人机轨迹共享缓存;步骤10,车机协同仿真平台根据无人车与无人机轨迹共享缓存,利用近端策略算法优化无人车与无人机的探索策略;步骤11,重复步骤2

10,直到预定的策略优化轮次M;步骤12,车机协同仿真平台向无人车群发送无人车优化探索策略,向无人机群发送无人机优化探索策略,车载无人机群利用相应的探索策略在环境中运动,协同采集传感器数据。2.根据权利要求1所述的城市环境中车载无人机群体感知方法,其特征在于,步骤2中,无人车与无人机共同在环境中采集传感器数据与移动轨迹数据,其中:传感器p的初始数据量与t时刻的剩余数据量无人车停靠站b于t时刻具有的特征向量(x
b
,y
b
)代表站点的空间坐标,代表t时刻,无人车于站点b释放无人机可收集到的传感器数据量;无人车u于t时刻,对环境中所有无人车停靠站b构成的集合的观察向量其中观察向量为无人车的局部观察观察代表无人车u的某一个无人机最近一次到达该站点时所感知到的可收集数据量如尚未有无人机到达过该站点,则设置为一常数值;无人机v的局部观察是一张以为中心,2t为边长的正方形图像,其中,表示无人机v在t时刻的位置坐标,t为无人机的感知距离,s
t
表示整个车机协同仿真平台当前的状态。
3.根据权利要求1所述的城市环境中车载无人机群体感知方法,其特征在于,步骤3包括:步骤31、计算无人车所在停靠站到其他各个停靠站b的q

阈值最短路径距离:对路径距离大于q的两个停靠站,则认为两站不可通达,距离记为无穷大;步骤32、利用距离计算无人车u所感知的全局结构相关性度量计算无人车u所感知的全局结构相关性度量计算无人车u所感知的全局结构相关性度量计算无人车u所感知的全局结构相关性度量其中:代表除去无人车u之外的所有无人车构成的集合,U是所有无人车的总数,停靠站间的结构相关性度量与距离成反比;步骤33、使用全局结构相关性度量,结合注意力机制计算无人车对每个停靠点的关注程度,反映为注意力权重C,在图卷积算法中引入注意力权重,逐层更新特征矩阵在图卷积的第0层,在图卷积的第l层,计算注意力权重过程如下,其中W代表参数矩阵:在图卷积的第l层,计算注意力权重过程如下,其中W代表参数矩阵:在图卷积的第l层,计算注意力权重过程如下,其中W代表参数矩阵:在图卷积的第l层,计算注意力权重过程如下,其中W代表参数矩阵:为注意力输出,综合全局结构相关性度量与停靠站点注意力度量共同计算第l层的注意力权重并引入图卷积计算过程,获取下一层的感知信息:其中σ是Sigmoid激活函数,L是图卷积操作中的拉普拉斯邻接矩...

【专利技术属性】
技术研发人员:王宇吴竞飞李国政刘驰
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1