基于多智能体强化学习的煤矿井下人员避灾路线规划方法技术

技术编号：37172199 阅读：17 留言：0更新日期：2023-04-20 22:42

本申请涉及一种多智能体强化学习的煤矿井下人员避灾路线规划方法，包括：获取多名井下人员的位置信息，将多名井下人员的位置信息输入到多智能体强化学习模型中，得到每名井下人员的避灾路线规划方案。本申请基于多智能体强化学习技术完成了煤矿井下人员避灾路线规划，通过考虑煤矿井下人员所处的局部信息和煤矿井下整体的全局信息，能够给出每位井下人员的精确合理避灾路径；与现有技术相比，能够在短时间内为井下人员提供动态精准的避灾指引，能显著提高井下人员避灾成功率。能显著提高井下人员避灾成功率。能显著提高井下人员避灾成功率。

全部详细技术资料下载

【技术实现步骤摘要】
基于多智能体强化学习的煤矿井下人员避灾路线规划方法

[0001]本申请涉及矿井安全
，具体地，涉及一种基于多智能体强化学习的煤矿井下人员避灾路线规划方法。

技术介绍

[0002][0003]现有的煤矿井下人员避灾路线规划方法大都基于传统的多目标优化算法，该类算法大都属于静态规划即：在事故发生前规定好在那些区域的人员当发生特定类型的事故时应采取特定的路线。这种方法没有考虑事故发生前井下人员位置分布等因素，因此这种避灾路径是对于井下工作人员而言参考价值很低。往往在煤矿井下事故初期波及范围及危害程度都较小，这时是消灭事故，减少损失的有利时机，但井下工作人员通常会因为避灾部分路段坍塌或避灾路径拥堵消耗掉最佳的逃生时机，造成过大量人员伤亡。

技术实现思路

[0004]为了克服现有技术中的至少一个不足，本申请实施例提供一种基于多智能体强化学习的煤矿井下人员避灾路线规划方法。
[0005]第一方面，提供一种多智能体强化学习的煤矿井下人员避灾路线规划方法，包括：
[0006]获取多名井下人员的位置信息；
[0007]将多名井下人员的位置信息输入到多智能体强化学习模型中，得到每名井下人员的避灾路线规划方案；
[0008]多智能体强化学习模型包括多个智能体和环境，每个智能体的输入是一名井下人员的位置信息，智能体的输出是动作，动作为井下人员逃离矿井前每一步采取的动作，每个智能体输出的动作形成联合动作输入到环境中，环境针对每个智能体输出状态和奖励，并反馈给对应的智能体。
[000...

【技术保护点】

【技术特征摘要】
1.一种多智能体强化学习的煤矿井下人员避灾路线规划方法，其特征在于，包括：获取多名井下人员的位置信息；将所述多名井下人员的位置信息输入到多智能体强化学习模型中，得到每名所述井下人员的避灾路线规划方案；所述多智能体强化学习模型包括多个智能体和环境，每个所述智能体的输入是一名井下人员的位置信息，智能体的输出是动作，所述动作为井下人员逃离矿井前每一步采取的动作，每个智能体输出的动作形成联合动作输入到所述环境中，所述环境针对每个所述智能体输出状态和奖励，并反馈给对应的智能体。2.如权利要求1所述的方法，其特征在于，所述多智能体强化学习模型为经过训练得到的模型。3.如权利要求2所述的方法，其特征在于，对多智能体强化学习模型进行训练，包括：针对每个智能体，采用DQN强化学习模型对全局信息进行学习，并通过仿真训练优化DQN强化学习模型的参数，直到模型收敛，得到训练后的多智能体强化学习模型；获取防灾演习过程中井下人员的位置信息，输入到所述训练后的多智能体强化学习模型中，获取真实的井下人员避灾路线规划方案；利用获取的真实的井下人员避灾路线规划方案，对训练后的多智能体强化学习模型进行修正。4.一种多智能体强化学习的煤矿...

【专利技术属性】
技术研发人员：刘再斌，范涛，马良，韩保山，李贵红，李鹏，巨朝晖，雷晓荣，
申请(专利权)人：中煤科工西安研究院集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人