一种基于深度强化学习的地下浅层目标快速定位方法技术

技术编号：37132125 阅读：18 留言：0更新日期：2023-04-06 21:30

本发明专利技术涉及一种基于深度强化学习的地下浅层目标快速定位方法，属于地下浅层震源定位技术领域。本发明专利技术结合了深度神经网络算法和强化学习算法，通过对地声传感器采集到的一维信号进行跨域升维，以多谱三维能量场作为深度强化学习的状态空间，利用马尔科夫决策过程进行问题建模，并采用C

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的地下浅层目标快速定位方法

[0001]本专利技术属于地下浅层震源定位
，具体涉及一种基于深度强化学习的地下浅层目标快速定位方法。

技术介绍

[0002]地下浅层目标定位主要是通过布设在地表或地下浅层空间内的传感器阵列收集有效信号(包括空声信号、震动信号和地声信号)，利用有源或无源定位方法，实现对震源目标的定位。地下浅层目标定位属于地震深层定位的特殊应用场景，快速准确获取地下目标的爆炸位置信息，对于快速评估井下事故危险程度、深侵彻武器制导精确度以及核爆监测等多方面具有非常重要的意义。
[0003]近年来，随着大数据、人工智能技术和计算机硬件的高速发展，深度学习和强化学习成为地下浅层目标定位领域的研究热点。
[0004]基于深度学习的定位方法：主要是利用深度学习消除信号噪声、检测地震波形、拾取震相特征(包括信号检测、到时估计和震相识别等部分)，利用基于到时和波形信息的方法完成对震源的定位。但缺点是需要依赖于大量、高质量的震源数据，消耗长久的时间学习建模，实际工况下，低信噪比震源数据和高复杂度介质环境导致模型学习效率低，且存在收敛速度慢、鲁棒性差、泛化性差等问题。
[0005]基于强化学习的定位方法：较为常用的主要是基于DQN(Deep Q
‑
learning Network)学习框架，利用其结构中的深度神经网络和经验重放技术来映射高维度的状态和动作，并将学习经验存储在重放缓存区中以打乱样本的时间差分相关性，提高学习效率。但缺点是学习速度较慢，且无法对整...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的地下浅层目标快速定位方法，其特征在于，该方法包括如下步骤：S1、多谱三维能量场逆时重建：将地声传感器阵列采集到的一维地声信号，通过信号互相关处理映射生成包含震源信息的多谱三维能量场；S2、马尔科夫决策过程模型搭建：将震源定位问题建模为马尔科夫决策过程；S3、好奇心驱动深度强化学习模型搭建：采用好奇心驱动DQN(C
‑
DQN)算法解决马尔科夫决策过程，构造地下浅层目标的深度强化学习快速定位模型；S4、完成目标定位。2.如权利要求1所述的基于深度强化学习的地下浅层目标快速定位方法，其特征在于，所述步骤S1具体包括如下步骤：S1.1布设分布式地声传感器阵列：选取监测区域中心位置设为坐标原点O，将地声传感器以方形等间距布设方式布设于地表，并获取各地声传感器坐标信息(x
i
,y
i
,z
i
)，i＝1,2,3,
…
,N，其中N为传感器布设数量；S1.2网格离散化：将长宽高分别为l、w、h的监测区域离散化处理，根据定位精度和计算规模要求采用几何尺寸相同的长方体(Δx,Δy,Δz)划分网格，其中，Δx、Δy、Δz分别代表每个网格单元的长宽高；S1.3数据预处理：对地声传感器采集到的一维信号进行预处理；S1.4走时偏移处理：通过距离与地声传播速度计算得到每个网格点到各个传感器的走时信息，再根据波形互易性原理，将每个传感器获取的一维信号按照对应网格点的走时信息进行反向偏移；S1.5信号互相关处理：依据时间一致性成像原理，将针对某一网格点偏移得到的传感器波形两两之间进行互相关处理，并将所有的互相关波形进行振幅叠加，以此作为该网络点的能量值；即其中X代表监测区域内的某一网格点，C(R
i
(X),R
j
(X))表示第i个传感器和第j个传感器在该网格点处得到的互相关波形；对于目标监测区域中的某个网格点，共有组互相关叠加结果；S1.6生成多谱三维能量场：依次遍历监测区域内的所有网格点，直至得到所有网格点对应的能量，即可得到多谱三维逆时聚焦图像。3.如权利要求2所述的基于深度强化学习的地下浅层目标快速定位方法，其特征在于，所述步骤S1.3的预处理包括：去除线性趋势、5～70Hz带通滤波和归一化处理操作。4.如权利要求2所述的基于深度强化学习的地下浅层目标快速定位方法，其特征在于，所述步骤S2具体包括如下步骤：S2.1、设计状态空间S：状态空间为S1.6生成的多谱三维能量场中每个网格的能量值；S2.2、设计动作空间A：为模拟震源agent的移动方向，也就是对真实震源的搜索方向；S2.3、设计奖励函数R；S2.4、设计状态转移概率P。5.如权利要求4所述的基于深度强化学习的地下浅层目标快速定位方法，其特征在于，
所述步骤S2.2中，移动方向包括以下动作内容：向上移动+Z方向、向下移动
‑
Z方向、向右移动+X方向、向左移动
‑
X方向、向前移动+Y方向以及向后移动
‑
Y方向。6.如权利要求4所述的基于深度强化学习的地下浅层目标快速定位方法，其特征在于，所述步骤S2.3具体包括：S2.3.1、震源位置S(X
s
,Y
s
,Z
s
)已知，设模拟震源agent在t时刻的坐标位置为S'(X
s'
,Y
s'
,Z
s'
)，其与真实震源的距离设为D(t)，即有：S2.3.2、设置监测区域三维空间O
‑
xyz的边界约束条件：X
min
≤X
S'
≤X
max
，Y
min
≤Y
S'
≤Y
max
，Z
min
≤Z
S'
≤0；S2.3.3、计算t时刻执行当前动作...

【专利技术属性】
技术研发人员：王黎明，武丹，
申请(专利权)人：中北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人