当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于LSTM网络的航空瞬变电磁数据反演方法技术

技术编号:30540805 阅读:48 留言:0更新日期:2021-10-30 13:17
本发明专利技术公开了一种基于LSTM网络的航空瞬变电磁反演方法,包括以下步骤:1)生成含航空瞬变电磁响应数据、收发装置高度和电阻率模型的合成数据集;2)根据合成数据维度建立LSTM网络,输入数据为航空瞬变电磁时域信号,传感器高度拼接至特征层中参与运算,输出数据为电阻率模型参数;3)根据误差下降曲线选取合适的训练集规模和训练周期,确保训练效果和训练效率,完成网络训练;4)根据网络反演结果及其正演响应的拟合情况判断网络的泛化能力;5)利用LSTM网络完成航空瞬变电磁数据反演,获得地下介质的电阻率分布结构。该反演方法稳定准确,计算速度快,能够提升航空瞬变电磁数据解释效率,进而为航空瞬变电磁数据实时成像提供技术支撑。支撑。支撑。

【技术实现步骤摘要】
一种基于LSTM网络的航空瞬变电磁数据反演方法


[0001]本专利技术提供一种地球电磁数据的快速反演方法,具体涉及一种基于LSTM网络的航空瞬变电磁数据反演方法。

技术介绍

[0002]航空瞬变电磁法是一种重要的浅地表勘探方法,其能够适应复杂地形,采集速度快,探测覆盖区域广,且对低阻异常体敏感度高,在矿产勘查、地下水监测以及油藏成像中得到了广泛应用。
[0003]航空瞬变电磁法采样效率高,观测数据量大,且其在飞行中不断发射电流激发二次场,具有多源性,在数据反演时需要针对每一个发射源进行响应拟合,为数据解释工作带来巨大的计算挑战。目前常用的航空瞬变电磁数据解释方法主要分为确定型反演和统计型反演。确定型反演假设存在全局最优解,通过设定目标函数,选取初始模型,迭代调整模型参数使得目标函数收敛至预先设定的范围,进而得到反演结果。目标函数中通常包括观测数据拟合误差和正则化项,其中,正则化项引入了参考模型和介质光滑度等先验信息。然而,由于反演问题固有的多解性,反演依赖初始模型,易陷入局部极小,且初始模型和正则化项的选取易受主观因素影响。此外,航空电磁观测系统信噪比较低,噪声种类复杂,会加剧解的非唯一性,使得反演难以收敛至真实电阻率模型。统计型反演属于全局优化算法,通过在模型空间中进行采样,记录满足收敛条件的模型样本,进而提供模型参数的统计分布特征。然而,由于模型空间大,采集数据量多,需要进行大量正演模拟,对计算资源需求很高,计算成本随着模型参数个数增加指数上升。因此,采用传统反演方法进行航空瞬变电磁数据解释仍受到多解性和计算成本的局限。
[0004]作为一种全局优化算法,深度学习方法能够挖掘数据之间的映射关系。Bai等(2020,(Quasi

)Real

time inversion of airborne time

domain electromagnetic data via artificial neural network.remote sensing.12(20),3440)和Feng等(2020,Resistivity

depth imaging with the airborne transient electromagnetic method based on an artificial neural network.Journal of Environmental and Engineering Geophysics,25(3),355

368)利用人工神经网络(Artificial Neural Network,ANN)进行航空瞬变电磁数据反演。Li等(2020,Fast imaging of time

domain airborne EM data using deep learning technology.Geophysics,85(5),E163

E170)将卷积神经网络(Convolutional Neural Networks,CNN)与长短时记忆模块(Long Short

Term Memory,LSTM)相连接,结合飞行高度,实现了航空瞬变电磁快速数据成像。航空瞬变电磁响应数据随时间呈指数衰减,属于典型的时间序列,上述神经网络结构难以充分提取时间序列特征;且其考虑的阶梯状电阻率模型对实际介质环境适用性较弱,难以灵活拟合电阻率异常体的边界。
[0005]综上所述,现有的航空瞬变电磁响应数据解释方法仍存在局限性,需要研究一种高效、准确的数据解释方法。

技术实现思路

[0006]为克服现有技术的不足,本专利技术提供了一种基于LSTM网络的航空瞬变电磁数据反演方法,其针对航空瞬变电磁响应数据建立适当的LSTM网络结构,结合飞行高度,解决大规模航空瞬变电磁响应数据反演问题。该反演方法稳定性好、计算效率高、结果准确,能够为航空瞬变电磁实时数据解释提供技术支撑。
[0007]本专利技术采用的技术方案是:
[0008]一种基于LSTM网络的航空瞬变电磁数据反演方法,其针对航空瞬变电磁响应数据建立恰当的LSTM模型;将飞行高度拼接至网络特征层中参与反演运算;采用合成数据训练网络,并选取适当的训练周期和样本规模;将新采集的航空瞬变电磁响应数据集输入至完成训练的LSTM网络中,实现快速反演;具体包括以下步骤:
[0009]A.生成合成数据集,包括:
[0010]A1.根据自然界电阻率范围和反演采用的深度网格生成层状电阻率模型;
[0011]A2.根据观测环境随机生成收发装置高度;
[0012]A3.按照航空瞬变电磁观测系统参数和采样模式进行层状电阻率模型的正演模拟,得到航空瞬变电磁响应数据;
[0013]合成数据集样本包含:含N
t
个采样点时刻的航空瞬变电磁响应数据d
L
,收发装置高度h和层状电阻率模型N
ρ
层介质对应的电阻率值m
L
;所生成的合成数据集可以分为训练集与测试集。
[0014]B.建立LSTM网络;
[0015]LSTM网络由解码器和编码器构成,层与层之间采用LSTM模块进行连接(信息传递)。输入数据为航空瞬变电磁响应数据,输出数据为网络的反演结果(电阻率值的对数值),输入层和输出层的维度分别根据时间采样点个数(N
t
)和模型参数个数(电阻率模型的介质层数N
ρ
)确定。将编码器编码得到的特征向量与收发装置高度进行拼接,输入至解码器中进行解码,最终输出预测的电阻率模型参数。
[0016]C.选取适当的训练集规模和训练周期,完成网络训练;
[0017]采用不同规模训练集进行网络训练:基于步骤A生成的不同规模的训练数据集,根据网络预测模型与真实电阻率模型之间的误差迭代调整LSTM网络中的参数,直至网络训练收敛,具体是:
[0018]将含N
t
个时间采样点的航空瞬变电磁响应数据输入至步骤B中建立的LSTM网络中,经输出层输出N
ρ
个向量v
O
,v
O
与层状电阻率模型的N
ρ
层电阻率值反演结果m
O
的关系为:v
O
=lg(m
O
)。迭代调整网络参数降低目标函数,使得v
O
接近lg(m
L
),进而完成训练。
[0019]根据不同规模训练集的反演误差随训练周期增长的下降趋势,选取训练集规模和训练周期,得到完成训练的LSTM网络,确保网络收敛效果和训练效率。
[0020]D.网络反演效果检验;
[0021]根据网络对测试集的反演结果与真实电阻率模型之间的误差以及其对应的航空瞬变电磁响应数据拟合误差,定量评估网络的反演效果,判断网络的泛化能力。
[0022]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LSTM网络的航空瞬变电磁数据反演方法,包括以下步骤:A.生成合成数据集,包括:A1.根据自然界电阻率范围和反演采用的深度网格生成层状电阻率模型;A2.根据观测环境随机生成收发装置高度;A3.按照航空瞬变电磁观测系统参数和采样模式进行层状电阻率模型的正演模拟,得到航空瞬变电磁响应数据;合成数据集样本包含:含N
t
个采样点时刻的航空瞬变电磁响应数据d
L
,收发装置高度h和层状电阻率模型N
ρ
层介质对应的电阻率值m
L
;生成的合成数据集分为训练集与测试集;B.建立LSTM网络:所述LSTM网络由编码器和解码器构成,层与层之间采用LSTM模块进行连接;输入数据为航空瞬变电磁响应数据,输出数据为网络反演得到的电阻率模型参数,输入层和输出层的维度分别根据时间采样点个数N
t
和介质层数N
ρ
确定;将编码器编码得到的特征向量与收发装置高度进行拼接,输入至解码器中进行解码,输出网络预测的电阻率模型参数;C.选取适当的训练集规模和训练周期,完成网络训练:采用步骤A生成的不同规模的训练集参与网络训练,根据不同规模训练集的反演误差随训练周期增长的下降情况,选择训练集规模和训练周期,保证网络收敛效果和训练效率;D.网络反演效果检验;计算网络对测试集的反演结果及其正演响应与真实值之间的误差,对网络反演准确度进行评估;E.电阻率模型反演:利用完成训练的LSTM网络实现新采集航空瞬变电磁响应数据的快速反演。2.如权利要求1所述的航空瞬变电磁数据反演方法,其特征在于,步骤A中,采用均匀网格对电阻率模型深度方向进行剖分,令电阻率随深度连续变化,电阻率分布于1

10000Ω
·
m之间,取其对数值作为网络输出的目标值;收发装置高度随机设定,取值范围为25

100m。3.如权利要求2所述的航空瞬变电磁数据反演方法,其特征在于,步骤A中通过插值的方法使得电阻率模型的电阻率随深度连续变化。4.如权利要求1所述的航空瞬变电磁数据反演方法,其特征在于,步骤B中所述LSTM网络由一个编码器和一个解码器构成;编码器包含4个LSTM层,且第一层采用双向LSTM连接;解码器包含4个LSTM层和1个全连接层。5.如权利要求1所述的航空瞬变电磁数据反演方法,其特征在于,步骤B中,采用注意力机制连接编码器和解码器,注意力机制通过求取后一隐藏层每一时刻的隐藏状态与前一隐藏层每一时刻的隐藏状态之间的相关性,将其归一化作为权重,对前一隐藏层隐藏状态进行加权求和输入至后一隐藏层不同时刻的LSTM模块中;权重a
p
(q)计算公式为:其中,代表编码器中最后一个隐藏层第q时刻LSTM模块状态,表示解码器中第一个隐藏层p时刻LSTM模块状态;Q表示编码器最后一层中总时刻数;score(
·
)表示计算相关性的函数;经过注意力机制运算后的特征向量v
...

【专利技术属性】
技术研发人员:吴思弘黄清华
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1