System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于CNN-LightGBM的地面瞬变电磁反演方法技术_技高网

一种基于CNN-LightGBM的地面瞬变电磁反演方法技术

技术编号:40202489 阅读:14 留言:0更新日期:2024-02-02 22:15
本发明专利技术涉及一种基于CNN‑LightGBM的地面瞬变电磁反演方法,包括步骤1:采用地面瞬变电磁正演程序生成样本数据集;步骤2:构建CNN‑LightGBM,并确定其最优参数;步骤3:使用最优参数训练CNN‑LightGBM;步骤4:使用测试集验证CNN‑LightGBM的反演效果;步骤5:使用训练好的CNN‑LightGBM反演实测地面瞬变电磁数据。本发明专利技术将地面瞬变电磁响应数据输入到CNN中以提取多尺度特征,然后将提取的多尺度特征使用LightGBM进行回归来提高反演的可靠性。克服了目前采用的涉及全连接的CNN架构容易受到训练速度较慢、泛化能力有限、容易出现过拟合问题的限制,加快了反演效率。

【技术实现步骤摘要】

本专利技术属于地球物理,具体涉及一种基于cnn-lightgbm的地面瞬变电磁反演方法。


技术介绍

1、地面瞬变电磁法是在地面进行的瞬变电磁法探测,是瞬变电磁法的一个分支。地面瞬变电磁法在矿产资源勘探、工程勘察、地下水资源调查和环境地质调查等领域有着广泛的应用。从地面瞬变电磁数据获得地下信息的关键是反演。

2、地面瞬变电磁反演是一个高度的非线性问题,专利技术人发现,目前的反演方法一般可以分为确定性和概率性两大类。确定性反演通过最小化目标函数(实测数据和正演数据之间的差异)来获得最优模型参数。这种方法需要较准确的地下结构先验信息,通常会遇到多个局部最小值的问题。而概率性反演将反问题转化为求解反演参数的概率分布。这种方法特别适用于高度非线性问题,然而,概率性方法计算非常耗时,并且随着模型参数数量的增加呈指数增长。面对大量的地面瞬变电磁数据反演可能需要几天时间,从而限制了了解地下结构的过程。机器学习作为一种全局搜索算法,为地面瞬变电磁反演提供了一种替代方案。卷积神经网络(cnn)是最常见的深度神经网络类型,也是近几十年来机器学习最强大的发展之一。尽管如此,目前采用的涉及全连接的cnn架构容易受到训练速度较慢、泛化能力有限、容易出现过拟合问题的限制。与神经网络不同,轻量级梯度提升机器学习(lightgbm)是一种集成学习算法,其将多个弱学习器集成为一个强学习器,以提高预测准确度。综上所述,迫切需要改进地面瞬变电磁反演方法以提高效率和可靠性。


技术实现思路

1、针对现有技术存在的不足,本专利技术的目的是提供一种基于cnn-lightgbm的地面瞬变电磁反演方法。本专利技术首先将地面瞬变电磁响应数据输入到cnn中以提取地面瞬变电磁响应的多尺度特征,然后将提取的地面瞬变电磁响应的多尺度特征使用lightgbm进行回归来提高反演的可靠性。

2、为了实现上述目的,本专利技术是通过如下的技术方案来实现:

3、一种基于cnn-lightgbm的地面瞬变电磁反演方法,该方法具体包括以下步骤:

4、步骤1:采用地面瞬变电磁正演程序生成样本数据集,包括:

5、根据地面瞬变电磁法探测的采集参数确定正演程序的参数;

6、在设定的电阻率范围内随机选择每层地下模型的电阻率;

7、按照确定的参数和每层地下模型的电阻率,使用正演程序生成地面瞬变电磁响应数据;

8、对地面瞬变电磁响应数据和每层地下模型的电阻率进行预处理;

9、预处理后的地面瞬变电磁响应数据作为cnn-lightgbm的输入,预处理后每层地下模型的电阻率作为cnn-lightgbm输入数据的标签;

10、将样本数据集划分为训练集、验证集和测试集;

11、步骤2:构建cnn-lightgbm,并确定其最优参数;

12、cnn提取的地面瞬变电磁响应的多尺度特征展平为一维向量,然后再输入到lightgbm中建立地面瞬变电磁响应数据和每层地下模型的电阻率的映射关系;cnn的待优化参数包括卷积层和全连接层的层数、卷积核的大小以及学习率,lightgbm的待优化参数包括决策树的深度、叶子的数量、学习率以及正则化参数;

13、步骤3:使用最优参数训练cnn-lightgbm;

14、采用步骤1的训练集和验证集训练cnn-lightgbm,训练过程中使用最优参数以获得最佳的反演性能,最后保存训练好的cnn-lightgbm;

15、步骤4:使用测试集验证cnn-lightgbm的反演效果;

16、测试集是cnn-lightgbm在训练过程中未使用的数据,用来评估cnn-lightgbm的泛化能力,根据cnn-lightgbm对测试集反演结果与标签的误差评估其反演结果;

17、步骤5:使用训练好的cnn-lightgbm反演实测地面瞬变电磁数据;

18、将实测地面瞬变电磁数据预处理后输入到训练好的cnn-lightgbm得到反演的每层地下模型的电阻率。

19、优选的,所述步骤1中设定的电阻率范围为0.1-15000ω·m,该范围包括自然界绝大部分物质的电阻率;对地面瞬变电磁响应数据和每层地下模型的电阻率的预处理方法为:瞬变电磁响应数据x减去均值μ除以标准差σ:标签为每层地下模型的电阻率ρ的对数转换值:训练集、验证集和测试集的数量分别为样本数据集的90%、5%和5%。

20、优选的,所述步骤2中使用随机搜索或贝叶斯优化确定cnn-lightgbm的最优参数;使用leaky relu作为cnn的激活函数;在cnn的全连接层之前进行丢弃操作,作用是随机地禁用一部分神经元,以防止过拟合,提高鲁棒性和泛化能力。

21、优选的,所述步骤3中采用早停策略并使用学习率衰减防止cnn-lightgbm过拟合,并减少其训练时间;所述步骤3中cnn-lightgbm的损失函数为:

22、

23、其中,n代表批量的大小,和y分别表示标签和反演获得的地下模型的电阻率,m为网络输出参数的数量,引入权重为λ的正则化项提升模型的泛化能力,表示cnn-lightgbm可训练权重w的平方和。

24、优选的,所述步骤4中使用均方根误差rmse验证cnn-lightgbm的反演效果,定义为:

25、本专利技术的有益效果是:

26、本专利技术将地面瞬变电磁响应数据输入到cnn中以提取地面瞬变电磁响应的多尺度特征,然后将提取的关键特征使用lightgbm进行回归来提高反演的可靠性。cnn能够学习到复杂的抽象特征,而lightgbm能够更好地捕捉数据之间的非线性关系和交互作用。结合两者可以提高模型的反演能力。克服了目前采用的涉及全连接的cnn架构容易受到训练速度较慢、泛化能力有限、容易出现过拟合问题的限制。与传统方法相比,反演不依赖与初始模型的选择,从而不会出现传统方法的局部极小问题。此外,大大加快了反演效率,本专利技术可以在1秒钟内反演10000个样本,反演效率是传统方法的几个数量级。

本文档来自技高网...

【技术保护点】

1.一种基于CNN-LightGBM的地面瞬变电磁反演方法,其特征在于,该方法具体包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,

4.根据权利要求1所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

【技术特征摘要】

1.一种基于cnn-lightgbm的地面瞬变电磁反演方法,其特征在于,该方法具体包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,

...

【专利技术属性】
技术研发人员:程凯杨晓冬吴小平夏彤
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1