当前位置: 首页 > 专利查询>吉林大学专利>正文

一种地震背景噪声频散曲线自动筛选方法技术

技术编号:37603204 阅读:11 留言:0更新日期:2023-05-18 11:54
本发明专利技术为一种地震背景噪声频散曲线自动筛选方法,包括:收集从频散能量图中人工拾取能量最大点获得的频散曲线以及理论生成的频散曲线;利用改进的自适应DBSCAN算法消除频散曲线中的离散点进行去噪;对去噪后的频散曲线进行特征参数的提取;将训练集中提取特征参数作为频散曲线数据集的输入特征,依照人工对比理论频散曲线对训练集中的频散曲线进行好、中、差的质量等级划分,并将质量等级作为频散曲线数据集的输出标签,进行改进后的KNN算法的训练;输入测试集中的频散曲线进行筛选,根据筛选情况对算法进行调整,并增加训练集频散曲线的多样性,可解决针对提取的频散曲线进行质量筛选的问题,保证进行反演过程中利用的频散曲线质量的可靠性。散曲线质量的可靠性。散曲线质量的可靠性。

【技术实现步骤摘要】
一种地震背景噪声频散曲线自动筛选方法


[0001]本专利技术涉及地球物理学
,尤其涉及的是一种地震背景噪声频散曲线自动筛选方法。

技术介绍

[0002]背景地震噪声成像技术近年来在地震学领域被广泛应用,该技术的关键步骤之一就是提取面波频散曲线,而频散曲线的质量很大程度影响背景噪声成像结果的准确性,所以对于获取的基阶频散曲线,必须进行筛选以保证其质量。传统手动的筛选的方法就是依靠人为经验选择质量好的频散能量谱图,再人为的去拾取频散能量点绘制成频散曲线,但这种方法耗时长、效率低。由于背景噪声成像产生的频散曲线是成千上万条的,利用传统手动筛选方法进行大量筛选。
[0003]现有技术中为了获得可靠的频散曲线,通常需要人工在C

T图中选择控制点,帮助程序追踪正确的频散曲线,而为了获得更加精细的地下结构,一个研究区需要布置的密集地震台站数量迅速增加,由于这种方法提取的是任意两个台站间的频散数据,这使得需要人工提取的频散曲线数量极大的增加,需要耗费大量的人力资源。

技术实现思路

[0004]本专利技术所要解决的技术问题在于提供一种地震背景噪声频散曲线自动筛选方法,解决目前大多利用频散能量谱进行频散曲线的自动提取方法,未有直接针对频散曲线直接进行筛选的问题,本专利技术可以解决针对提取的频散曲线进行质量筛选的问题,保证进行反演过程中利用的频散曲线质量的可靠性。
[0005]本专利技术是这样实现的,
[0006]一种地震背景噪声频散曲线自动筛选方法,该方法包括:
[0007]步骤1、收集从频散能量图中人工拾取能量最大点获得的频散曲线以及理论生成的频散曲线,分为训练集和测试集;
[0008]步骤2、利用改进后的自适应DBSCAN算法消除频散曲线中的离散点进行去噪;
[0009]步骤3、对去噪后的频散曲线进行特征参数的提取,特征参数包括:幅度范围、频率范围、趋势、连贯性和轮廓系数;其中,通过调整DBSCAN算法关键参数:扫描半径Eps和最小包含点数MinPts,在DBSCAN算法中加入MK(Mann

Kendall)趋势检验法,提取出频散曲线的特征参数;
[0010]步骤4、将训练集中提取特征参数作为频散曲线数据集的输入特征,依照人工对比理论频散曲线对训练集中的频散曲线进行好、中、差的质量等级划分,并将质量等级作为频散曲线数据集的输出标签,进行改进后的KNN算法的训练;
[0011]步骤5、输入测试集中的频散曲线进行筛选,根据筛选情况对算法进行调整,并增加训练集频散曲线的多样性。
[0012]进一步地,所述步骤2中利用改进后的自适应DBSCAN算法消除频散曲线中的离散
点包括:先将频散数据归一化,最小包含点数MinPts设定值在[2,10]的区间范围,扫描半径Eps设定在[0.01

0.2]之间,不断调参,直到将频散数据都归为一类,标签为0,而离散点标签为

1,消除标签为

1的离散点。之后利用K

distance图选择合适的MinPts、Eps再次调整,确保连贯性和轮廓系数的准确提取。
[0013]distance图是通过计算数据集D中每个数据点与其第K个最近邻数据点之间的K

最近邻距离(欧氏距离),其中纵坐标代表距离,横坐标代表在这个距离内包含的点的个数。
[0014]进一步地,所述利用K

distance图找到最合适参数MinPts、Eps的做法为:
[0015]选k流程:
[0016](1)取k(1<k<n,其中n为数据点数),输入K

distance算法,找到拐点,取Eps,MinPtsk+1。
[0017](2)输入DBSCAN算法,查看聚类效果,得到聚类簇数。
[0018](3)作聚类簇数与k值的图,当k值连续5次以上增加而聚类簇数不变时,我们认为聚类结果进入第一个稳定区间,记该簇数为最优簇数。
[0019]当聚类结果不存在稳定区间,改为寻找簇数波动范围在1内的稳定区间,根据实际情况在该区间选取最佳k值。
[0020]选取完k值,则该所求最佳MinPts即为k+1,所求最佳Eps即为拐点处的distance。
[0021]进一步地,所述归一化采取最大最小标准化方法,将数据归于[0,1]的范围内,其中最大最小标准化方法:其中x代表原数据,x

代表归一化后的数据。
[0022]进一步地,所述步骤3中MK检验法包括:依次取出频散点x1,x2,
……
,x
n
,确定插值函数f(x
i

x
j
)(n≥i>j≥1),计算s值,判断s正负情况确定频散曲线的趋势;通过调整DNSCAN参数以确定频散曲线聚类簇数情况,通过簇数确定频散曲线的连贯性,其中s值表达式为:
[0023][0024]进一步地,所述步骤3中采用轮廓系数判断频散曲线的离散程度及聚类效果,采用内聚度a(i)代表同一簇内点之间的紧密度,外聚度代表不同簇之间的紧密度,其中内聚度计算方法为:
[0025][0026]外聚度b(i)计算方法改为簇内点和簇外点的平均距离,遍历簇内所有点,得到多个外聚度值,{b1(i),b2(i),b3(i),...,bm(i)}从中选择最小的值作为最终的结果;
[0027]以轮廓系数s(i)值判断聚类效果,包括:轮廓系数s(i)趋近于1则类内的距离小于类间距离,轮廓明显,聚类效果好;轮廓系数s(i)趋近于1则类内的距离大于类间距离,轮廓模糊,聚类效果差;轮廓系数取值范围在[

1,1],其中轮廓系数s(i)的表达式为:
[0028][0029]进一步地,所述改进后的KNN算法训练的具体步骤包括:
[0030]计算一条频散曲线归一化后的特征参数,设共有j个特征参数,则第n条频散曲线为对应的特征参数为x
n1
,x
n2
,...,x
ni
,设有i条频散曲线,则所有特征参数对应为x
11
,x
12
,...,x
ij

[0031]构建KNN模型,通过交叉验证法选择参数k值,k值代表距离样本点最近的点的数量;
[0032]利用随机森林对特征参数进行重要性评估,依据重要程度的百分比赋予特征参数对应权值,更换欧氏距离为:
[0033][0034]g
j
为第j个特征参数对应的权重系数,x
ij
为第j个特征参数第i个待测样本,t
ij
为第j个特征参数第i个训练样本。
[0035]将频散曲线分成训练集,测试集,基于训练集的频散曲线的特征参数赋予相应的质量标签以训练,训练结果保存于KNN模型中;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地震背景噪声频散曲线自动筛选方法,其特征在于,该方法包括:步骤1、收集从频散能量图中人工拾取能量最大点获得的频散曲线以及理论生成的频散曲线,分为训练集和测试集;步骤2、利用改进的DBSCAN算法消除频散曲线中的离散点进行去噪;步骤3、对去噪后的频散曲线进行特征参数的提取,特征参数包括:幅度范围、频率范围、趋势、连贯性和轮廓系数;其中,通过调整DBSCAN算法关键参数:扫描半径Eps和最小包含点数MinPts,在DBSCAN算法中加入MK趋势检验法,提取出频散曲线的特征参数;步骤4、将训练集中提取特征参数作为频散曲线数据集的输入特征,依照人工对比理论频散曲线对训练集中的频散曲线进行好、中、差的质量等级划分,并将质量等级作为频散曲线数据集的输出标签,进行KNN算法的训练;步骤5、输入测试集中的频散曲线进行筛选,根据筛选情况对算法进行调整,并增加训练集频散曲线的多样性。2.根据权利要求1所述的频散曲线自动筛选方法,其特征在于,所述步骤2中利用改进的自适应DBSCAN算法消除频散曲线中的离散点包括:先将频散数据归一化,最小包含点数MinPts设定值在[2,10]的区间范围,扫描半径Eps设定在[0.01

0.2]之间,不断调参,直到将频散数据都归为一类,标签为0,而离散点标签为

1,消除标签为

1的离散点,利用K

distance图选择最合适的最小包含点数MinPts和扫描半径Eps,再次进行调参。3.根据权利要求2所述的频散曲线自动筛选方法,其特征在于,利用K

distance图选择最合适的最小包含点数MinPts和扫描半径Eps是通过计算数据集D中每个数据点与其第K个最近邻数据点之间的K

最近邻距离,具体包括:选k流程:(1)取k,1<k<n,其中n为数据点数,输入K

distance算法,找到拐点,取Eps,MinPts;(2)输入改进的自适应DBSCAN算法,查看聚类效果,得到聚类簇数;(3)作聚类簇数与k值的图,当k值连续5次以上增加而聚类簇数不变时,聚类结果进入第一个稳定区间,记该簇数为最优簇数;(4)当聚类结果不存在稳定区间,改为寻找簇数波动范围在1内的稳定区间,在该区间选取最佳k值;(5)选取完k值,则该k值所求最佳MinPts即为k+1,所求最佳Eps即为拐点处的距离。4.根据权利要求2所述的频散曲线自动筛选方法,其特征在于,所述归一化采取最大最小标准化方法,将数据归于[0,1]的范围内,其中最大最小标准化方法:其中x代表原数据,x<...

【专利技术属性】
技术研发人员:周晓华孙广辉孟新凯赵发王春露郑建彬裴春阳
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1