一种基于DBSCAN聚类算法的速度谱拾取方法及介质技术

技术编号:37426052 阅读:26 留言:0更新日期:2023-04-30 09:47
本发明专利技术公开了一种基于DBSCAN聚类算法的速度谱拾取方法及介质,该基于DBSCAN聚类算法的速度谱拾取方法,包括:获取用于剩余速度拾取的数据集,应用DBSCAN聚类算法对数据集进行分类,得到分类后数据集,基于剩余速度谱,在分类后数据集中选取速度拾取点集,剔除速度拾取点集中的异常数据;本发明专利技术将DBSCAN聚类算法用于自动速度拾取,不断对速度拾取点进行调整修改,对不符合要求的速度拾取点进行了剔除,最终得到较好的速度拾取结果,将DBSCAN聚类算法与自动速度拾取相结合不仅提高了速度拾取速度,同时也提高了速度拾取结果的可信度。同时也提高了速度拾取结果的可信度。同时也提高了速度拾取结果的可信度。

【技术实现步骤摘要】
一种基于DBSCAN聚类算法的速度谱拾取方法及介质


[0001]本专利技术属于地震勘探领域,更具体地,涉及一种基于DBSCAN聚类算法的速度谱拾取方法及介质。

技术介绍

[0002]对剩余速度谱进行分析时,普遍靠人工拾取,由于处理员具有良好的处理经验,人工拾取结果的可信度高,但是工作效率低下,耗时巨大。当地震资料处理规模不断加大时,人工拾取难以在短周期内完成任务。随着地震勘探技术的不断发展,自动拾取速度谱取得了很大的进展。神经网络方法通过对速度谱中的不同的特征进行学习,达到自动拾取的效果。但是该方法需要设置大量标签,通过大量数据进行网络训练。聚类算法不需要进行训练,他是一种无监督的机器学习方法。主要思想是根据空间位置把能量团识别出来,再选取能量团的中心作为拾取结果。K均值聚类方法是最常用的聚类分析方法,但是这种方法需要提前设定分类个数,并且容易收到离群值和噪声点的影响,从而使得分类结果不够理想。此外,还有利用分频道集拾取精确叠加速度谱的方法,通过有限差分算法求解最优轨迹的方法。但是各种方法总是不能避免离群点以及噪声点的影响,且并不是所有速度谱中的能量团都需要被拾取。
[0003]因此,期待专利技术一种基于DBSCAN聚类算法的速度谱拾取方法,能够有效解决应用现有技术中的拾取方法导致的工作效率低和可信度不高的问题。

技术实现思路

[0004]本专利技术的目的是提出一种基于DBSCAN聚类算法的速度谱拾取方法,以解决应用现有技术中的拾取方法导致的工作效率低和可信度不高的问题。
[0005]为了实现上述目的,本专利技术提供一种基于DBSCAN聚类算法的速度谱拾取方法,包括:
[0006]获取用于剩余速度拾取的数据集;
[0007]应用DBSCAN聚类算法对所述数据集进行分类,得到分类后数据集;
[0008]基于剩余速度谱,在所述分类后数据集中选取速度拾取点集;
[0009]剔除所述速度拾取点集中的异常数据。
[0010]可选地,所述获用于取剩余速度拾取的数据集包括:
[0011]定义速度谱矩阵,所述速度谱矩阵为:
[0012][0013]其中s
ij
为第i行,第j列的点的能量值,v为所述速度谱矩阵的列数,g为所述速度谱矩阵的行数,i=1,2,

,v,j=1,2,

,g;
[0014]设定第一目标阈值k,筛选出所述速度谱矩阵Sv
×
g中元素值大于所述第一目标阈值k的多个能量值,所述多个能量值组成第一矩阵,所述第一矩阵为:
[0015][0016]对所述第一矩阵S1
v
×
g
进行降维处理,得到所述用于剩余速度拾取的数据集X,所述数据集X为:
[0017]X={x
ij
=(i,j)|s
ij
≠0}
#
[0018]={x1,x2,

,x
n
}
[0019]其中,(i,j)为数据点的坐标,n为所述数据集中数据点的总数。
[0020]可选地,所述分类后数据集C为:
[0021]C={c
i
},i=1,2,

,m
[0022]其中,c
i
为所述分类后数据集C中的一个类,m表示所述数据集X的分类总数,c
i
={x
i1
,x
i2


,x
in
},其中in小于n。
[0023]可选地,所述基于剩余速度谱,在所述分类后数据集中选取速度拾取点集包括:
[0024]步骤31:根据所述剩余速度谱确定间隔高度h;
[0025]步骤32:针对所述分类后数据集中的每个类c
i
,执行以下步骤:
[0026]确定所述类c
i
的纵向跨度h
i
,所述纵向跨度h
i

[0027]h
i
=|a
i

b
i
|
[0028]其中a
i
为所述类c
i
中数据点的最小纵坐标,b
i
为所述类c
i
中数据点的最大纵坐标;
[0029]将所述纵向跨度hi与所述间隔高度h相比较,根据比较结果确定初始速度拾取点;
[0030]步骤33:将所有类的所述初始速度拾取点按照深度从低到高的顺序进行排序,得到所述速度拾取点集V,所述速度拾取点集V为:
[0031]V={v1,v2,

,v
i


,v
t
},
[0032]其中,v
i
为所述类c
i
的初始速度拾取点,t为所述速度拾取点集V中速度拾取点的数量。
[0033]可选地,所述将所述纵向跨度hi与所述间隔高度h相比较,根据比较结果确定初始速度拾取点包括:
[0034]如果hi≤h,则选取所述类c
i
中能量值最大的点为所述初始速度拾取点;
[0035]如果hi>h,则将所述类c
i
分为h
i
/h个区间,并选取每个所述区间中能量值最大的点为所述初始位速度拾取点。
[0036]可选地,所述剔除所述速度拾取点集中的异常数据包括:
[0037]剔除所述速度拾取点集V中不满足第一预设条件的速度拾取点;
[0038]剔除所述速度拾取点集V中不在预设区间内的速度拾取点;
[0039]剔除所述速度拾取点集V中不满足第二预设条件的速度拾取点。
[0040]可选地,所述剔除所述速度拾取点集V中不满足第一预设条件的速度拾取点包括:
[0041]设定相邻两个速度拾取点之间的最小距离Dis;
[0042]在所述速度拾取点集V中任意选取两个速度拾取点v
i
和v
j
,如果|v
i

v
j
|<Dis,则剔除所述两个速度拾取点v
i
和v
j
中能量值较小的点。
[0043]可选地,从所述速度谱的中心线沿深度方向分别向两侧偏离预定距离获得所述预设区间。
[0044]可选地,所述剔除所述速度拾取点集V中不满足第二预设条件的速度拾取点包括:
[0045]针对速度拾取点vi,计算其对应的预设函数值,所述预设函数为:
[0046][0047]其中m
i
为速度拾取点v
i
到速度谱中心线的垂直距离,g
i
为速度拾取点v
i
到相邻的速度拾取点v
j
的梯度,S
i
为速度拾取点v<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DBSCAN聚类算法的速度谱拾取方法,其特征在于,包括:获取用于剩余速度拾取的数据集;应用DBSCAN聚类算法对所述数据集进行分类,得到分类后数据集;基于剩余速度谱,在所述分类后数据集中选取速度拾取点集;剔除所述速度拾取点集中的异常数据。2.根据权利要求1所述的基于DBSCAN聚类算法的速度谱拾取方法,其特征在于,所述获用于取剩余速度拾取的数据集包括:定义速度谱矩阵,所述速度谱矩阵为:其中s
ij
为第i行,第j列的点的能量值,v为所述速度谱矩阵的列数,g为所述速度谱矩阵的行数,i=1,2,

,v,j=1,2,

,g;设定第一目标阈值k,筛选出所述速度谱矩阵S
v
×
g
中元素值大于所述第一目标阈值k的多个能量值,所述多个能量值组成第一矩阵,所述第一矩阵为:对所述第一矩阵S1
v
×
g
进行降维处理,得到所述用于剩余速度拾取的数据集X,所述数据集X为:其中,(i,j)为数据点的坐标,n为所述数据集中数据点的总数。3.根据权利要求2所述的基于DBSCAN聚类算法的速度谱拾取方法,其特征在于,所述分类后数据集C为:C={c
i
},i=1,2,

,m其中,c
i
为所述分类后数据集C中的一个类,m表示所述数据集X的分类总数,c
i
={x
i1
,x
i2


,x
in
},其中in小于n。4.根据权利要求3所述的基于DBSCAN聚类算法的速度谱拾取方法,其特征在于,所述基于剩余速度谱,在所述分类后数据集中选取速度拾取点集包括:步骤31:根据所述剩余速度谱确定间隔高度h;步骤32:针对所述分类后数据集中的每个类c
i
,执行以下步骤:确定所述类c
i
的纵向跨度h
i
,所述纵向跨度h
i
为h
i
=|a
i

b
i
|其中a
i
为所述类c
i
中数据点的最小纵坐标,b
i
为所述类c
i
中数据点的最大纵坐标;将所述纵向跨度h
i
与所述间隔高度h相比较,根据比较结果确定初始速度拾取点;步骤33:将所有类的所述初始速度拾取点按照深度从低到高的顺序进行排序,得到所
述速度拾取点集V,所述速度拾取点集V为:V={v1,v2,

,v
i


,v
t
},其中,v
i
为所述类c
i
的初始速度拾取点,t为所述速度拾取点集V中...

【专利技术属性】
技术研发人员:郭清华杨祥森
申请(专利权)人:中国石油化工股份有限公司石油物探技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1