一种基于Transformer地震信号分类识别方法技术

技术编号:37967826 阅读:44 留言:0更新日期:2023-06-30 09:43
本发明专利技术公开了一种基于Transformer地震信号分类识别方法,包括如下步骤:S1.数据获取;S2.构建主干网络;S3.在训练阶段,采用使用RMSprop优化器进行优化;S4.参数配准,训练模型。这种方法能通过自注意力的方式捕获全局上下文信息,对目标建立其远距离依赖关系,提取更深层次的特征,提高震源信号的识别能力。提高震源信号的识别能力。提高震源信号的识别能力。

【技术实现步骤摘要】
一种基于Transformer地震信号分类识别方法


[0001]本专利技术涉及对地震信号震源类别分类识别研究,属于信号处理领域的信号分类领域,具体是一种基于Transformer地震信号分类识别方法。

技术介绍

[0002]依据所观测到的地震波形信号区分识别观测波形对应事件源类型(如天然地震事件或人工爆破事件),近几十年来一直是地震学研究的难点和热点。近年来,与人类各种活动相关的人工爆破/爆炸的频度逐渐增加,例如爆破、核试验等,增加了获取天然地震目录的难度,也凸显了地震波形信号分类识别的必要性。因此,如何准确地识别天然地震和非天然地震具有十分重要的科学意义和现实意义。近年来,深度学习成为机器学习的一个热门研究方向。作为一种由多个隐藏层组成的多层神经网络学习算法,深度学习对输入数据的特征学习有着非常好的效果。在图像分类、图像分割和目标检测等方面取得极大的进展。在天然地震和人工爆破的地震信号分类识别研究中,深度学习能更好地提取地震信号特征包括蕴含在地震信号中的不同类型震源差异特征,根据所提取的特征进行准确的震源类型分类。卷积神经网络是深度学习中的热门研究方向,国内外的许多学者提出了基于卷积神经网络的地震信号识别研究,方法[CHEN R 2018]通过梅尔倒谱提取地震波形特征作为卷积神经网络输入,对地震和爆破进行识别分类(CHEN R,HUANG H,CHAI H.Study on the discrimination of seismic waveform signals between earthquake and explosion events by convolutional neural network[J].Progress in geophysics,2018,33(4):1331

1338.)。方法[Yonggang W 2019]通过残差网络模型对天然地震和人工爆破识别,将波形转换为功率谱作为模型的输入,通过模型学习地震波形和爆破波形的频谱特征,提高震源类型分类识别能力(Yonggang W,Qianli Y,Tingting W,et al.Earthquake and explosion identification based on Deep Learning residual network model[J].地震学报,2019,41(5):646

657.);方法[TIAN X 2022]使用多输入卷积神经网络模型,将天然地震和人工爆破的波形信号和波形信号的时频数据作为模型的输入,提高模型的分类识别能力(TIAN X,WANG M J,ZHANG X,et al.Discrimination of earthquake and quarry blast based on multi

input convolutional neural network[J].Chinese Journal of Geophysics,2022,65(5):1802

1812.)。方法[Kong Q 2022]通过将深度学习与P/S振幅比和局部震级等物理特征相结合,提高模型的泛化性能(Kong Q,Wang R,Walter W R,et al.Combining Deep Learning with Physics Based Features in Explosion

Earthquake Discrimination[J].arXiv preprint arXiv:2203.06347,2022.)。方法[Ku B 2020]在卷积神经网络中引入SE注意力机制,在地震事件分类中取得良好效果(Ku B,Kim G,Ahn J K,et al.Attention

based convolutional neural network for earthquake event classification[J].IEEE Geoscience and Remote Sensing Letters,2020,18(12):2057

2061.)。
[0003]卷积神经网络在震源类型识别上取得很好的效果,但卷积神经网络中的卷积核存
在感受野比较局限的问题,需要堆叠多层卷积

池化这类结构进行扩大感受野。但这样堆叠扩大的感受野会以某个中心原点向外高斯衰减,使实际感受野远小于理论感受野,不利于利用上下文信息进行特征捕获。

技术实现思路

[0004]本专利技术的目的是为了更好地学习到地震信号特征全局信息,提高天然地震和人工爆破的分类准确率,而提供一种基于Transformer地震信号分类识别方法。这种方法能通过自注意力的方式捕获全局上下文信息,对目标建立其远距离依赖关系,提取更深层次的特征,提高震源信号的识别能力。
[0005]实现本专利技术目的是技术方案是:
[0006]一种基于Transformer地震信号分类识别方法,包括如下步骤:
[0007]S1.数据获取:获取地震站台记录的三分量事件波形数据,其中三分量分别为东西分量、南北分量和垂直分量;将一个事件波形数据的三分量当作三个事件来进行识别,即把一个事件中的一个分量当作一个识别单元,以增加数据集的数量,使模型能学习到波形特征,具体实施过程包括以下两个处理:
[0008]S11:数据截取与去均值倾向:由于原始波形数据记录的时间长度不同,因此先对原始波形数据进行预处理,将原始波形截取相同的长度,原始波形数据中记录从P波初动到S波结束的时间相差较大,由几十秒至几百秒不等,为了充分将波形特征留在截取的长度范围内,截取时间为S波初动前的160秒开始,截取长度为327.68秒,采样频率为100H
Z
,采样点为32768点,然后将数据通过差分法进行去除均值倾向,令h0=0,其运算公式为:
[0009]h
k
=d
k

d
k
‑1,k∈[1,n];
[0010]S12:数据归一化:不同地震信号数据幅值可能差距过大,同一地震信号台站距离震源的远近也会对幅值产生一定的影响,为了确保地震信号数据在相同的离散程度下进行比较,帮助模型更快地收敛,需要对实验使用的地震信号数据进行归一化处理,使用最大最小值归一化方法,将地震信号数据放缩至[0,1]区间,最大最小值归一化公式为:
[0011][0012]S2.构建主干网络:主干网络由地震波形数据进行特征提取,以学习地震信号的特征,然后对特征进行分类,主干网络主要由以下几步构成:
[0013]S21:构建自注意力模块:自注意力机制通过计算输入序列之间的相互影响,捕获全局上下文信息,对目标建立远距离依赖,解决传统注意力长距离依赖有限问题,注意力计算过程如下所示:
[0014]假设x
i
,i∈(1,2,3,

,n)为输入样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Transformer地震信号分类识别方法,其特征在于,包括如下步骤:S1.数据获取:获取地震站台记录的三分量事件波形数据,其中三分量分别为东西分量、南北分量和垂直分量;将一个事件波形数据的三分量当作三个事件来进行识别,即把一个事件中的一个分量当作一个识别单元,以增加数据集的数量,使模型能学习到波形特征,具体实施过程包括以下两个处理:S11:数据截取与去均值倾向:由于原始波形数据记录的时间长度不同,因此先对原始波形数据进行预处理,将原始波形截取相同的长度,原始波形数据中记录从P波初动到S波结束的时间相差较大,由几十秒至几百秒不等,为了充分将波形特征留在截取的长度范围内,截取时间为S波初动前的160秒开始,截取长度为327.68秒,采样频率为100H
Z
,采样点为32768点,然后将数据通过差分法进行去除均值倾向,令h0=0,其运算公式为:h
k
=d
k

d
k
‑1,k∈[1,n];S12:数据归一化:若不同地震信号数据幅值差距过大,同一地震信号站台距离震源的远近也会对幅值产生影响,为了确保地震信号数据在相同的离散程度下进行比较,帮助模型更快地收敛,需要对实验使用的地震信号数据进行归一化处理,采用最大最小值归一化方法,将地震信号数据放缩至[0,1]区间,最大最小值归一化公式为:S2.构建主干网络:主干网络由地震波形数据进行特征提取,以学习地震信号的特征,然后对特征进行分类,主干网络主要由以下几步构成:S21:构建自注意力模块:自注意力机制通过计算输入序列之间的相互影响,捕获全局上下文信息,对目标建立远距离依赖,解决传统注意力长距离依赖有限问题,注意力计算过程如下所示:假设x
i
,i∈(1,2,3,

,n)为输入样本的特征图,W
Q
,W
k
,W
V
分别为生成q
i
,k
i
,v
i
的模型权重系数,将x
i
,i∈(1,2,3,

,n)分别与W
Q
,W
k
,W
V
权重系数相乘得到q
i
,k
i
,v
i
,i∈(1,2,3,

,n),计算q
i
与k
i
之间的相关性,除以k矩阵维度的平方根使用SoftMax函数对结果进行计算,与对应的v
m
相乘得到加权运算后特征图z
i
,i∈(1,2,3,

,n),计算公式为:S22:构建多头自注意力模块:多头自注意力模块是将q
i
,k
i
,v
i
整体看作一个头,通过多个不同的头来计算特征图中不同特征之间的相关性,将x
i
与多组W
Q
,W
k
,W
V
相乘得到q
i
,k
i
,v
i
,i∈(1,2,3,

,n),并进行自注意力计算,得到不同头的计算结果,不同头的计算结果进行拼接后输入全连接层进行线性变换得到最终结果,公式为:z
hi
=Attention(QW
iQ
,QW
iK
,QW
iV
)z1=Concat(z
h1
,z
h2
,z
h3
)W
l
;S23:构建窗口式多头自注意力模块:通过特征图按照窗口大小为16划分为多个窗口,然后每个特征图窗口X与不同的权重矩阵W
Q
,W
K
,W
V
相乘得到相应的查询向量Q、键向量K和值向量V,再对每个窗口进行多头自注意力的计算,计算结...

【专利技术属性】
技术研发人员:吴业正黄汉明何玉龙诸广镭
申请(专利权)人:广西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1