一种基于可解释注意力神经网络的地震震相序列检测方法技术

技术编号:39862992 阅读:8 留言:0更新日期:2023-12-30 12:56
本发明专利技术涉及一种基于可解释注意力神经网络的地震震相序列检测方法,属于地震波形数据处理分析领域

【技术实现步骤摘要】
一种基于可解释注意力神经网络的地震震相序列检测方法


[0001]本专利技术属于地震波形数据处理分析领域,具体涉及一种基于可解释注意力神经网络的地震震相序列检测方法


技术介绍

[0002]随着全球地震监测台网及基础设施的不断建立和完善,越来越多低成本高效益的传感器技术得到发展,海量数据不断涌现,地震学领域正面临着大数据时代所带来的“3V

s”挑战:体量
(Volume)、
种类
(Variety)
和速度
(Velocity)。
[0003]在这种时代背景下,人工智能
(Artificial Intelligence

AI)
技术逐渐被应用于地震学领域中,国内外相关学者进行了十余年的探索,几乎把以机器学习和深度学习为代表的
AI
技术带进了地震学的每一个子领域,尤其在地震事件检测

震相拾取

地震事件识别等诸多地震学任务中,
AI
技术都表现出了优于经典方法的能力

其中,震相拾取是地震数据自动处理的重要一步,准确检测震相并判断到时对于地震事件检测至关重要,也是目前
AI
技术在地震波形数据处理中的一个热门应用领域

当前绝大部分基于
AI
开展的震相识别工作,均主要针对
P

S
两种震相独立拾取,存在拾取震相单一且误检率

漏检率高等问题

[0004]此外,由于
AI
模型结构非常复杂,本质上缺乏透明度,无法向人类解释和证明其决策依据

因此人们只能将其当作一个“黑盒”来处理,很难证明其在重要决策上的合理性,而如果没有适当的解释,识别和防止模型错误行为的发生就变得不可能
。2022
年,国家自然科学基金委员会发布了“可解释

可通用的下一代人工智能方法”重大研究计划项目指南,面向以深度学习为代表的人工智能方法模型可解释性差

对抗样本鲁棒性差

数据与算力需求大

理论基础薄弱等科学问题,通过规则与学习相结合的方式,建立高精度

可解释

可通用且不依赖大量标注数据的人工智能新方法,开发下一代人工智能方法需要的数据库和模型训练平台,完善下一代人工智能方法驱动的基础设施


技术实现思路

[0005](

)
要解决的技术问题
[0006]本专利技术要解决的技术问题是如何提供一种基于可解释注意力神经网络的地震震相序列检测方法,以解决基于
AI
开展的震相识别工作时,
AI
模型结构非常复杂,本质上缺乏透明度,无法向人类解释和证明其决策依据的问题

[0007](

)
技术方案
[0008]为了解决上述技术问题,本专利技术提出一种基于可解释注意力神经网络的地震震相序列检测方法,该方法包括如下步骤:
[0009]步骤一

通过设定时间窗口和步长,将采集的地震波形原始数据滑动截取为若干个待检测窗口,并对所截取数据进行预处理;
[0010]步骤二

将预处理后的地震波形数据输入到模型的编码器
Encoder
中,依次进行空间几何

时间序列以及全局和局部注意力信息的特征序列提取;
[0011]步骤三

将步骤二中提取的特征序列输入到模型的解码器
Decoder
中,对其进行上采样,并最终通过模型预测层输出震相序列的检测识别和到时估算结果;
[0012]步骤四

对模型解码器中的关键卷积层添加梯度类激活映射图并进行可视化,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性

[0013](

)
有益效果
[0014]本专利技术提出一种基于可解释注意力神经网络的地震震相序列检测方法,本专利技术充分利用了人工智能技术在海量地震波形数据涌现时代背景下,可基于数据驱动训练出表现性能较佳的深度神经网络模型,进而高效且准确地检测震相并判断到时的优势,同时考虑到深度神经网络模型与生俱来的黑盒本质,在不影响模型原有网络结构和预测精度的情况下开展可解释优化

[0015]本专利技术的有益效果包括:
[0016](1)
在模型的编码器部分,特征提取的过程中同时考虑到空间几何特征

时间序列特征

全局注意力特征和局部注意力特征,针对地震波形类型的一维时间序列数据具有较强的特征发现能力;
[0017](2)
在模型的解码器部分,采用了与编码器层数相同的一维反卷积神经网络,能够将编码器部分所提取的特征序列通过上采样还原到与输入原始波形数据一致的维度,从而实现震相到时的拾取;
[0018](3)
在模型的预测层部分,采用了全连接层和
softmax
函数激活的组合形式,使得模型能够同时对多种震相类别进行区分,从而实现对多种震相的识别;
[0019](4)
综合
(1)

(3)
,相比较目前
AI
震相拾取方法只能拾取
P

S
两种独立震相,本专利技术能够实现对地震波形数据中由多种震相构成的震相序列进行整体检测和到时拾取;
[0020](5)
在不影响模型原有网络结构和预测精度的情况下,设计了一种用于地震波形数据震相序列检测的可解释注意力神经网络,通过类激活映射图的方式可视化展示模型中关键卷积层在对预测结果做出贡献时所重点关注的波形数据区域,从而既保证了模型的表现性能又提升了模型的内部透明度,为模型决策行为提供了可解释性

附图说明
[0021]图1为本专利技术本专利技术实施例的流程图;
[0022]图2为本专利技术实施例中深度注意力神经网络模型,对输入地震波形原始数据进行处理得到的震相序列检测识别和到时估算结果示意图;
[0023]图3为本专利技术实施例中添加可解释优化机制后的深度注意力神经网络模型,对输入地震波形原始数据进行处理得到的震相序列检测识别和到时估算结果,以及针对模型检测
Pg、Sg
两类震相时的可视化解释效果示意图

具体实施方式
[0024]为使本专利技术的目的

内容和优点更加清楚,下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述

[0025]针对上述问题,本专利技术提出了一种基于可解释注意力神经网络的地震波形数据震相序列检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,该方法包括如下步骤:步骤一

通过设定时间窗口和步长,将采集的地震波形原始数据滑动截取为若干个待检测窗口,并对所截取数据进行预处理;步骤二

将预处理后的地震波形数据输入到模型的编码器
Encoder
中,依次进行空间几何

时间序列以及全局和局部注意力信息的特征序列提取;步骤三

将步骤二中提取的特征序列输入到模型的解码器
Decoder
中,对其进行上采样,并最终通过模型预测层输出震相序列的检测识别和到时估算结果;步骤四

对模型解码器中的关键卷积层添加梯度类激活映射图并进行可视化,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性
。2.
如权利要求1所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤一中所述设定的时间窗口为
8.192
秒,所述设定的步长为
0.1
秒,所述预处理包括对滑动截取后的地震波形数据进行去线性

滤波和归一化操作
。3.
如权利要求2所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤二中所述的模型编码器由多层卷积神经网络

循环神经网络和注意力神经网络组成,通过编码器对地震波形数据依次进行空间几何

时间序列以及全局和局部注意力信息的特征序列提取
。4.
如权利要求3所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤二具体包括如下步骤:
S2.1、
首先将预处理后的地震波形数据输入到由7层
Conv1D
和5层
ResCNN
组成的一维卷积神经网络
CNN
中,对原始波形数据进行降采样空间几何特征提取;
S2.2、
然后将
S2.1
步骤中提取的降采样几何特征序列输入到由2层
Bi

LSTM
和1层
LSTM
组成的循环神经网络
RNN
中,对其进一步提取时间序列特征;
S2.3、
接着将步骤
S2.2
中提取的时间序列特征分别输入到由2层全局
Transformer、1

LSTM
和1层局部
Transformer
组成的注意力神经网络中,依次提取得到全局注意力和局部注意力特征信息;全局注意力特征信息为事件级别特征信息,局部注意力特征信息为震相级别特征信息
。5.
如权利要求1所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤三中所述的模型解码器由7层
Conv1D
一维反卷积神经网络构成,所述模型预测层由1层全连接层和
softmax
激活函数层组成
。6.
如权利要求1‑5任一项所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤四中所述的对模型解码器中的关键卷积层添加梯度类激活映射图并进行可视化,在不改变网络原有结构和模型参数的情况下,取出关键卷积层的反向传播梯度计算特征图权重,通过加权计算得到梯度类激活映射图并对其进行可视化,为模型输出震相序列识别和到时估算结果的决策行为提供可解释性
。7.
如权利要求6所述的基于可解释注意力神经网络的地震震相序列检测方法,其特征在于,所述步骤四具体包括:
S4.1、
首先选定模型解码器中的感兴趣卷积层作为关键卷积层;
S4.2、
根据某一全连接层类别
y
c
所对应的通道输出结果,
c
代表类别序号,对上述关键卷
积层的输出特征图
A
k
计算反向梯度矩阵
k
代表通道序号,该梯度矩阵的维度与特征图
A
k
一致,维度为宽和高;
S4.3、
通过对梯度矩阵进行全局平均池化操作,得到特征图
A
k
的权重值为:其中,
Z
...

【专利技术属性】
技术研发人员:黄立洪李健刘哲函王晓明刘泽玉李铭
申请(专利权)人:禁核试北京国家数据中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1