一种基于多任务学习的地压灾害预测方法及装置制造方法及图纸

技术编号:39518404 阅读:11 留言:0更新日期:2023-11-25 18:56
本发明专利技术提供一种基于多任务学习的地压灾害预测方法和装置,应用于数据分析与预测技术领域,包括:从微震震源的参数数据,提取微震时序数据;对微震时序数据进行预处理,得到输入向量,所述预处理包括数据重采样

【技术实现步骤摘要】
一种基于多任务学习的地压灾害预测方法及装置


[0001]本专利技术涉及数据分析与预测
,特别是指一种基于多任务学习的地压灾害预测方法及装置


技术介绍

[0002]随着浅部矿产资源的逐渐枯竭,我国矿产资源开发正逐步进入深部采矿阶段,随开采深度增加,开采扰动更易破坏岩体原始应力平衡,诱发岩爆

冒顶

塌方等地压灾害

地压灾害的突发性

随机性和危害性不仅大大限制了施工效率,更是严重威胁着工人和设备的安全

[0003]微震监测作为非接触式

实时

动态的空间三维监测手段,具有监测范围广

信息量大的优点,因而广泛应用在金属非金属矿山和隧道等地下工程的地压灾害监测中,但目前基于微震监测数据的地压灾害预测预警方法并未或较少的考虑了时间因素,大多为事后分析,预警的时效性低,超前分析能力较差,一定程度上影响地压灾害防治的工作效率

效果;此外,地压灾害发生前微震参数较正常期间会出现明显偏离,仅通过当前的数据进行地压灾害预测预警,会很大程度的降低地压灾害预测预警的时效性和准确性

因此通过对微震时序数据的变化进行准确预测,将微震事件的时间节点前移,可为地压灾害防治工作提供更充分的时间保障

[0004]微震时序数据是一种动态的

非线性的时序数据,受采场周围多种因素的综合影响,变化规律难以分析掌握,并且多个类型的微震时序数据彼此之间的变化往往都是存在联系的,例如在累计视体积的急剧增大时,微震事件数往往会随之陡增,而能量指数和施密特数会快速下降

但在目前的研究中,往往是只单独考虑某个指标并分别进行预测,将各个指标割裂开来,无法反映各指标之间的内在联系,也难以发掘各指标之间的复杂关系

目前微震时序数据预测方法大致可分为经典时序建模(
ARMA、ARIMA
等)

深度学习(
RNN、GRU、LSTM
等)

机器学习(
LightGBM、XGBoost、Random Forest
等)三类

目前地压灾害预测在面对多个微震时序数据预测任务时存在的主要缺点有:(1)效率低,需要采用多个模型去预测多个微震时序数据,当面对较大的微震时序数据集时,模型参数较多,模型预测时间

计算成本

存储成本和维护成本更高

(2)效果差,由于部分微震时序数据稀疏或不平衡,例如累计视体积时序数据集中存在很多不变或变化很小的数据,影响数据特性提取,导致模型过拟合严重

(3)预测结果偏离真实的微震数据特征,受凿岩作业

爆破作业

机械振动和电磁干扰等因素影响,微震时序数据中不可避免的存在一些噪声,预测值往往会继承原始数据中的噪声特征,无法反映真实的微震信号特征,从而影响后续数据分析的准确性和可靠性


技术实现思路

[0005]本专利技术实施例提供了一种基于多任务学习的地压灾害预测方法及装置

本申请主要针对地压灾害预测效率低,效果差和预测结果偏离真实的微震数据特征的问题,本申请不仅可以提高地压灾害预测的效率,精度,还可以保留真实的微震数据特征

所述技术方案
如下:
[0006]一方面,本申请实施例提供了一种基于多任务学习的地压灾害预测方法,包括以下步骤:
[0007]S1
: 从微震震源的参数数据,提取微震时序数据;
[0008]S2
: 对微震时序数据进行预处理,得到输入向量,所述预处理包括数据重采样

缺失数据处理和数据归一化;
[0009]S3
: 将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数

累计能量

累计视体积及能量指数,进行地压灾害预测,
[0010]其中,所述地压灾害预测模型是基于
Attention

LSTM

MTL
神经网络的多任务学习模型,所述多任务学习模型包含两层堆叠式的
LSTM
网络
、Attention
模块和四个全连接层,所述两层堆叠式
LSTM
网络包含遗忘门

输入门和输出门

[0011]优选地
, 所述
S1
的从微震震源的参数数据,提取微震时序数据,包括:
[0012]S11
: 通过微震监测系统得到微震震源参数数据;
[0013]S12
: 从微震震源参数数据提取微震时序数据

[0014]优选地
, 所述微震时序数据,包括事件数

累计能量

累计视体积及能量指数的时序数据

[0015]优选地
, 所述
S2
的对微震时序数据进行预处理,得到输入向量,包括:
[0016]S21
: 通过公式(1)将微震时序数据进行数据重采样,得到固定频率的时序数据:
[0017](1)
[0018]式中,为均值聚合函数,为固定频率的时序数据,为微震时序数据;
[0019]S22
: 将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据;
[0020]S23
: 通过公式(2)对完整的时序数据
x_w
进行数据归一化处理,得到输入向量:
[0021](2)
[0022]式中,为输入向量,为完整的时序数据中的最小值,为完整的时序数据中的最大值

[0023]优选地
, 所述
S22
的将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据,包括:
[0024]S221
: 选取固定频率的时序数据中存在缺失值的数据,得到缺失数据;
[0025]S222
: 将缺失数据置零,得到完整的时序数据

[0026]优选地
, 在所述
S3
的将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数

累计能量

累计视体积及能量指数,包括:
[0027]S31
: 将输入向量中的
t
时刻的输入和上一时刻的两层堆叠式的
LSTM
网络输出进行拼接得到拼接后的向量;
[0028]S32
: 将拼接后的向量输入遗忘门,基于公式(3)通过遗忘门的
sigmoi本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多任务学习的地压灾害预测方法,其特征在于,包括:
S1
: 从微震震源的参数数据,提取微震时序数据;
S2
: 对微震时序数据进行预处理,得到输入向量,所述预处理包括数据重采样

缺失数据处理和数据归一化;
S3
: 将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数

累计能量

累计视体积及能量指数,进行地压灾害预测,其中,所述地压灾害预测模型是基于
Attention

LSTM

MTL
神经网络的多任务学习模型,所述多任务学习模型包含两层堆叠式的
LSTM
网络
、Attention
模块和四个全连接层,所述两层堆叠式
LSTM
网络包含遗忘门

输入门和输出门
。2.
根据权利要求1所述的基于多任务学习的地压灾害预测方法,其特征在于,所述
S1
的从微震震源的参数数据,提取微震时序数据,包括:
S11
: 通过微震监测系统得到微震震源的参数数据;
S12
: 从微震震源的参数数据中提取微震时序数据
。3.
根据权利要求1所述的基于多任务学习的地压灾害预测方法,其特征在于,所述微震时序数据包括:事件数

累计能量

累计视体积及能量指数的时序数据
。4.
根据权利要求1所述的基于多任务学习的地压灾害预测方法,其特征在于,所述
S2
的对微震时序数据进行预处理,得到输入向量,包括:
S21
: 通过公式(1)将微震时序数据进行数据重采样,得到固定频率的时序数据: (1)式中,为均值聚合函数,为固定频率的时序数据,为微震时序数据;
S22
: 将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据;
S23
: 通过公式(2)对完整的时序数据 进行数据归一化处理,得到输入向量:(2)式中,为输入向量,为完整的时序数据中的最小值,为完整的时序数据中的最大值
。5.
根据权利要求4所述的基于多任务学习的地压灾害预测方法,其特征在于,所述
S22
的将固定频率的时序数据的缺失数据进行缺失数据处理,得到完整的时序数据,包括:
S221
: 选取固定频率的时序数据中存在缺失值的数据,得到缺失数据;
S222
: 将缺失数据置零,得到完整的时序数据

6.
根据权利要求1所述的基于多任务学习的地压灾害预测方法,其特征在于,所述
S3
的将所述输入向量输入预训练的地压灾害预测模型,得到预测的事件数

累计能量

累计视体积及能量指数,包括:
S31
: 将输入向量中的
t
时刻的输入和上一时刻的两层堆叠式的
LSTM
网络输出进行拼接,得到拼接后的向量;
S32
: 将拼接后的向量输入遗忘门,基于公式(3)通过遗忘门的
sigmoid
神经网络层被映射到(0,1)之间,得到遗忘门的输出值:(3)式中,为遗忘门的输出值为输入向量中的
t
时刻的输入,为上一时刻的两层堆叠式的
LSTM
网络输出,为遗忘门的
sigmoid
神经网络层的权重
, 为遗忘门的
sigmoid
神经网络层的偏差;
S33
: 将拼接后的向量第一次输入到输入门,按照公式(4)通过
sigmoid
神经网络层映射到(0,1)区间,得到输入门第一次输出值,再通过
tanh
神经网络层将输入门第一次输出值映射到(
‑1,1)区间,生成状态候选向量:(4)式中,为输入门第一次输出值,为输入向量中的
t
时刻的输入,为上一时刻的
LSTM
网络输出,为状态候选向量, 为输入门的
sigmoid
神经网络层的权重, 为输入门的
sigmoid
神经网络层的偏差,为输入门的
tanh
神经网络层的权重,为输入门的
tanh
神经网络层的偏差;
S34
: 基于遗忘门输出值,通过公式(5)对状态候选量进行更新,得到更新后的状态候选量:(5)式中, 为状态候选向量,为更新后的状态候选量,为选择性遗忘的
t
‑1时刻传递的信息,为需要新加入的信息;
S35
: 将拼接后的向量第二次输入输出门,按照公式(6)通过
sigmoid
神经网络层映射到(0,1)区间,并和更新后的状态候选量整合得到
t
时刻的输入门第二次输出值:(6)式中,为输入门第二次输出值,为输入向量中的
t
时刻的输入,为上一时刻的
LSTM
网络输出,为更新后的输入门的
sigmoid
神经网络层的权重, 为输入门

sigmoid
神经网络层的偏差;
S36
: 将输入门第二次输出值输入
Attention
模块,按照公式(7)根据时间步重要性不同分配相应的权重,得到输入门第二次输出值的注意力分数:(7)式中,为注意力分数,为全连接层的权重,为全连接层的偏差,为
LSTM
网络输出,
tanh
为全连接层激活函数;
S37
: 基于公式(8),输入所述注意力分数,通过
softmax
函数计算得到
t
时刻的输入门第二次输出值所对应的注意力权重:(8)式中,为注意力分数,为注意力...

【专利技术属性】
技术研发人员:李杨夏文浩宋卫东付建新曹帅谭玉叶汪杰张理马军
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1