【技术实现步骤摘要】
一种基于小样本学习的冲击地压时序预测模型构建方法
[0001]本专利技术涉及一种冲击地压预测模型,具体是一种基于小样本学习的冲击地压时序预测模型构建方法,属于冲击地压预测
技术介绍
[0002]由于我国“富煤、贫油、少气”的国情实际,煤炭成为我国的基础能源和重要原料,煤炭工业成为关系国家经济命脉和能源安全的重要基础产业。近年来,随着我国煤矿开采深度快速增加以及地质、采矿条件的日趋复杂,冲击地压灾害形式日渐严峻,已成为制约煤矿安全生产的关键因素。由于冲击地压具有突发性、瞬时震动性和巨大破坏性等特征,所以事先难以预料其发生的时间、地点和程度。冲击地压危害程度大,影响面广,一旦发生,极易引起其他连锁事故,如瓦斯异常涌出、煤与瓦斯突出、突水和瓦斯爆炸等,造成极大的财产损失和人员伤亡。然而冲击地压发生的时间、地点、区域、震源等的复杂多样性和冲击地压的突发性,使得其预测工作极为困难复杂,成为急需解决的世界性难题。
[0003]许多学者参数化矿震数据进行预测矿震灾害的研究取得了非常大的进步。但是在过去的研究过程中,往往是针对给定的采矿地质条件而言,这就导致无法为冲击地压提供一个一般适用性的规则。冲击地压事件的发生往往伴随着大能量微震事件的产生,但是由于冲击地压发生的复杂性和受人为因素限制,使得无法获取到建立冲击地压预测模型所需的数据,导致无法掌握一些矿区微震数据状况并进行科学的冲击地压管理。冲击地压数据获取困难的问题,样本数据缺失,导致机器学习模型难以训练,使得其在缺数据地区的冲击地压研究更加具有挑战性。 >[0004]近年来,随着计算机技术的发展,冲击地压预测在深度学习上的应用得到了极大的发展。其中深度循环神经网络(RNN)在时序预测上应用尤为广泛,它能够借助之前的信息对当前时刻进行预测。但它对于长时间的学列来说,会忘记之前一些比较久远的信息,同时容易发生梯度消失和梯度爆炸的问题。随之而来的是对于深度循环神经网络(RNN)的变形长短期记忆循环神经网络(LSTM),它通过门控制单元来控制信息的传递,能够选择性的记忆重要信息和遗忘不重要的信息,这在时序预测上都取得不错的效果。
[0005]现有的冲击地压预测方法存在两种,一种是基于微震数据建立的传统冲击地压预测模型,还有一种是基于深度学习方法建立的冲击地压预测模型,虽然这些模型都取得了一系列的成功,但是还存在以下几个弊端:1)由于冲击地压的发生受多因素影响,使得冲击地压时间序列呈现高度复杂的非线性,限制了传统冲击地压预测模型的应用;同时由于每个矿的条件不一样,受人为因素影响大,虽然可以通过一些指标来判断,无法获得一个统一的结论。2)以长短期神经网络为代表的传统深度学习模型需要大量的数据训练才能够取得足够高的预测准确率,对于微震数据匮乏的一些矿区,无法提供大量的微震数据,将不能取得一个很好地效果。
技术实现思路
[0006]本专利技术的目的是提供一种基于小样本学习的冲击地压时序预测模型构建方法,通过长短期记忆循环神经网络(LSTM)结合小样本学习方法,能够降低长短期记忆循环神经网络(LSTM)对数据的依赖性,提高网络的泛化性,使其在数据量比较小时,也能够进行大能量矿震预测,为冲击地压提供早期预警。
[0007]为了实现上述目的,本专利技术提供一种基于小样本学习的冲击地压时序预测模型构建方法,包括以下步骤:
[0008]步骤1、矿震数据处理:在采煤工作面四周安装微震传感器,微震传感器将采集到的原始微震数据传至地面控制室的上位机,原始微震数据包括微震数据发生时间、能量大小、震源坐标,由上位机对原始微震数据进行微震数据处理,首先将原始微震数据按照时间段处理,得到每个时间段中的微震数据,然后将微震数据进行标准化处理后得到每个时间段的时间序列数据;
[0009]步骤2、密度指标建立:密度指标建立包括主成分分析法PCA处理和核密度估计KDE处理,通过主成分分析法PCA将步骤1的时间序列数据进行降维处理,将原本四维时间序列数据降至二维时间序列数据;通过核密度估计KDE处理对二维时间序列数据进行处理,处理好二维时间序列数据后将会得到每个微震数据的概率密度,然后根据每个时间段中选取其中最大的概率密度作为密度指标进行微震数据时序分析,得到大能量发生时间的一般规律,即选取这段时间段中70%以上的最大概率密度,当其中出现峰值时,推测出未来时间段是有可能发生大能量事件的,从而完成微震数据标签的构造,数据标签构造具体为:有大能量事件发生即为1,其他时间段数据标签构造为0,即无大能量事件发生;
[0010]步骤3、建立基于小样本学习的长短期记忆循环神经网络LSTM模型:使用长短期记忆循环神经网络LSTM对密度指标进行建模和特征提取,获取回归损失和数据特征;接着运用小样本学习原型网络,通过对长短期记忆循环神经网络LSTM处理的数据特征进行聚类并计算每个时间段中不同类别样本隐私特征的中心点,用欧式距离度量各个样本的隐表征向量和对应隐表征中心点的距离作为网络分类损失;最后在预测模块上,将上述损失连接,进行梯度回传和优化,完成基于小样本学习的深度学习模型构建,最终输出大能量矿震时间段的预测。
[0011]本专利技术步骤1中的矿震数据处理为:
[0012]以固定时间窗口统计数据,构建时间序列数据集合,时间序列数据包括时间以及坐标位置X,Y,Z,然后将每个时间段内的时间序列数据进行标准化处理,将数据处理成均值为0、标准差为1的标准正态分布的数据,其目的是将数据按比例缩放,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
[0013]标准化处理具体方法如下:
[0014][0015]平均值计算方法如下:
[0016][0017]标准差计算方法如下:
[0018][0019]式中:x
i
为第i个原始数据,包括第i个微震数据的时间以及坐标位置;
[0020]为原始数据的平均值;
[0021]σ(x)为原始数据的标准差;
[0022]x
i
'为原始数据更新后的数据;
[0023]n为时间段内包含的数据总量。
[0024]本专利技术步骤2中的密度指标建立为:
[0025]主成分分析法PCA处理的方法是基于数据降维的,该方法的主要思想是将原来具有一定相关性的M个指标进行重新组合,形成一组新的彼此不相关的N个指标,重新组合后获得的N个指标是原来M个指标的线性组合且符合M>N,用新的N个指标代替原来的M个指标作为模型的输入,进行后续分析,具体步骤如下:
[0026]假设有p条q维的标准化数据,首先将标准化数据按列组成q行p列矩阵D,然后将矩阵D每一行进行零均值化,即减去这一行的均值,接着求出协方差矩阵根据求出的协方差矩阵求出特征值及其对应的特征向量,将特征向量按对应特征值大小从大到小按行排列成矩阵,取前k行组成矩阵P,最后E=PD即为降到k维后的数据;
[0027]本专利技术将上述被主成分分析法PCA处理过的数据进行核本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,包括以下步骤:步骤1、矿震数据处理:在采煤工作面四周安装微震传感器,微震传感器将采集到的原始微震数据传至地面控制室的上位机,原始微震数据包括微震数据发生时间、能量大小、震源坐标,由上位机对原始微震数据进行微震数据处理,首先将原始微震数据按照时间段处理,得到每个时间段中的微震数据,然后将微震数据进行标准化处理后得到每个时间段的时间序列数据;步骤2、密度指标建立:密度指标建立包括主成分分析法PCA处理和核密度估计KDE处理,通过主成分分析法PCA将步骤1的时间序列数据进行降维处理,将原本四维时间序列数据降至二维时间序列数据;通过核密度估计KDE处理对二维时间序列数据进行处理,处理好二维时间序列数据后将会得到每个微震数据的概率密度,然后根据每个时间段中选取其中最大的概率密度作为密度指标进行微震数据时序分析,得到大能量发生时间的一般规律,即选取这段时间段中70%以上的最大概率密度,当其中出现峰值时,推测出未来时间段是有大能量事件发生的,从而完成微震数据标签的构造,有大能量事件发生即为1,其他时间段数据标签构造为0,即无大能量事件发生;步骤3、建立基于小样本学习的长短期记忆循环神经网络LSTM模型:使用长短期记忆循环神经网络LSTM对密度指标进行建模和特征提取,获取回归损失和数据特征;接着运用小样本学习原型网络,通过对长短期记忆循环神经网络LSTM处理的数据特征进行聚类并计算每个时间段中不同类别样本隐私特征的中心点,用欧式距离度量各个样本的隐表征向量和对应隐表征中心点的距离作为网络分类损失;最后在预测模块上,将上述损失连接,进行梯度回传和优化,完成基于小样本学习的深度学习模型构建,最终输出大能量矿震时间段的预测。2.根据权利要求1所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤1中的矿震数据处理为:以固定时间窗口统计数据,构建时间序列数据集合,时间序列数据包括时间以及坐标位置X,Y,Z,然后将每个时间段内的时间序列数据进行标准化处理,将数据处理成均值为0、标准差为1的标准正态分布的数据,标准化处理具体方法如下:平均值计算方法如下:标准差计算方法如下:式中:x
i
为第i个原始数据,包括第i个微震数据的时间以及坐标位置;
为原始数据的平均值;σ(x)为原始数据的标准差;x
i
'为原始数据更新后的数据;n为时间段内包含的数据总量。3.根据权利要求2所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤2中的密度指标建立为:主成分分析法PCA处理的方法是基于数据降维处理,将原来具有相关性的M个指标进行重新组合,形成一组新的彼此不相关的N个指标,重新组合后获得的N个指标是原来M个指标的线性组合且满足M>N,用新的N个指标代替原来的M个指标作为模型的输入,进行后续分析,具体步骤如下:假设有p条q维的标准化数据,首先将标准化数据按列组成q行p列的矩阵D,然后将矩阵D每一行进行零均值化,即减去这一行的均值,接着求出协方差矩阵根据求出的协方差矩阵求出特征值及其对应的特征向量,将特征向量按对应特征值大小从大到小按行排列成矩阵,取前k行组成矩阵P,最后E=PD即为降到k维后的数据;将上述被主成分分析法PCA降维后的数据进行核密度估计KDE处理,核密度估计函数如下:式中:K(.)为核函数;h>0为一个平滑参数,称作带宽,也被成为窗口;为缩放核函数;在中,K函数内部的h分母用于调整核密度估计KDE曲线的宽幅,而K函数外部的h分母则用于保证曲线下方的面积符合核密度估计KDE的规则;在选择合适的核函数及带宽后,核密度估计KDE能够模拟真实的概率分布曲线;在核函数的选择上采用高斯函数,并根据西尔弗曼法则,宽带h的选择如下所示:式中:n为时间段内包含的数据总量;d为数据维度;经过核密度估计KDE处理能够得到每个数据点的概率密度,通过将主成分分析法PCA坐标轴网格化,能够将每个时间段概率密度绘制在主成分分析法PCA坐标轴上。4.根据权利要求3所述的一种基于小样本学习的冲击地压时序预测模型构建方法,其特征在于,步骤3中的建立基于小样本学习的长短期记忆循环神经网络LSTM模型,具体如下:首先预测模型生成是基于步骤2处理后的密度指标所创建的训练数据集,构建时间序
列数据集合,采取6h作为时间窗口统计数据,假设第i个时间窗口计算得到的数据记录为m
i
,其可以表示为:式中:id为时间窗口编号;为微震数据时间段中发生地点的平均值;t为微震数据时间段范围内靠后的时间;如时间段为0时到6时,t选取为6时刻;将m
i
按照步骤1的方式进行标准化处理后得到的数据加入每个时间段对应的ρ
max
密度指标,构造成当本时间段缺失数据时,将上一时间段数据对本时间段数据进行补充;基于上述方法遍历时间窗口,得到时间数据序列数据集合M:M=[m0,m1,m2,......,m
n
‑1]
ꢀꢀꢀꢀꢀ
(7)时间段对应的标签集合T表示为:T=[t0,t1,t2,......,t
n
‑1]
ꢀꢀꢀꢀꢀꢀꢀ
(8)式中:t
i
为每个时间段,当所处时间段符合核密度估计KDE处理分析后的结果,则发生大能量事件,此时t
i
=1,否则t
i
=0;同时基于小样本学习的深度学习模型如下:基于小样本学习的深度学习模型包括卷积层、长短期记忆循环神经网络LSTM和小样本原型网络3个模块,数据集选择85%作为训练集,5%作为验...
【专利技术属性】
技术研发人员:曹安业,杨旭,刘亚鹏,刘耀琪,王常彬,牛强,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。