本发明专利技术属于矿床水文地质勘探技术领域,涉及一种基于小波变换和自回归移动平均模型-支持向量机的涌水量预测方法;先收集并分析矿井涌水量台账资料,然后选取建模样本和检验样本,对建模样本进行二进小波分解与重构,提取原始时间序列中的高频信息和低频信息,后利用自回归移动平均模型对高频信号建模,同时利用支持向量机模型对低频信号建模,再将高频信号模型和低频信号模型合成,建成涌水量最终预测模型,最后利用检验样本对最终预测模型进行检验,实现涌水量预测;其在充分拟合低频信息的同时,避免对高频信息的过拟合,工作原理可靠,预测方法简单,预测精度高,预测环境友好。
【技术实现步骤摘要】
【专利摘要】本专利技术属于矿床水文地质勘探
,涉及一种基于小波变换和自回归移动平均模型-支持向量机的涌水量预测方法;先收集并分析矿井涌水量台账资料,然后选取建模样本和检验样本,对建模样本进行二进小波分解与重构,提取原始时间序列中的高频信息和低频信息,后利用自回归移动平均模型对高频信号建模,同时利用支持向量机模型对低频信号建模,再将高频信号模型和低频信号模型合成,建成涌水量最终预测模型,最后利用检验样本对最终预测模型进行检验,实现涌水量预测;其在充分拟合低频信息的同时,避免对高频信息的过拟合,工作原理可靠,预测方法简单,预测精度高,预测环境友好。【专利说明】—种基于小波变换和ARMA-SVM的涌水量预测方法
: 本专利技术属于矿床水文地质勘探
,涉及一种涌水量预测方法,特别是一种基于小波变换和自回归移动平均模型-支持向量机(ARMA-SVM)的涌水量预测方法。
技术介绍
: 矿井涌水量是单位时间内涌入矿坑(包括井、巷和开采系统)的水量,它是确定矿床水文地质条件复杂程度及矿井建设和合理开发的重要指标,也是矿井生产部门制定采掘方式,确定满足所需排水能力且经济的排水设施的主要依据,对矿井防治水工作具有十分重要的意义。矿井涌水量的预测是一项比较复杂和困难的工作,目前矿井涌水量预测常用方法大致分为两大类:第一类为确定性的数学模型方法,包括水均衡法、解析法和数值法等,第二类为统计分析方法,包括水文地质比拟法、相关分析法、时间序列分析法、神经网络方法、支持向量机法和灰色系统法等。确定性的数学模型方法要求获得足够多的水文地质勘探数据,准确概化边界条件,难以准确建模或准确建模的地质勘探成本过高;统计分析方法则受到实测资料累计程度和推广性差等条件的限制。 统计分析方法中的时间序列方法着重研究具有随机性的动态数据,从频域和时域的角度对矿山涌水量时间序列的变化规律进行定量分析;对于那些已建成、影响因素难以确定或量化,且随后的采掘活动对其涌水量基本无影响的井巷系统,可将其历史观测台账数据看成时间序列,该涌水系统的涌水量历史观测值就是该“涌水系统”在不同时间、不同条件下的响应值,是该系统历史行为的客观记录,因而包含了该系统结构特征及运行规律,可以通过对该系统历史时间序列的分析研究来认识它的结构特征,如波动的周期、振幅、趋势,揭示其运行规律,进而用以预测。对于稳定的时间序列,用自回归移动平均(ARMA)模型预测效果较好,但是在实践中遇到的涌水量时间序列一般是各种因素交织在一起的结果,大多是一个非平稳的时间序列;目前对于非平稳时间序列的预测,一般采用差分自回归移动平均(ARIMA)模型进行分析与预测,其基本思想是用差分消除序列中的趋势项和周期项,而对平稳项用ARMA模型进行分析与预测,这种方法最大的缺点是其结果丢掉了最重要的信息即趋势项和周期项,对预测精度产生不利影响;对于非平稳涌水量时间序列预测,为了提高预测精度,除了模型的选择外,关键取决于如何提取时间序列中的低频和高频成分并进行建模,以及如何避免对高频信息的过拟合。现有技术中尚未见有对矿井涌水量非平稳时间序列预测方法的公开,《电网技术》第34卷第一期《基于小波分解和最小二乘支持向量机的短期风速预测》文章中写道,利用二进小波分解与重构和支持向量机建模能提高对风速预测的准确性,但该文章的描述仅仅针对发电领域风速预测,无法适用于矿井涌水量预测方法的改善。
技术实现思路
: 本专利技术的目的在于克服现有涌水量预测技术中存在的缺陷,寻求提供一种涌水量预测方法,为了解决涌水量非平稳时间序列的预测问题,考虑到二进正交小波分解对非平稳性时间序列的适应性,对低频的分离作用及支持向量机较好的泛化能力,提供一种基于小波变换和ARMA-SVM的涌水量预测方法,以提高预测精度。 为了实现上述目的,本专利技术的涌水量预测技术方案包括以下步骤: (I)获取涌水量原始时间序列:收集矿井确定时间段内观测记录的涌水量台账资料并进行分析,确定可靠的数据和必须剔除的数据; (2)选取样本:选取时间序列的前η个观测样本数据作为建模样本,后m-n个观测样本数据作为检验样本,η为随机选取的建模样本个数,m为样本总数; (3) 二进小波分解与重构:对建模样本的原始时间序列进行二进小波分解与重构,提取原始时间序列中的高频信息和低频信息;二进小波分解与重构采用马拉特(Mallat)算法,包括如下步骤: ①信号分解,将Ctl作为待分解的离散信号,则有: cJ+1 = Hcj, dJ+1 = Gcj (j = O, I,…,J); 其中:H和G分别为低通滤波器和高通滤波器;(Vl和C^1分别为原始信号在分辩率2_?+1)下的低频信号和高频信号;j为分解尺度;J为最大分解层数,最终将待分解离散信号 C0 分解为(I1, d2,...,dj 和 Cj ; 该分解算法利用二抽取,使每层分解比分解前的信号数据长度减半,总输出数据长度与输入待分解离散信号Ctl长度保持一致;待分解离散信号个数的减少对预测是不利的,经Mallat算法分解后的信号采用重构算法进行二插值重构; ②信号重构,重构算法为:Cj = H*cJ+1+G*dJ+1 ; 其中:H*和 G* 是对偶算子;j = J-l, J-2,...0 ; 对Cl1, d2,...,dj 和 Cj 分别进行重构,得到 D1, D2,...,Dj 和 Cj,有 X = D^D2+*..+Dj+Cj ; 其中A1: {d1;1, d1;2,…},…,Dj: {dJ;1, dJ;2,...}为第一层至第J层的高频信号重构;Cj:1cjil, Cj,2)…}为第J层的低频信号重构;X为原始信号重构; (4)利用自回归移动平均模型(ARMA)对高频信号建模;其步骤如下: ①平稳性检验:利用ADF(Augmented Dickey-Fuller)单位根检验法检验建模样本时间序列的平稳性,确定为平稳时间序列,进行ARMA建模; ②确定模型的形式和阶数:模型的形式有三种:自回归模型(AR(p))、移动平均模型(MA(q))和ARMA(P, q)模型,通过自相关函数和偏自相关函数的截尾性和拖尾性确定模型的形式;通过赤池信息量准则(AIC)和贝叶斯信息量准则(BIC)量化的计算结果判断模型的阶数,通过自由度的调整,取均方误差最小的模型阶数; ③估算模型参数:利用Eviews软件估算模型参数; ④建立模型:求取参数后建立模型,并进行检验; (5)利用支持向量机(SVM)模型对低频信号建模,步骤如下: ①选取时间序列的时间顺序为输入向量,低频信号为目标向量; ②数据归一化处理:对输入向量数据进行归一化处理,使得所有数据处于之间; ③初始参数设置:选择SVM类型和核函数,确定模型所需的运行参数,确定粒子群算法(PSO)的初始参数; ④PSO参数寻优:调用PSO-SVM算法优化SVM的惩罚参数c和核参数g,获取最优参数; ⑤建立SVM模型:用步骤④获得的最优参数训练SVM回归机,建立SVM低频信号模型; (6)建立涌水量预测的最终模型:将高频信号模型和低频信号模型合成,即为涌水量最终预测模型; (7)模型检验:利用本文档来自技高网...
【技术保护点】
一种基于小波变换和ARMA‑SVM的涌水量预测方法,其特征在于包括以下步骤:(1)获取涌水量原始时间序列:收集矿井确定时间段内观测记录的涌水量台账资料并进行分析,确定可靠的数据和必须剔除的数据;(2)选取样本:选取时间序列的前n个观测样本数据作为建模样本,后m‑n个观测样本数据作为检验样本,n为随机选取的建模样本个数,m为样本总数;(3)二进小波分解与重构:对建模样本的原始时间序列进行二进小波分解与重构,提取原始时间序列中的高频信息和低频信息;二进小波分解与重构采用马拉特Mallat算法,包括如下步骤:①信号分解,将c0作为待分解的离散信号,则有:cj+1=Hcj,dj+1=Gcj (j=0,1,…,J);其中:H和G分别为低通滤波器和高通滤波器;cj+1和dj+1分别为原始信号在分辩率2‑(j+1)下的低频信号和高频信号;j为分解尺度;J为最大分解层数,最终将待分解离散信号c0分解为d1,d2,…,dJ和cJ;该分解算法利用二抽取,使每层分解比分解前的信号数据长度减半,总输出数据长度与输入待分解离散信号c0长度保持一致;待分解离散信号个数的减少对预测是不利的,经Mallat算法分解后的信号采用重构算法进行二插值重构;②信号重构,重构算法为:cj=H*cj+1+G*dj+1;其中:H*和G*是对偶算子;j=J‑1,J‑2,…0;对d1,d2,…,dJ和cJ分别进行重构,得到D1,D2,…,DJ和CJ,有X=D1+D2+…+DJ+CJ;其中:D1:{d1,1,d1,2,…},…,DJ:{dJ,1,dJ,2,…}为第一层至第J层的高频信号重构;CJ:{cJ,1,cJ,2,…}为第J层的低频信号重构;X为原始信号重构;(4)利用自回归移动平均模型对高频信号建模;其步骤如下:①平稳性检验:利用ADF单位根检验法检验建模样本时间序列的平稳性,确定为平稳时间序列,进行ARMA建模;②确定模型的形式和阶数:模型的形式有三种:自回归模型、移动平均模型和ARMA模型,通过自相关函数和偏自相关函数的截尾性和拖尾性确定模型的形式;通过赤池信息量准则和贝叶斯信息量准则量化的计算结果判断模型的阶数,通过自由度的调整,取均方误差最小的模型阶数;③估算模型参数:利用Eviews软件估算模型参数;④建立模型:求取参数后建立模型,并进行检验;(5)利用支持向量机模型对低频信号建模,步骤如下:①选取时间序列的时间顺序为输入向量,低频信号为目标向量;②数据归一化处理:对输入向量数据进行归一化处理,使得所有数据处于[‑1,1]之间;③初始参数设置:选择SVM类型和核函数,确定模型所需的运行参数,确定粒子群算法的初始参数;④PSO参数寻优:调用PSO‑SVM算法优化SVM的惩罚参数c和核参数g,获取最优参数;⑤建立SVM模型:用步骤④获得的最优参数训练SVM回归机,建立SVM低频信号模型;(6)建立涌水量预测的最终模型:将高频信号模型和低频信号模型合成,即为涌水量最终预测模型;(7)模型检验:利用检验样本对步骤(6)建好的最终预测模型进行检验,预测精度在90%以上,说明模型合格,实现涌水量预测。...
【技术特征摘要】
【专利技术属性】
技术研发人员:邱梅,施龙青,韩进,滕超,牛超,
申请(专利权)人:山东科技大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。