一种基于稀疏化方法的核最小均方时间序列在线预测模型技术

技术编号：24758430 阅读：52 留言：0更新日期：2020-07-04 09:40

一种基于稀疏化方法的核最小均方时间序列在线预测模型，属于时间序列预测技术领域。本发明专利技术选择核自适应滤波器中经典的核最小均方算法作为基础算法，针对实际数据中存在异常值和自然噪声等问题，将稀疏化方法和自适应调整方法运用其中，提高算法模型的预测能力和抗噪能力。首先，运用归一化方法对数据进行预处理；然后，运用顺序异常值准则来剔除数据中的异常值；最后，将量化方法与权重自适应调整方法相结合，来减小预测模型字典的大小并提高模型的跟踪时变特性能力。本发明专利技术能够充分利用有效信息，排除异常信息的干扰，获得更加准确、紧凑的字典；通过控制参数的选择可以在算法效率和准确性之间达到良好的平衡；还可以在时变环境中自适应地调整权重。

An online prediction model of kernel least mean square time series based on sparse method

全部详细技术资料下载

【技术实现步骤摘要】
一种基于稀疏化方法的核最小均方时间序列在线预测模型
本专利技术属于时间序列预测
，涉及一种在线预测方法，尤其涉及一种基于核自适应滤波器算法而进行建模的预测模型。
技术介绍
时间序列的在线预测在许多领域中起着越来越重要的作用，金融、环境、医药以及工程等领域里，经常以时间序列的形式收集数据。精确的时间序列预测在实际应用中具有重要价值。例如，通过对大型设备的故障诊断与剩余寿命预测，以“视情维修”替代传统的“定期维修”，从而可以降低维护费用，提高维护效率，甚至可以避免灾难性事故的发生。在实际预测应用中，大多数时间序列呈非线性特性，且需要在线处理方式，如股票走势预测、交通流实时预测以及半导体设备在线监测等。随着各个领域的快速发展，所获取的各种数据的数量也在飞速增长，时间序列的长度逐渐增加，数据的统计特性随时间不断变化，每个新到达数据的线性增长结构增加了内核学习网络中的计算复杂性和内存需求。传统的离线预测方法难以达到预测的目标效果，这就对时间序列的在线预测方法提出了更高的需求：(1)数据量的增加需要预测方法能降低计...

【技术保护点】
1.一种基于稀疏化方法的核最小均方时间序列在线预测模型，其特征在于，包括如下步骤：/n步骤1：从实际数据中获取时间序列预测问题的样本数据，包括输入数据x(n)＝[x

【技术特征摘要】
1.一种基于稀疏化方法的核最小均方时间序列在线预测模型，其特征在于，包括如下步骤：
步骤1：从实际数据中获取时间序列预测问题的样本数据，包括输入数据x(n)＝[x1(n)；x2(n)；...x；m(n)]和预测目标y(n)，其中xi(n)为第i个特征序列；
步骤2：运用归一化方法处理实验数据，采用归一化方法公式为：

其中，xi和分别代表样本数据归一化前后的值，xmax和xmin分别代表样本数据的最大值和最小值；
步骤3：划分训练集和测试集，并设置模型参数；
随机选取样本数据90％作为训练集，其余作为测试集；依据经验设置模型参数，包括模型学习率η，顺序异常值准则的用户定义系数λd和λv，量化阈值参数ε以及自适应调整参数初始化模型参数，预测误差e(n)＝y(1)，权重向量α1＝η·e(1)，模型字典D(1)＝x(1)；
步骤4：训练集数据按顺序进入预测模型进行训练；利用顺序异常值准则，剔除实验数据中的异常数据；所述的顺序异常值准则是依据历史数据，为新到达的数据建立预期区域，如果新数据超出预期区域，则将其标记为离群值；所述的预期区域由预期邻居距离和预期邻居方向向量组成；
4.1)在给定现有数据的信息的情况下，根据预期邻居距离推断顺序邻居数据之间的预期距离；根据预期邻居距离判断数据是否是异常值，预期邻居距离定义为：

其中，NDe(n)表示第n次迭代时的预期邻居距离；d<xi,xi+1>＝||x(i+1)-x(i)||为相邻距离；系数2i/(n-2)(n-1)用于将更高的权重分配给更接近新数据的相邻距离；
第n次迭代的预期邻居距离的上边界和下边界被定义为：

其中，B_Dupper(n)和B_Dlower(n)分别表示第n次迭代中预期邻居距离的上边界和下边界；λd表示用户定义的系数；σd(n)表示{d<xi,xi+1>,i＝1,2,...,n-2}的标准差；
计算相邻距离d<xn-1,xn>；如果超出预期邻居距离的既定范围，则第n个数据将被怀疑为异常值；所述预期邻居距离的既定范围为[NDe(n)-λdσd,NDe(n)+λdσd]；
4.2)在给定所有现有数据的信息的情况下，预期邻居方向向量描述在顺序邻居数据之间的预期方向向量，进而推断出数据可能朝向的方向；预期邻居方向向量定义为：

其中，NVe(n)表示第n次迭代时的预期邻居方向向量；采用系数2i/(n-2)(n-1)是为更接近新数据的方向矢量分配更高的权重；
在第n次迭代中预期的邻居方向矢量的上边界和下边界被定义为：

其中，B_Vupper(n)和B_Vlower(n)分别表示第n次迭代时预期邻居方向向量的上边界和下边界；λv表示用户定义的系数...

【专利技术属性】
技术研发人员：赵超超，任伟杰，韩敏，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人