System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于DTW的多元时序特征预测方法及系统技术方案_技高网

基于DTW的多元时序特征预测方法及系统技术方案

技术编号:40781161 阅读:4 留言:0更新日期:2024-03-25 20:25
本发明专利技术提供了一种基于DTW的多元时序特征预测方法及系统,包括:对卫星遥测数据进行分段处理,得到原始时间序列;分别提取特征,组合生成多元特征向量作为初始样本数据集进行预处理;对处理后的特征序列进行时标对齐等间隔插值处理,生成样本时间序列特征集;将所述初样本数据集和对应的分类标签集作为LSTM网络的输入,进行模型训练;根据样本数据的特征序列及对应的分类标签生成对应类型的特征模板;输入训练好的LSTM模型,获取分类标签;依次计算每段特征模板与移动特征序列的相似度;选取相似度最大的模板序列获得指定时刻的预测值及反归一化处理输出最终预测值。本发明专利技术可同时并行计算各段序列间的相似度值,从而显著提高匹配的速度。

【技术实现步骤摘要】

本专利技术涉及时间序列数据挖掘,具体地,涉及一种基于dtw的多元时序特征预测方法及系统。


技术介绍

1、dtw是一个典型的优化问题,它用满足一定条件的的时间规整函数描述测试模板和参考模板的时间对应关系,求解两模板匹配时累计距离最小所对应的规整函数。其基本原理是通过寻找最优弯曲路径,令一个时间序列中数据的坐标点去匹配另一时间序列中特征相似度最大的坐标点。

2、lstm是一种改进的rnn模型,它的改进之处在于用记忆块取代传统的隐含节点,使梯度在训练展开比较长时不消失或爆炸,从而解决了rnn无法处理过长时间序列的难题。lstm模型的基本单元是记忆模块,其中包含记忆单元和三个控制记忆单元状态的门结构,分别是忘记门、输入门和输出门。忘记门决定从记忆单元状态中忘记无用的历史信息,输入门决定当前输入数据对记忆单元状态的影响,输出门决定输出信息。

3、专利文献cn104915568a(申请号:cn201510351199.7)公开了一种基于dtw的卫星遥测数据异常检测方法。其特征在于它包括下述步骤:步骤一:以幅角突变点为标识进行分段,获取含有类别标签的时间序列;步骤二:计算出含有类别标签的时间序列中各类别类内的dtw距离均值。

4、但是专利文献cn104915568a为了解决现有的检测方法存在的异常参数未超过报警门限导致的卫星部件异常漏检的问题、以固定点数对具有周期特性的卫星遥测数据进行分段存在较大偏差的问题和时间序列存在微小偏移而使度量结果不够准确进而导致异常检测结果不够准确的问题

5、专利文献cn104915434a(申请号:cn201510351181.7)公开了一种基于马氏距离dtw的多维时间序列分类方法,其特征在于,包括如下步骤:步骤一:将卫星正常运行状态下的历史卫星遥测数据y以幅角突变点为标识进行分段,得到正常多维时间序列;步骤二:将分段后所得到的多维时间序列通过层次聚类方法设定聚类目标类别数目对序列进行聚类操作,从而获得多维时间序列的类别标签;步骤三:提取最新卫星遥测数据中相邻m+1个幅角突变点对应时间点之内的测试数据;步骤四:计算出待分类的多维时间序列与含有类别标签的多维时间序列之间的dtw距离序列;步骤五:采用基于马氏距离的dtw距离的knn分类方法,根据设定的k近邻数目对待分类的多维时间序列进行分类,确定待分类的多维时间序列所属类。

6、但是专利文献cn104915434a是要解决针对卫星遥测数据进行固定点分段效果不理想、由于多维时间序列之间存在相关性以及时间序列存在微小偏移而使度量结果不够准确进而导致分类结果不够准确的问题,而提出了一种基于马氏距离dtw的多维时间序列分类方法。

7、专利文献cn108764460a(申请号:cn201810469767.7)公开了一种基于时间卷积和lstm的时间序列预测方法,包括:获取时间序列预测问题的样本数据,包括时间序列和预测目标序列;采用不同的超参数组合,建立基于tc#lstm模型的多个候选模型;对时间序列进行预处理,得到窗口序列和目标集,并通过划分得到训练集和测试集;利用训练集对候选模型进行训练;利用训练好的候选模型对测试集中的窗口序列子集进行预测,并计算每一个候选模型的预测结果与测试集中的目标集子集的均方根误差;选取均方根误差最小的候选模型作为预测模型;对待预测的时间序列进行预处理,得到待预测的窗口序列,然后利用预测模型对待预测的窗口序列进行预测,得到预测目标值。

8、但是专利文献cn108764460a得时间序列预测的准确度还有提高的空间。

9、因此,针对实际卫星遥测数据有限的情况下,智能特征预测算法需提供大量样本数据进行训练的局限性,市场上,需要一种能够提高匹配的速度,提高特征预测的准确性的基于dtw的多元时序特征预测方法及系统。


技术实现思路

1、针对现有技术中的缺陷,本专利技术的目的是提供一种基于dtw的多元时序特征预测方法及系统。

2、根据本专利技术提供的一种基于dtw的多元时序特征预测方法,包括:

3、步骤s1:根据卫星遥测数据的周期特性对卫星遥测数据进行分段处理,得到原始时间序列;

4、步骤s2:分别根据各维度变量提取特征,组合生成基于时间的多元特征向量作为初始样本数据集;

5、步骤s3:对所述原始时间序列的集合进行预处理;

6、步骤s4:设置时间间隔,对处理后的特征序列进行时标对齐等间隔插值处理,生成样本时间序列特征集;

7、步骤s5:将所述初样本数据集和对应的分类标签集作为lstm网络的输入,进行模型训练,并存储训练好的模型参数;

8、步骤s6:根据样本数据的特征序列及对应的分类标签生成对应类型的特征模板;

9、步骤s7:将待预测的特征序列进行归一化处理,输入训练好的lstm模型,获取分类标签;

10、步骤s8:将待预测特征序列与匹配类型的特征模板进行比对,按设置的步长沿特征模板滑动,依次计算每段特征模板与移动特征序列的相似度;

11、步骤s9:选取相似度最大的模板序列,进行时标对齐,获得指定时刻的预测值,并对预测值进行反归一化处理输出最终预测值。

12、优选地,所述步骤s2中提取特征的处理操作包括以下子步骤:

13、步骤s2.1:根据样本数据提取基于时间变化影响样本特征及分类的特征元素;

14、步骤s2.2:根据提取的特征元素组合生成多元特征向量。

15、优选地,所述步骤s3中的数据预处理包括以下子步骤:

16、步骤s3.1:计算特征序列数据集的数学期望和标准差;

17、步骤s3.2:剔除异常数据,所述异常数据包括大于μk+3σk和小于μk-3σk的数据,其中,μk表示样本数据集k维度的数学期望,σk表示样本数据集k维度的标准差;

18、步骤s3.3:采用均值填补法补全剔除位置的数据,公式如下:

19、x′k=(xk-1+xk+1)σk/2

20、其中,xk-1表示剔除位置数据的前一个数据,xk+1表示剔除位置数据的后一个数据,σk表示样本数据k维度的标准差;

21、步骤s3.4:根据离差标准化法对清洗后的数据进行归一化处理,公式如下:

22、x*=(x-xmin)/(xmax-xmin)

23、其中,xi表示原始数据,xmin表示样本最小值,xmax表示样本最大值。

24、优选地,所述步骤s4中进行插值处理需根据各数据集的时序特点设置时间间隔,所述时间间隔不得大于特征序列集的实际间隔。

25、优选地,所述步骤s5包括:

26、步骤s5.1:将样本特征数据集进行归一化处理;

27、步骤s5.2:将样本特征数据与分类标签进行逐一对应,组合作为新的训练特征数据集;

28、步骤s5.3:利用归一化后的数据训练lstm神经网络获得预测模型。

本文档来自技高网...

【技术保护点】

1.一种基于DTW的多元时序特征预测方法,其特征在于,包括:

2.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S2中提取特征的处理操作包括以下子步骤:

3.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S3中的数据预处理包括以下子步骤:

4.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S4中进行插值处理需根据各数据集的时序特点设置时间间隔,所述时间间隔不得大于特征序列集的实际间隔。

5.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S5包括:

6.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S6中的生成特征模板的方法包括以下子步骤:

7.根据权利要求6所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S6.4包括如下子步骤:

8.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S7包括以下步骤:

9.根据权利要求1所述的基于DTW的多元时序特征预测方法,其特征在于,所述步骤S8包括以下步骤:

10.一种基于DTW的多元时序特征预测系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于dtw的多元时序特征预测方法,其特征在于,包括:

2.根据权利要求1所述的基于dtw的多元时序特征预测方法,其特征在于,所述步骤s2中提取特征的处理操作包括以下子步骤:

3.根据权利要求1所述的基于dtw的多元时序特征预测方法,其特征在于,所述步骤s3中的数据预处理包括以下子步骤:

4.根据权利要求1所述的基于dtw的多元时序特征预测方法,其特征在于,所述步骤s4中进行插值处理需根据各数据集的时序特点设置时间间隔,所述时间间隔不得大于特征序列集的实际间隔。

5.根据权利要求1所述的基于dtw的多元时序特征预测方法...

【专利技术属性】
技术研发人员:刘良凤娄明静范君杰李彤汪少林代海山
申请(专利权)人:上海卫星工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1