基于主成分分析的多元水文时间序列匹配模型构建方法技术

技术编号：17780065 阅读：225 留言：0更新日期：2018-04-22 08:45

本发明专利技术公开了一种基于主成分分析的多元水文时间序列匹配模型构建方法，基于主成分分析(PCA)和动态时间弯曲(DTW)方法进行多元水文时间序列相似性匹配的组合模型构建。首先对原始数据进行同构处理，这里采用Z‑score标准化方法。接着对处理后的数据进行分段聚合近似(PAA)处理，对经过PAA处理后的数据进行PCA处理，经过这两次处理，数据在时间维度和变量维度都实现了降维。最后使用加权的DTW方法进行相似性匹配，匹配出与给定时间序列最相似的时间序列。本发明专利技术提高了相似性匹配的准确率和时间效率，为水文预报、水文数据分析提供服务，对水利信息化和水利现代化的需求有较高的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】
基于主成分分析的多元水文时间序列匹配模型构建方法
本专利技术涉及一种基于数据挖掘和水文时间序列相似性匹配的模型构建方法，具体地说，是一种对多元水文时间序列进行相似性匹配的方法，从历史水文时间序列中匹配出与给定时间序列最相似的序列。
技术介绍
随着信息技术的发展，水文数据的种类和数量急剧增加，逐渐呈现出多元、大量和多态的特征。根据多元水文时间序列的特点，选用高效的数据挖掘算法，从大量的水文时间序列数据中提取有用的信息和知识，为解决水文领域的突出问题提供新的分析方法和科学的决策支持。传统水文数据挖掘方法面对如今数量巨大、类型复杂的水文数据资料，往往显得无能为力。目前对于水文时间序列的研究大多是基于一元水文时间序列，由于多元水文时间序列不同维度之间的复杂联系，其研究工作开展得相对缓慢，目前很多工作还处于起步阶段。
技术实现思路
专利技术目的：针对现有的多元水文时间序相似性匹配方法效率和准确率较差、不具有针对性的缺点，本专利技术提供一种基于主成分分析的多元水文时间序列匹配模型构建方法。技术方案：为实现上述专利技术目的，本专利技术使用第三方软件R作为程序编制和模型仿真预测的工具，分为三个部分，分别是数据预处理、模式表示和相似性匹配。由于水文时间序列大多来源于传感器的记录，通常具有很高的维度和很长的序列，并且包含大量噪音，因此需要对其进行预处理，降低对相似性匹配的干扰。模式表示包括对数据进行PAA和PCA处理，实现时间序列在时间维度和变量维度上的降维。相似性匹配采用加权的DTW作为距离度量的方法。与现有一些技术相比，本专利技术的有益效果是在多元水文时间序列的相似性匹配问题...
基于主成分分析的多元水文时间序列匹配模型构建方法

【技术保护点】
一种基于主成分分析的多元水文时间序列匹配模型构建方法，其特征在于，包括如下步骤：步骤1：对水文时间序列数据进行标准化处理，统一数据单位；步骤2：对标准化后的时间序列应用分段聚合近似(PAA)方法，对多元时间序列进行分段，得到多元时间序列的矩阵表示Xn×m；步骤3：对经过步骤2处理后的时间序列的矩阵Xn×m进行主成分分析；步骤4：把步骤2得到的时间序列的矩阵Xn×m映射到特征向量矩阵上，实现降维处理，同时把特征向量的方差贡献率作为权重；步骤5：把步骤4得到的方差贡献率作为权重，将给定的时间序列与步骤4映射后的数据使用加权的DTW方法进行相似性匹配；步骤6：通过计算在数据集中匹配出与给定时间序列最为相似即距离最小的一个或者多个时间序列。

【技术特征摘要】
1.一种基于主成分分析的多元水文时间序列匹配模型构建方法，其特征在于，包括如下步骤：步骤1：对水文时间序列数据进行标准化处理，统一数据单位；步骤2：对标准化后的时间序列应用分段聚合近似(PAA)方法，对多元时间序列进行分段，得到多元时间序列的矩阵表示Xn×m；步骤3：对经过步骤2处理后的时间序列的矩阵Xn×m进行主成分分析；步骤4：把步骤2得到的时间序列的矩阵Xn×m映射到特征向量矩阵上，实现降维处理，同时把特征向量的方差贡献率作为权重；步骤5：把步骤4得到的方差贡献率作为权重，将给定的时间序列与步骤4映射后的数据使用加权的DTW方法进行相似性匹配；步骤6：通过计算在数据集中匹配出与给定时间序列最为相似即距离最小的一个或者多个时间序列。2.如权利要求1所述的基于主成分分析的多元水文时间序列匹配模型构建方法，其特征在于，主成分分析为：首先需要计算数据集中变量之间的协方差，得到一个协方差矩阵，再通过奇异值分解对协方差矩阵进行特征值和特征向量分解，选择累计贡献率达到...

【专利技术属性】
技术研发人员：娄渊胜，盖振，叶枫，孙建树，
申请(专利权)人：河海大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人