一种基于生成对抗网络的时间序列数据填补方法及系统技术方案

技术编号：21971304 阅读：27 留言：0更新日期：2019-08-28 01:26

本发明专利技术公开了一种基于生成对抗网络的时间序列数据填补方法及系统，包括：获取不同缺失率的数据集；对上述的数据集进行归一化处理，将时间序列数据转化为矩阵数据形式；构造滑动窗口，将数据分成若干组；筛选各个组中不缺失数据的行，构造每个组的完成数据集；将各个组中的完成数据集放入生成对抗网络中训练，使生成器和判别器达到平衡，最终生成若干虚拟数据；筛选生成的虚拟数据，将虚拟数据填补到缺失数据中；反归一化数据，最终完成数据填补。本发明专利技术有益效果：引入生成对抗网络，实现了缺失值的训练填补方式，特别适用于时间序列数据缺失值填补；候选填补数据量巨大，可根据填补数据的不同特性来筛选数据从而进行填补。

A Time Series Data Filling Method and System Based on Generating Countermeasure Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络的时间序列数据填补方法及系统
本专利技术涉及时间序列数据缺失值填补的
，特别是涉及一种基于生成对抗网络的时间序列数据填补方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。时间序列数据是最常见的数据之一，在金融、医疗、交通、气象、海洋等领域均有广泛的应用。然而，由于传感器、传输网络的不稳定性等原因，数据不可避免的会出现缺失值。数据的缺失会造成信息的不完整，从而对后续的分析和处理带来很不利的影响。一般的缺失值的填补方法包括均值填补、多项式拟合，插值法、EM算法、K-means聚类算法、组合完整化等方法。专利技术人发现，时间序列数据包含时间特征，较静态数据填补具有更高的挑战性。因为缺失数据往往与先前数据存在相关性，利用传统的数据填补方法可能会造成较大的误差。
技术实现思路
为了解决上述问题，本专利技术提出一种基于生成对抗网络的时间序列数据填补方法及系统，引入生成对抗网络，实现了缺失值的训练填补方式，特别适用于时间序列数据缺失值填补。在一些实施方式中，采用如下技术方案：一种基于生成对抗网络的时间序列数据填补方法，包括：获取不同缺失率的数据集；对上述的数据集进行归一化处理，根据数据周期，将时间序列数据转化为矩阵数据形式；构造滑动窗口，将数据分成若干组，每组包含所有数据的若干列；筛选各个组中不缺失数据的行，构造每个组的完成数据集；将各个组中的完成数据集放入生成对抗网络中训练，使生成器和判别器达到平衡，最终生成若干虚拟数据；筛选生成的虚拟数据，将虚拟数据填补到缺失数据中；反归一化数据，最终完成数据填...

【技术保护点】
1.一种基于生成对抗网络的时间序列数据填补方法，其特征在于，包括：获取不同缺失率的数据集；对上述的数据集进行归一化处理，根据数据周期，将时间序列数据转化为矩阵数据形式；构造滑动窗口，将数据分成若干组，每组包含所有数据的若干列；筛选各个组中不缺失数据的行，构造每个组的完成数据集；将各个组中的完成数据集放入生成对抗网络中训练，使生成器和判别器达到平衡，最终生成若干虚拟数据；筛选生成的虚拟数据，将虚拟数据填补到缺失数据中；反归一化数据，最终完成数据填补。

【技术特征摘要】
1.一种基于生成对抗网络的时间序列数据填补方法，其特征在于，包括：获取不同缺失率的数据集；对上述的数据集进行归一化处理，根据数据周期，将时间序列数据转化为矩阵数据形式；构造滑动窗口，将数据分成若干组，每组包含所有数据的若干列；筛选各个组中不缺失数据的行，构造每个组的完成数据集；将各个组中的完成数据集放入生成对抗网络中训练，使生成器和判别器达到平衡，最终生成若干虚拟数据；筛选生成的虚拟数据，将虚拟数据填补到缺失数据中；反归一化数据，最终完成数据填补。2.如权利要求1所述的一种基于生成对抗网络的时间序列数据填补方法，其特征在于，对数据集进行归一化处理，具体为：其中，ai,j为原始数据，Ai,j为归一化数据，max(ai,j)和min(ai,j)为原始数据的最大值和最小值。3.如权利要求1所述的一种基于生成对抗网络的时间序列数据填补方法，其特征在于，根据数据周期，将时间序列数据转化为矩阵数据形式，具体为：以小时、天、月、年时间周期分割数据，使每一行数据为一个周期。4.如权利要求1所述的一种基于生成对抗网络的时间序列数据填补方法，其特征在于，每一组中包含数据的列数满足：其中，n为滑动窗口的宽度即每组数据的列数，x为数据的缺失率，a为生成对抗网络所需的最小数据量，b为数据总行数。5.如权利要求1所述的一种基于生成对抗网络的时间序列数据填补方法，其特征在于，所述生成对抗网络中，生成器为了学习数据...

【专利技术属性】
技术研发人员：高瑞，张道良，武传艳，张德祯，于沛轩，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人