【技术实现步骤摘要】
基于图卷积神经网络的时序数据事件预测方法、系统及其应用
本专利技术属于数据挖掘及机器学习
,涉及时序数据事件预测领域,特别涉及一种基于图卷积神经网络的时序数据事件预测方法、系统及其应用。
技术介绍
根据历史时序数据对未来可能发生的事件进行预测是数据挖掘与机器学习领域重要的研究方向。目前的主要方法是通过传统机器学习或深度学习技术挖掘时序数据所包含的隐藏模式,并利用这些信息计算出未来某些事件发生的概率,进而达到事件预测的目的。时序数据通常具有时序性、高维度、高噪声等特点,使用传统机器技术对时序数据建模需先由领域专家进行数据的人工特征提取,再使用机器学习预测模型使用这些数据特征进行预测。其中,特征提取方式面对大量高维的数据时效率非常低下,同时模型预测效果会因特征的选择而产生差异,缺乏鲁棒性。近些年,深度学习技术因其强大的特征自动提取能力而被成功应用于多种领域;其中,循环神经网络模型因其优异的时间序列特征提取能力而被广泛应用于时序数据的事件预测应用中。对于深度学习预测模型而言,其性能很大程度上受到数据数 ...
【技术保护点】
1.一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,包括以下步骤:/n步骤1,采集预设数量的时序数据;对时序数据进行数据清洗,实现初始数据结构统一;/n步骤2,将步骤1获得的数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;将已标注的事件序列数据划分为训练集、验证集与测试集;/n步骤3,根据步骤2获得的训练集、验证集与测试集,以及知识图谱,分别构建时间、空间图结构形式的训练集、验证集与测试集;/n步骤4 ...
【技术特征摘要】
1.一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,包括以下步骤:
步骤1,采集预设数量的时序数据;对时序数据进行数据清洗,实现初始数据结构统一;
步骤2,将步骤1获得的数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;将已标注的事件序列数据划分为训练集、验证集与测试集;
步骤3,根据步骤2获得的训练集、验证集与测试集,以及知识图谱,分别构建时间、空间图结构形式的训练集、验证集与测试集;
步骤4,使用步骤3获得的训练集训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型;
步骤5,将待预测序列数据输入步骤4获得的事件预测模型中,获得在某一时刻特定事件可能会发生的概率。
2.根据权利要求1所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤1中,所述数据清洗包括:缺失值和异常值处理;其中,处理方式包括舍去、按正常值填充或按前一时刻值填充。
3.根据权利要求1所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤2具体包括:
步骤2.1,将步骤1获得的时序数据按照一定时间间隔划分;
步骤2.2,将步骤2.1所得的已划分时序数据中每个时间间隔内的时序数据转化为相应的事件集合,其中在同一时间间隔内发生的相同事件只记一次,得到具有相同时间间隔的事件序列数据;
步骤2.3,统计事件序列数据中所有事件的数量,以独热码的形式对每一个事件进行编码,表示成一维向量,得到每一个事件的事件向量;
步骤2.4,将每条事件序列数据的每个时间间隔中所包含的事件集合序列表示为事件集合向量,其中所述事件集合序列向量是通过将事件集合内所有事件向量相加获得,从而得到向量形式的事件序列数据;
步骤2.5,对每一条向量形式的事件序列数据,将其最后一个事件间隔的事件集合向量作为该条数据的预测标签,并将此事件集合向量从原始事件序列数据中删除,获得已标注的向量形式事件序列数据。
4.根据权利要求3所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤3具体包括:
步骤3.1,将知识图谱中的边关系用邻接矩阵的形式表示;其中,原本存在于知识图谱中的节点称为祖先节点;
步骤3.2,将步骤2.3统计所得的所有事件作为叶子节点加入知识图谱,并与相应的祖先节点进行连接,获得事件节点与祖先节点的连接关系,得到已扩充的邻接矩阵;同时统计所有事件节点及祖先节点的数量;
步骤3.3,根据步骤3.2所得节点数量对事件节点与祖先节点以独热码的形式进行编码,表示为新的一维向量,得到祖先节点向量以及事件节点向量;再根据步骤3.2所得的已扩充的邻接矩阵,将有连接关系的事件节点向量与祖先节点向量相加,得到新的事件节点向量;
步骤3.4,对步骤2.5所得的已标注的向量形式事件序列数据中每一个时间间隔内的事件子集以新的事件节点想点向量进行表示,得到每条事件序列数据各时间间隔的特征向量;
步骤3.5,对每条向量形式事件序列数据,将其各时间间隔的特征向量按照时间顺序,在时间维度上进行拼接,形成包含时序信息的事件序列特征矩阵。
5.根据权利要求4所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤3.2具体包括:扩充步骤3.1所得邻接矩阵的行和列,扩充数量为所有叶子节点个数;根据叶子节点的连接关系对邻接矩阵进行填充,得到已扩充的邻接矩阵。
6.根据权利要求4所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤4中,所述预构建的图卷积神经网络模型结构包括:
批数据归一化层,用于对采用批次训练的图卷积神经网络模型的输入进行归一化,减小批次训练带来的样本分布偏移;
时间-空间图卷积单元,用于接收时间-空间图结构数据,在图结构的空间域与时域中提取数据特征,输出低维特征图;
通道注意力层,用于在多通道特征图中甄别重要的特征;
平均池化层,用于对不同时间-空间卷积单元产生的不同尺寸特征图进行特征融合;
分类器,用于使用...
【专利技术属性】
技术研发人员:钱步月,李扬,潘迎港,王谞动,刘洋,吕欣,蔡宏伟,兰欣,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。