当前位置: 首页 > 专利查询>清华大学专利>正文

基于多阶差分网络的高频时序数据处理方法技术

技术编号:17734003 阅读:48 留言:0更新日期:2018-04-18 11:27
本发明专利技术实施例提供了一种基于多阶差分网络的高频时序数据处理方法,包括:S1,获取高频时序数据,并将所述高频时序数据输入训练好的多阶差分网络模型;S2,若判断获知所述高频时序数据超过预设长度,则利用所述采样模块对所述高频时序数据进行下采样,并将下采样得到的时序数据与所述高频时序数据进行组合形成第一数据集;S3,利用所述差分模块对所述第一数据集进行多次差分,并将多次差分得到的多个数据集与所述第一数据集组合形成第二数据集;S4,利用所述递归层和所述全连接层对所述第二数据集进行处理,以得到所述高频时序数据的分类结果向量。实现了多阶差分网络模型对高频时序数据的自动化处理,且结果准确。

High frequency time series data processing method based on multi order differential network

【技术实现步骤摘要】
基于多阶差分网络的高频时序数据处理方法
本专利技术实施例涉及计算机数据分析
,更具体地,涉及基于多阶差分网络的高频时序数据处理方法。
技术介绍
随着工业生产技术的日趋成熟,多数工业生产设备会安装有一种或多种传感器,在工作时传感器实时产生时间序列数据,管理人员可通过观察数据特点来了解设备的工作状况。这种问题本质上是一种分类问题,多数可通过物理原理来进行一定程度上的解决,但由于实际生产环境往往比较复杂,无法完全考虑影响生产的所有因素,对于设备工况的判断严重依赖于管理人员的经验。此外,由于生产工艺越来越复杂,生产设备需要越来越多的传感器来反映其真实的工作状况,大大提高了对于管理人员能力的要求。如在电力生产部门,没一台发电机上拥有包括电压、电流等上百种传感器,实时产生上百种高频时序数据。但由于人力成本等原因,企业招聘的管理人员素质良莠不齐,造成对于故障的处理不及时、不恰当,给企业造成了极大的损失。目前大多数设备已经具有一定的自动诊断功能,但这些自动化技术多从设备原理出发,只能给出初步判断结果,难以适应复杂的工作环境,极易造成漏报误报。深度学习技术目前已得到工业界和学术界的广泛关注,也在日常生活中取得了广泛的应用。如我们熟悉的搜索引擎、人脸识别,已经出现了较为成熟的深度学习解决方案,其效果也得到了人们的广泛认可。深度学习技术对于复杂性较高的问题能够给出较优的近似解,适用于目前企业复杂的生产环境问题。随着大数据的发展与广泛应用,企业往往会保存几个月乃至几年的历史数据,这也给使用深度学习技术提供了数据支持。虽然深度学习技术在各个领域已有了较高的成就,但对于时序数据分类问题,目前还没有较好的解决方案,原因在于时序数据的特征仍没有较好的方法提取。因此,亟需提供一种基于深度学习技术的时序数据处理方法。
技术实现思路
本专利技术实施例提供了一种克服上述问题或者至少部分地解决上述问题的基于多阶差分网络的高频时序数据处理方法。一方面本专利技术实施例提供了基于多阶差分网络的高频时序数据处理方法所述方法包括:S1,获取高频时序数据,并将所述高频时序数据输入训练好的多阶差分网络模型,其中,所述多阶差分网络模型包括采样模块、差分模块、递归层以及全连接层;S2,若判断获知所述高频时序数据超过预设长度,则利用所述采样模块对所述高频时序数据进行下采样,并将下采样得到的时序数据与所述高频时序数据进行组合形成第一数据集;S3,利用所述差分模块对所述第一数据集进行多次差分,并将多次差分得到的多个数据集与所述第一数据集组合形成第二数据集;S4,利用所述递归层和所述全连接层对所述第二数据集进行处理,以得到所述高频时序数据的分类结果向量。其中,步骤S2具体包括:若判断获知所述高频时序数据超过预设长度,选取多种不同的步长分别对所述高频时序数据进行下采样,得到多个时序数据;将所述多个时序数据和所述高频时序数据作为数据集中的元素进行组合形成所述第一数据集。其中,步骤S3具体包括:用所述第一数据集中的每一时序数据中的后一采样点减前一采样点得到新的时序数据,则所述第一数据集中的所有时序数据对应的新的时序数据组合形成第一差分数据集;用所述第一差分数据集中的每一时序数据中的后一采样点减前一采样点得到新的时序数据,则所述第一差分数据集中的所有时序数据对应的新的时序数据组合形成第二差分数据集;将所述第一差分数据集、所述第二差分数据集以及所述第一数据集组合形成为所述第二数据集。其中,所述递归层包括多组第一多层递归神经网络和多组第二多层递归神经网络,所述多组第一多层递归神经网络和所述多组第二多层递归神经网络一一对应,所述多组第一多层递归神经网络中多层递归神经网络的数量与所述第二数据集中元素的数量相等。其中,所述全连接层包括多组全连接网络,所述多组全连接网络中全连接网络的数量与所述第二数据集中元素的数量相等,每组全连接网络对应于一对相互对应的第一多层递归神经网络和第二多层递归神经网络,且每组全连接网络的最后一层为softmax网络层。其中,在步骤S1之前还包括:构建所述多阶差分网络模型,并采用随机梯度下降法对所述多阶差分网络模型进行训练,直至由交叉熵函数定义的损失函数计算得到信息损失处于预设范围内,即得到所述训练好的多阶差分网络模型。其中,步骤S4具体包括:将所述第二数据集中的每一时序数据正序输入一个第一多层递归神经网络得到第一特征向量,将所述每一时序数据倒序输入对应的第二多层递归神经网络得到第二特征向量,并将所述第一特征向量和所述第二特征向量连结得到所述每一时序数据的组合特征向量;将所述每一时序数据的组合特征向量输入所述全连接层,得到所述每一时序数据对应的分类结果向量;将所述第二数据集中所有时序数据对应的分类结果向量相加得到所述高频时序数据的分类结果向量。另一方面本专利技术实施例提供了一种基于多阶差分网络的高频时序数据处理系统,所述系统包括:输入模块,用于获取所述高频时序数据,并将所述高频时序数据输入训练好的多阶差分网络模型,其中,所述多阶差分网络模型包括采样模块、差分模块、递归层以及全连接层;第一数据集获取模块,用于若判断获知所述高频时序数据超过预设长度,则利用所述采样模块对所述高频时序数据进行下采样,并将下采样得到的时序数据与所述高频时序数据进行组合形成第一数据集;第二数据集获取模块,用于利用所述差分模块对所述第一数据集进行多次差分,并将多次差分得到的多个数据集与所述第一数据集组合形成第二数据集;分类模块,用于利用所述递归层和所述全连接层对所述第二数据集进行处理,以得到所述高频时序数据的分类结果向量。第三方面本专利技术实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述方法。第四方面本专利技术实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述方法。本专利技术实施例提供的基于多阶差分网络的高频时序数据处理方法,通过采样模块对超过预设长度的高频时序数据进行采样,以对高频时序数据的压缩,再通过差分模块对经采样后的数据集进行多次差分,以抽取高频时序数据的变化特征,最后将含有多次差分数据的数据集依次输入递归层和全连接层进行分类,实现了多阶差分网络模型对高频时序数据的自动化处理,且结果准确,适用于企业日趋复杂的生产环境。附图说明图1为本专利技术实施例提供的一种基于多阶差分网络的高频时序数据处理方法的流程图;图2为本专利技术实施例提供的一种基于多阶差分网络的高频时序数据处理方法的示意图;图3为本专利技术实施例中采样操作与差分操作示意图;图4为本专利技术实施例中多阶差分网络模型训练和使用流程图图5为本专利技术实施例中递归操作示意图;图6为本专利技术实施例中递归层架构示意图;图7为本专利技术实施例中全连接层架构示意图;图8为本专利技术实施例提供的一种基于多阶差分网络的高频时序数据处理系统的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做本文档来自技高网
...
基于多阶差分网络的高频时序数据处理方法

【技术保护点】
一种基于多阶差分网络的高频时序数据处理方法,其特征在于,所述方法包括:S1,获取高频时序数据,并将所述高频时序数据输入训练好的多阶差分网络模型,其中,所述多阶差分网络模型包括采样模块、差分模块、递归层以及全连接层;S2,若判断获知所述高频时序数据超过预设长度,则利用所述采样模块对所述高频时序数据进行下采样,并将下采样得到的时序数据与所述高频时序数据进行组合形成第一数据集;S3,利用所述差分模块对所述第一数据集进行多次差分,并将多次差分得到的多个数据集与所述第一数据集组合形成第二数据集;S4,利用所述递归层和所述全连接层对所述第二数据集进行处理,以得到所述高频时序数据的分类结果向量。

【技术特征摘要】
1.一种基于多阶差分网络的高频时序数据处理方法,其特征在于,所述方法包括:S1,获取高频时序数据,并将所述高频时序数据输入训练好的多阶差分网络模型,其中,所述多阶差分网络模型包括采样模块、差分模块、递归层以及全连接层;S2,若判断获知所述高频时序数据超过预设长度,则利用所述采样模块对所述高频时序数据进行下采样,并将下采样得到的时序数据与所述高频时序数据进行组合形成第一数据集;S3,利用所述差分模块对所述第一数据集进行多次差分,并将多次差分得到的多个数据集与所述第一数据集组合形成第二数据集;S4,利用所述递归层和所述全连接层对所述第二数据集进行处理,以得到所述高频时序数据的分类结果向量。2.根据权利要求1所述方法,其特征在于,步骤S2具体包括:若判断获知所述高频时序数据超过预设长度,选取多种不同的步长分别对所述高频时序数据进行下采样,得到多个时序数据;将所述多个时序数据和所述高频时序数据作为数据集中的元素进行组合形成所述第一数据集。3.根据权利要求1所述方法,其特征在于,步骤S3具体包括:用所述第一数据集中的每一时序数据中的后一采样点减前一采样点得到新的时序数据,则所述第一数据集中的所有时序数据对应的新的时序数据组合形成第一差分数据集;用所述第一差分数据集中的每一时序数据中的后一采样点减前一采样点得到新的时序数据,则所述第一差分数据集中的所有时序数据对应的新的时序数据组合形成第二差分数据集;将所述第一差分数据集、所述第二差分数据集以及所述第一数据集组合形成为所述第二数据集。4.根据权利要求1所述方法,其特征在于,所述递归层包括多组第一多层递归神经网络和多组第二多层递归神经网络,所述多组第一多层递归神经网络和所述多组第二多层递归神经网络一一对应,所述多组第一多层递归神经网络中多层递归神经网络的数量与所述第二数据集中元素的数量相等。5.根据权利要求4所述方法,其特征在于,所述全连接层包括多组全连接网络,所述多组全连接网络中全连接网络的数量与所述第二数据集中元素的数量相等,每组全连接网络对应于一对相互对应的第一多层递归神经网络和第二多层递归神经网络,且...

【专利技术属性】
技术研发人员:龙明盛王建民张建晋黄向东
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1