当前位置: 首页 > 专利查询>清华大学专利>正文

基于层次化深度网络的长时序列数据处理方法技术

技术编号:17780407 阅读:32 留言:0更新日期:2018-04-22 09:16
本发明专利技术实施例提供了一种基于层次化深度网络的长时序列数据处理方法,包括:S1,将所述长时序列数据输入训练好的层次化深度网络模型;S2,利用所述卷积层中的所述多对卷积核和池化核对所述长时序列数据进行单维卷积操作得到第一压缩时序数据集,并将所述第一压缩时序数据集中的所有压缩时序数据连结形成第一多维时序数据;S3,利用所述卷积层获取多个多维时序数据,并将所述多个多维时序数据中长度小于第一预设长度的多维时序数据进行组合形成第一数据集;S4,利用所述递归层和所述全连接层对所述第一数据集进行处理,以得到所述长时序列数据的分类结果向量。实现了层次化深度网络模型对长数据的自动化处理,且结果准确。

【技术实现步骤摘要】
基于层次化深度网络的长时序列数据处理方法
本专利技术实施例涉及计算机数据分析
,更具体地,涉及一种基于层次化深度网络的长时序列数据处理方法。
技术介绍
在多数工业生产中,为了方便管理人员实时观察生产设备的工作状态,会有附着于设备的传感器实时产生工况数据,有经验的领域专家可通过观察其一段时间内的变化来判断对应的生产设备工况是否产生变化。这类问题实际上是一种分类问题。如在电力生产企业中,专家可通过观察电机电压变化来判断电机时候产生异常,以及时做进一步处理。然而随着生产设备的设计趋向于复杂,需要观测的传感器数据也随之增多,也随着人力成本的增加,企业亟须一种自动化方法替代人工观察。这种实时工况数据是一种多维的时间序列数据,其特点为数据质量较好,且固定采集间隔,但采集频率密集,这就造成了其在时间维度上过长,一般会达到几千或上万个时间点,这就需要在处理前需要一些采样等技术对其进行压缩以节约内存与网络带宽。现有的处理方法对于这种长时间时序数据难以做到压缩数据的同时更好的保留数据原有的信息,因此本专利技术提出一种深度学习方法来处理此类问题。深度学习技术目前已得到工业界和学术界的广泛关注,也在日常生活中取得了广泛的应用。如我们熟悉的搜索引擎、人脸识别,已经出现了较为成熟的深度学习解决方案,其效果也得到了人们的广泛认可。深度学习技术对于复杂性较高的问题能够给出较优的近似解,适用于目前企业复杂的生产环境问题。随着大数据的发展与广泛应用,企业往往会保存几个月乃至几年的历史数据,这也给使用深度学习技术提供了数据支持。虽然深度学习技术在各个领域已有了较高的成就,但对于时序数据分类问题,目前还没有较好的解决方案,原因在于时序数据的特征仍没有较好的方法提取。因此,亟需提供一种基于深度学习技术的时序数据处理方法。
技术实现思路
本专利技术实施例提供了一种克服上述问题或者至少部分地解决上述问题的基于层次化深度网络的长时序列数据处理方法。一方面本专利技术实施例提供了一种基于层次化深度网络的长时序列数据处理方法,所述方法包括:S1,获取长时序列数据,并将所述长时序列数据输入训练好的层次化深度网络模型,所述层次化深度网络模型包括卷积层、递归层以及全连接层;其中,所述卷积层包括多对卷积核和池化核,且各对卷积核和池化核对应的卷积核的长度和池化核的长度的乘积相同;S2,利用所述卷积层中的所述多对卷积核和池化核对所述长时序列数据进行单维卷积操作得到第一压缩时序数据集,并将所述第一压缩时序数据集中的所有压缩时序数据连结形成第一多维时序数据;S3,基于所述第一多维时序数据,利用所述卷积层获取多个多维时序数据,并将所述多个多维时序数据中长度小于第一预设长度的多维时序数据进行组合形成第一数据集;S4,利用所述递归层和所述全连接层对所述第一数据集进行处理,以得到所述长时序列数据的分类结果向量。其中,步骤S2具体包括:每对卷积核和池化核中的卷积核以对应的卷积步长对所述长时序列数据进行卷积;所述每对卷积核和池化核中的池化核以对应的池化步长对经卷积后的所述长时序列数据进行池化,得到所述每对卷积核和池化核对应的压缩时序数据,并将所述多对卷积核和池化核对应的多个压缩时序数据进行组合形成所述第一压缩时序数据集;将所述第一压缩时序数据集中的所有压缩时序数据在空间上连结形成第一多维时序数据。其中,步骤S3具体包括:利用所述卷积层对所述第一多维时序数据进行单维卷积操作,得到第二压缩数据集,并将所述第二压缩数据集中的所有压缩数据进行连结得到第二多维时序数据,重复上述操作直至连结后得到的多维时序数据的长度小于第二预设长度;将所述多个多维时序数据中长度小于第一预设长度的多维时序数据组合形成第一数据集;其中,所述第二预设长度小于所述第一预设长度。其中,所述递归层包括多组第一多层递归神经网络和多组第二多层递归神经网络,所述多组第一多层递归神经网络和所述多组第二多层递归神经网络一一对应,所述多组第一多层递归神经网络中多层递归神经网络的数量与所述第一数据集中元素的数量相等。其中,所述全连接层包括多组全连接网络,所述多组全连接网络中全连接网络的数量与所述第一数据集中元素的数量相等,每组全连接网络对应于一对相互对应的第一多层递归神经网络和第二多层递归神经网络,且每组全连接网络的最后一层为softmax网络层。其中,在步骤S1之前还包括:构建所述层次化深度网络模型,并采用随机梯度下降法对所述层次化深度网络模型进行训练,直至由交叉熵函数定义的损失函数计算得到信息损失处于预设范围内,即得到所述训练好的层次化深度网络模型。其中,步骤S4具体包括:将所述第一数据集中的每一时序数据正序输入一个第一多层递归神经网络得到第一特征向量,将所述每一时序数据倒序输入对应的第二多层递归神经网络得到第二特征向量,并将所述第一特征向量和所述第二特征向量连结到所述每一时序数据的组合特征向量;将所述每一时序数据的组合特征向量输入所述全连接层,得到所述每一时序数据对应的分类结果向量;将所述第一数据集中所有时序数据对应的分类结果向量相加得到所述长时序列数据的分类结果向量。另一方面本专利技术实施例提供了一种基于层次化深度网络的长时序列数据处理系统,所述系统包括:输入模块,用于获取长时序列数据,并将所述长时序列数据输入训练好的层次化深度网络模型,所述层次化深度网络模型包括:卷积层、递归层以及全连接层;其中,所述卷积层包括多对卷积核和池化核,且各对卷积核和池化核对应的卷积核的长度和池化核的长度的乘积相同;卷积模块,用于利用所述卷积层中的所述多对卷积核和池化核对所述长时序列数据进行单维卷积操作得到第一压缩时序数据集,并将所述第一压缩时序数据集中的所有压缩时序数据连结形成第一多维时序数据;第一数据集获取模块,用于基于所述第一多维时序数据,利用所述卷积层获取多个多维时序数据,并将所述多个多维时序数据中长度小于第一预设长度的多维时序数据进行组合形成第一数据集;分类模块,用于利用所述递归层和所述全连接层对所述第一数据集进行处理,以得到所述长时序列数据的分类结果向量。第三方面本专利技术实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述方法。第四方面本专利技术实施例提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述方法。本专利技术实施例提供的一种基于层次化深度网络的长时序列数据处理方法,通过利用包括多对卷积核和池化核的卷积层对长时序列数据进行压缩,并对压缩得到的压缩时序数据集进行连结,最终得到包含有多个多维时序数据的数据集,将包含有多个多维时序数据的数据集作为输入,经递归层和全连接层进行分类,实现了层次化深度网络模型对长时序列数据的自动化处理,且结果准确,适用于企业日趋复杂的生产环境。附图说明图1为本专利技术实施例提供的一种基于层次化深度网络的长时序列数据处理方法的流程图;图2为本专利技术实施例提供的一种基于层次化深度网络的长时序列数据处理方法的示意图;图3为本专利技术实施例中卷积层架构示意图;图4为本专利技术实施例中卷积操作示意图;图5为本专利技术实施例中多阶差分网络模型训练和使用流程图图6为本本文档来自技高网
...
基于层次化深度网络的长时序列数据处理方法

【技术保护点】
一种基于层次化深度网络的长时序列数据处理方法,其特征在于,所述方法包括:S1,获取长时序列数据,并将所述长时序列数据输入训练好的层次化深度网络模型,所述层次化深度网络模型包括卷积层、递归层以及全连接层;其中,所述卷积层包括多对卷积核和池化核,且各对卷积核和池化核对应的卷积核的长度和池化核的长度的乘积相同;S2,利用所述卷积层中的所述多对卷积核和池化核对所述长时序列数据进行单维卷积操作得到第一压缩时序数据集,并将所述第一压缩时序数据集中的所有压缩时序数据连结形成第一多维时序数据;S3,基于所述第一多维时序数据,利用所述卷积层获取多个多维时序数据,并将所述多个多维时序数据中长度小于第一预设长度的多维时序数据进行组合形成第一数据集;S4,利用所述递归层和所述全连接层对所述第一数据集进行处理,以得到所述长时序列数据的分类结果向量。

【技术特征摘要】
1.一种基于层次化深度网络的长时序列数据处理方法,其特征在于,所述方法包括:S1,获取长时序列数据,并将所述长时序列数据输入训练好的层次化深度网络模型,所述层次化深度网络模型包括卷积层、递归层以及全连接层;其中,所述卷积层包括多对卷积核和池化核,且各对卷积核和池化核对应的卷积核的长度和池化核的长度的乘积相同;S2,利用所述卷积层中的所述多对卷积核和池化核对所述长时序列数据进行单维卷积操作得到第一压缩时序数据集,并将所述第一压缩时序数据集中的所有压缩时序数据连结形成第一多维时序数据;S3,基于所述第一多维时序数据,利用所述卷积层获取多个多维时序数据,并将所述多个多维时序数据中长度小于第一预设长度的多维时序数据进行组合形成第一数据集;S4,利用所述递归层和所述全连接层对所述第一数据集进行处理,以得到所述长时序列数据的分类结果向量。2.根据权利要求1所述方法,其特征在于,步骤S2具体包括:每对卷积核和池化核中的卷积核以对应的卷积步长对所述长时序列数据进行卷积;所述每对卷积核和池化核中的池化核以对应的池化步长对经卷积后的所述长时序列数据进行池化,得到所述每对卷积核和池化核对应的压缩时序数据,并将所述多对卷积核和池化核对应的多个压缩时序数据进行组合形成所述第一压缩时序数据集;将所述第一压缩时序数据集中的所有压缩时序数据在空间上连结形成第一多维时序数据。3.根据权利要求1所述方法,其特征在于,步骤S3具体包括:利用所述卷积层对所述第一多维时序数据进行单维卷积操作,得到第二压缩数据集,并将所述第二压缩数据集中的所有压缩数据进行连结得到第二多维时序数据,重复上述操作直至连结后得到的多维时序数据的长度小于第二预设长度;将所述多个多维时序数据中长度小于第一预设长度的多维时序数据组合形成第一数据集;其中,所述第二预设长度小于所述第一预设长度。4.根据权利要求1所述方法,其特征在于,所述递归层包括多组第一多层递归神经网络和多组第二多层递归神经网络,所述多组第一多层递归神经网络和所述多组第二多层递归神经网络一一对应,所述多组第一多层递归神经网络中多层递归神经网络的数量与所述第一数据集中元素的数量相等。5.根据权利要求4所述方法,其特征在于,所述全连接层包括多组全连接网络,所述多组全连接网络中全连接网络的数量与所述第一数据集中元素的数量相等,每组全连接网络对应于一...

【专利技术属性】
技术研发人员:龙明盛王建民张建晋黄向东
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1