时间序列数据处理方法、装置、可读介质及电子设备制造方法及图纸

技术编号:31167066 阅读:28 留言:0更新日期:2021-12-04 12:23
本发明专利技术公开了一种时间序列数据处理方法、装置、可读介质及电子设备,所述方法包括:获取第一时间序列数据和第二时间序列数据,其中,所述第一时间序列数据包括预设标签信息,所述第二时间序列数据为无标签的时间序列数据;对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据;基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型。综上,本发明专利技术将有标签信息的时间序列数据,为无标签信息的时间序列数据添加伪标签信息,进而将两者时间序列数据作为模型训练的样本数据,使时序数据集多样化,使得训练的时序分类模型具有更强的泛化能力,提高时序分类模型的鲁棒性与分类准确性。类准确性。类准确性。

【技术实现步骤摘要】
时间序列数据处理方法、装置、可读介质及电子设备


[0001]本专利技术涉及计算机
,尤其涉及一种时间序列数据处理方法、装置、可读介质及电子设备。

技术介绍

[0002]深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,其可以学习样本数据的内在规律和表示层次,从而挖掘数据相关问题,再解决数据相关问题。例如,深度学习可以有效改善时间序列的问题,比如时间序列分类、时间序列预测、时间序列异常检测。但是,利用深度学习解决前述问题时候,需要足够的数据样本,且对数据样本的质量也有一定的要求,如果数据样本不足,和/或者数据噪声较多,深度学习得到的相关模型将会不稳定,再者,由传感器采集大量的原始数据,多为无标签样本,该部分数据价值很难得到充分利用,此外,无标签样本可能分布与有标签样本不同,如果直接采用伪标签样本的方式,可能导致无法适合于相关应用场景。综上,相关技术中,如何获得足够、有效的数据样本是深度学习领域的难题之一,如果没有足够、有效的数据样本,训练除的模型泛化能力很难得到提升。...

【技术保护点】

【技术特征摘要】
1.一种时间序列数据处理方法,其特征在于,所述方法包括:获取第一时间序列数据和第二时间序列数据,其中,所述第一时间序列数据包括预设标签信息,所述第二时间序列数据为无标签的时间序列数据;对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据;基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述第一时间序列数据训练得到标签模型,所述标签模型用于对无标签时间序列数据添加伪标签信息;所述对所述第二时间序列数据添加伪标签信息,以得到包括伪标签信息的第三时间序列数据,包括:将所述第二时间序列数据输入所述标签模型,以得到包括伪标签信息的第三时间序列数据。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一时间序列数据和所述第三时间序列数据进行模型训练,以得到时间序列分类模型,包括:将所述第一时间序列数据和所述第三时间序列数据的所有数据进行随机排序,以得到第四时间序列数据;基于所述随机排序的第四时间序列数据进行模型训练,得到时间序列分类模型。4.根据权利要求3所述的方法,其特征在于,所述将所述第一时间序列数据和所述第三时间序列数据的所有数据进行随机排序,以得到第四时间序列数据,包括:将所述第一时间序列数据和所述第三时间序列数据的所有数据输入随机排序函数,以得到随机排序的所述第四时间序列数据。5.根据权利要求3所述的方法,其特征在于,所述基于所述随机排序的第四时间序列数据进行模型训练,得到时间序列分类模型,包括:对所述随机排序的第四时间序列数据的数据元素和标签元素进行加权处理,得到第五时间序列数据;基于所述第五时间序列数据进行模型训练...

【专利技术属性】
技术研发人员:任磊莫廷钰成学军
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1