时序数据的增强处理方法、装置和计算机设备制造方法及图纸

技术编号:38820699 阅读:21 留言:0更新日期:2023-09-15 19:59
本申请涉及一种时序数据的增强处理方法、装置、计算机设备、存储介质和计算机程序产品。其中方法通过获取样本数据集,并对样本数据集中时序信号样本进行时序特征提取,得到时序信号样本的第一时序特征序列,根据每个时序信号样本分别对应的第一时序特征序列,确定第一特征子序列的第一转移参数,并根据样本数据集中每个时序信号样本分别对应的多个第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本。由于其在生成增强数据时,考虑了样本数据集中每一个时序信号对应的第一特征子序列的时序关系以及对应的第一转移参数,从而使得生成的增强数据准确性更高。从而使得生成的增强数据准确性更高。从而使得生成的增强数据准确性更高。

【技术实现步骤摘要】
时序数据的增强处理方法、装置和计算机设备


[0001]本申请涉及数据处理
,特别是涉及一种时序数据的增强处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]对于深度学习模型的训练,通常需要用到大量的训练数据。但是在实际项目中,可能会由于环境噪声干扰、介质衰减、部署方式的差异而导致相同事件的数据特征不同,且事件的样本数据可能由于难以复现导致采集数量比较少(很多时候样本数据量不到100),当训练样本量过少时容易导致模型训练出现过拟合的问题。
[0003]而随着数据处理技术的发展,数据增强得到了广泛的应用。例如,可以基于已有的少量样本数据的情况下,通过数据增强的方式而得到大量的训练数据。目前,常见的数据增强方法包括添加噪声、时间平移、频率偏移变换、利用对抗生成网络GAN(Generative Adversarial Networks)生成等。
[0004]然而,目前的数据增强方式均没有考虑不同特征之间的复杂时序关联关系,使得生成的样本分布覆盖面不广或者产生的样本距离真实样本差异较大,从而影响生成样本的准确性。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高生成样本准确性的时序数据的增强处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种时序数据的增强处理方法。所述方法包括:
[0007]获取样本数据集,所述样本数据集中包括具有相同属性的至少一个时序信号样本;
>[0008]对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列,所述第一时序特征序列中包括多个第一特征子序列;
[0009]根据每个所述时序信号样本分别对应的第一时序特征序列,确定所述第一特征子序列的第一转移参数;
[0010]根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本。
[0011]在其中一个实施例中,所述根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本,包括:根据所述时序信号样本的第一时序特征序列的序列长度,确定所述增强时序信号的序列长度;从所述样本数据集的每个所述时序信号样本分别对应的多个所述第一特征子序列中,确定所述增强时序信号的初始特征子序列;基于所述初始特征子序列和所述序列长度,以及所述第一特征子序列的第一转移参数,从多个所述第一特征子序列中依次确定所述增强时序信号的剩余特征子序列;根据所述初始特征子序列和依次确定的剩余特征子序
列,生成所述增强时序信号的时序样本。
[0012]在其中一个实施例中,所述对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列之后,所述方法还包括:识别所述第一特征子序列中特征的个数;当所述特征的个数大于预设的特征个数阈值时,对所述第一特征子序列中的多个特征进行特征抽取,得到抽取的目标特征;根据所述目标特征生成与所述第一特征子序列对应的第二特征子序列;根据所述时序信号样本中多个所述第一特征子序列分别对应的所述第二特征子序列,得到所述时序信号样本的第二时序特征序列;所述根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本,包括:根据所述时序信号样本中多个所述第一特征子序列分别对应的所述第二特征子序列,生成增强时序信号的时序样本。
[0013]在其中一个实施例中,所述根据所述时序信号样本中多个所述第一特征子序列分别对应的所述第二特征子序列,生成增强时序信号的时序样本,包括:确定抽取的第二特征子序列与被抽取的所述第一特征子序列之间的映射关系;确定所述第二特征子序列的第二转移参数;根据所述时序信号样本的第一时序特征序列的序列长度,确定所述增强时序信号的序列长度;从所述样本数据集的每个所述时序信号样本的多个所述第一特征子序列分别对应的第二特征子序列中,确定所述增强时序信号的初始特征子序列;基于所述初始特征子序列和所述序列长度,以及所述第二特征子序列的第二转移参数,从多个所述第一特征子序列分别对应的第二特征子序列中,依次确定所述增强时序信号的剩余特征子序列;根据所述映射关系对所述初始特征子序列和依次确定的剩余特征子序列进行特征映射,生成所述增强时序信号的时序样本。
[0014]在其中一个实施例中,所述获取样本数据集之后,所述方法还包括:对所述样本数据集中的至少一个时序信号样本进行滤波处理,分别得到滤波后的至少一个时序信号样本。
[0015]在其中一个实施例中,所述对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列,包括:对所述时序信号样本进行特征提取,得到所述时序信号样本的信号特征序列;根据预设的时间长度对所述信号特征序列进行分片处理,得到分片后的多个第一特征子序列;根据每个第一特征子序列和对应的分片时序,生成所述时序信号样本的第一时序特征序列。
[0016]在其中一个实施例中,所述对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列,包括:根据预设的时间长度对所述时序信号样本进行分片处理,得到分片后的多个子信号样本;分别对每个所述子信号样本进行特征提取,得到每个所述子信号样本的第一特征子序列;根据每个所述子信号样本的分片时序和对应的第一特征子序列,生成所述时序信号样本的第一时序特征序列。
[0017]在其中一个实施例中,所述时序信号样本包括振动信号样本、声音信号样本中的至少一种。
[0018]第二方面,本申请还提供了一种时序数据的增强处理装置。所述装置包括:
[0019]样本数据获取模块,用于获取样本数据集,所述样本数据集中包括具有相同属性的至少一个时序信号样本;
[0020]特征提取模块,用于对所述时序信号样本进行时序特征提取,得到所述时序信号
样本的第一时序特征序列,所述第一时序特征序列中包括多个第一特征子序列;
[0021]转移参数确定模块,用于根据每个所述时序信号样本分别对应的第一时序特征序列,确定所述第一特征子序列的第一转移参数;
[0022]增强数据生成模块,用于根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及所述时序模型,生成增强时序信号的时序样本。
[0023]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述方法的步骤。
[0024]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面所述方法的步骤。
[0025]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种时序数据的增强处理方法,其特征在于,所述方法包括:获取样本数据集,所述样本数据集中包括具有相同属性的至少一个时序信号样本;对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列,所述第一时序特征序列中包括多个第一特征子序列;根据每个所述时序信号样本分别对应的第一时序特征序列,确定所述第一特征子序列的第一转移参数;根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本,包括:根据所述时序信号样本的第一时序特征序列的序列长度,确定所述增强时序信号的序列长度;从所述样本数据集的每个所述时序信号样本分别对应的多个所述第一特征子序列中,确定所述增强时序信号的初始特征子序列;基于所述初始特征子序列和所述序列长度,以及所述第一特征子序列的第一转移参数,从多个所述第一特征子序列中依次确定所述增强时序信号的剩余特征子序列;根据所述初始特征子序列和依次确定的剩余特征子序列,生成所述增强时序信号的时序样本。3.根据权利要求1所述的方法,其特征在于,所述对所述时序信号样本进行时序特征提取,得到所述时序信号样本的第一时序特征序列之后,所述方法还包括:识别所述第一特征子序列中特征的个数;当所述特征的个数大于预设的特征个数阈值时,对所述第一特征子序列中的特征进行特征抽取,得到抽取的目标特征;根据所述目标特征生成与所述第一特征子序列对应的第二特征子序列;所述根据所述样本数据集中每个所述时序信号样本分别对应的多个所述第一特征子序列以及对应的第一转移参数,生成增强时序信号的时序样本,包括:根据所述时序信号样本中多个所述第一特征子序列分别对应的所述第二特征子序列,生成增强时序信号的时序样本。4.根据权利要求3所述的方法,其特征在于,所述根据所述时序信号样本中多个所述第一特征子序列分别对应的所述第二特征子序列,生成增强时序信号的时序样本,包括:确定抽取的第二特征子序列与被抽取的所述第一特征子序列之间的映射关系;确定所述第二特征子序列的第二转移参数;根据所述时序信号样本的第一时序特征序列的序列长度,确定所述增强时序信号的序列长度;从所述样本数据集的每个所述时序信号样本的多个所述第一特征子序列分别对应的第二特征子序列中,确定所述增强...

【专利技术属性】
技术研发人员:陆志杰金华周杨陈科新姜明武
申请(专利权)人:苏州光格科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1