System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于时间序列的长度归一化方法技术_技高网

一种基于时间序列的长度归一化方法技术

技术编号:42017006 阅读:27 留言:0更新日期:2024-07-16 23:10
本发明专利技术属于数据处理技术领域,提供了一种基于时间序列的长度归一化方法,首先获取实验平台采集的数据样本,接着根据每次水流的总质量,将数据集划分为不同类别,然后采用滑动窗口滤波技术对数据集进行预处理,然后再通过绘制窗口大小与dist结果的曲线图,选取第一个局部最小值点作为滑动窗口的最优大小,然后再采用WRP方法对数据进行长度归一化;本发明专利技术通过将滑动窗口滤波与WRP时间序列长度归一化算法结合处理数据,数据经过归一化处理后,其总体变化趋势并未发生显著改变,且仍然保持着原始数据的特征,同时滑动窗口算法可以消除潜在的噪声或不规则波动,进而更准确地分析数据的走向和特性,为后续模型建模提供了更为一致且稳定的输入基础。

【技术实现步骤摘要】

本专利技术属于数据处理,具体地说是一种基于时间序列的长度归一化方法


技术介绍

1、随着镁合金铸件的广泛应用,其铸造过程面临一个挑战:当镁合金溶液注入模具时,其流量往往不能精确控制在所需的范围内。这不仅降低了铸件的合格率,还可能由于空气压缩问题导致模具损坏。因此,对于注入模具的镁合金溶液进行实时测量变得极为重要。但是,由于镁合金在高温下易氧化,以及测量环境的恶劣性,传统的流量计或阀类开关等直接测量技术无法满足实时测量的要求。针对这一实际问题,有一个方法是基于cnn与lstm的神经网络模型,建立冲击力与流量之间的关系模型。但是针对这种神经网络学习的方法,有一个可靠、准确、便于分析的数据集以及等长的时间序列数据作为合适的特征非常关键。这就涉及到训练神经网络前的数据预处理规范化问题;

2、模拟此工况的基于冲击力的流量测量实验平台由以下组成:由plc、电子秤、高精度压力传感器、水槽、上位机以及可调频水泵组成,通过上位机控制plc调节泵的频率,使用工业压力传感器采集出水口处水流冲击斜面的力,使用电子秤对流入水槽中的水进行称量,将称量的值做相对应的分类标签。

3、神经网络数据规范化的主要方法包含:批归一化(batch normalization)、层归一化(layer normalization)、组归一化(group normalization)、实例归一化(instancenormalization)、权重归一化(weight normalization);

4、批归一化和层归一化都是基于统计特性的归一方法,但批归一化侧重于整个批量的特性,而层归一化关注单个样本内的层;实例归一化特别适用于图像处理领域;组归一化是批归一化和实例归一化的一种折中方法,适用于小批量数据。权重归一化着重优化权重本身,而非规范输出。

5、通过本项目的实验平台分别采集泵在不同转速和时间的条件下,水流冲击管道斜面的冲击力序列,同时记录下流出溶液的总质量;但由于每个类别泵的采样时间不同,从而冲击力序列长度的长短不同,当通过实验平台采集数据样本之后,可能会出现带有噪声或不规则波动的数据出现,与此同时还会出现分类后的数据集有数据突变点的情况和每行数据长度长短不一。结合当下的技术作为参考,即五种数据预处理规范化包括:批归一化、层归一化、组归一化、实例归一化、权重归一化。这五种归一化算法都不具备解决以上两个问题的能力。

6、为此,本领域技术人员提出了一种基于时间序列的长度归一化方法来解决
技术介绍
提出的问题。


技术实现思路

1、为了解决上述技术问题,本专利技术提供一种基于时间序列的长度归一化方法,以解决现有技术中当通过实验平台采集数据样本之后,可能会出现带有噪声或不规则波动的数据出现,与此同时还会出现分类后的数据集有数据突变点的情况和每行数据长度长短不一。结合当下的技术作为参考,即五种数据预处理规范化包括:批归一化、层归一化、组归一化、实例归一化、权重归一化。这五种归一化算法都不具备解决以上两个问题的能力的问题。

2、一种基于时间序列的长度归一化方法,包括以下步骤:

3、s1、获取实验样本数据集;以溶液的总质量作为分类等级标准,根据实际划分若干个类别;

4、s2、数据集的分类标签依据每次水流的总质量,若干个类别需要具体归类划分,再做成表格形式统计记录;目的是清晰直观的看到不同类别的样本数量,为之后的数据处理做准备;

5、s3、为了更精细地处理这些收集到的冲击力数据,采用了滑动窗口滤波技术,这项技术帮助平滑冲击力数据,消除潜在的噪声或不规则波动,进而更准确地分析数据的走向和特性;通过在时间序列上实施滑动窗口,确保了获得的冲击力数据平滑且连贯,为进一步的分析以及实验结果的准确性奠定了坚实的基础;

6、s4、冲击力数据在做滤波处理时窗口大小的最优选择方法为:

7、s41、假设一个时间序列t={t1,t2,t3...tk},用大小为w的窗口进行平均滑动,结果通过如下公式可得;其中i={1,2,3,...,k-w+1};

8、

9、s42、将滑动平均得到的值构成一个新的时间序列,记作y={y1,y2,y3...,yk-w+1},计算y的平均值e(y),基于每一个合适的窗口wi产生滑动平均结果记作yj,均值记作e(yj),定义dist函数:

10、distj=∑(yj-e(yj))#(2)

11、s43、以时间窗口大小为横坐标,以dist结果为纵坐标,绘制曲线图;其中选取第一个局部最小值点为最优窗口大小;

12、s5、数据长度归一化;在滤波和滑动窗口处理的基础上,进一步对处理后的数据进行归一化,以确保在不同实验条件下数据的一致性;

13、为实现时间序列数据的等长处理,采用了基于权重的时间处理方法,即wrp方法;wrp能够解决数据突变点等问题,此方法还能够压缩长时间序列,而且不会改变短时间序列的变化趋势;下面将具体解释wrp长度归一化算法,具体包括:

14、s51、首先定义一个权重函数:

15、

16、s52、设序列长度为ti,将时间序列si(n)压缩为s'i(m),其中n=1、2……ti,m=1、2……m,对于第2至ti-1个数据点,进行如下处理:将n划分为m份,取对应si(n)下的s'i(m)以及s'i(m)的前后两份数据,共三份数据;

17、s53、将压缩的时间序列长度s'i(m)前后三份数据设为qi(m),则三份数据中最大值qi(m)max和最小值qi(m)min表示如下:

18、

19、s54、定义行向量ri(m)其中值为qi(m)min至qi(m)max之间的所有整数;则ri(m)中的每一个值ri满足:

20、

21、s55、将ri(m)进行等比例缩放至权重函数x轴上,即使得r1=-3,rt=3,得到r'i(m);

22、

23、s56、取行向量ri(m)中每两个数据的中值得到横向排列得到si(m);

24、

25、s57、将代入权重函数得到

26、

27、s58、进行归一化处理得到权重矩阵mi(m):

28、

29、s59、将si(n)按ri(m)进行分段得到ki(m),wrp处理后的时间序列;

30、s'i(m)=ki(m)×mi(m)#(11)

31、s6、s'i(m)即为wrp处理之后的冲击力序列。

32、优选的,在s5中,所述wrp数据长度归一化处理包括定义权重函数、压缩时间序列、计算最大值和最小值、等比例缩放、取中值、代入权重函数、归一化处理以及分段处理等步骤。

33、与现有技术相比,本专利技术具有如下有益效果:

34、本专利技术将滑动窗口滤波与wrp时间序列长度归一化算法结合处理数据,数据经过归一化处理后,其总体变本文档来自技高网...

【技术保护点】

1.一种基于时间序列的长度归一化方法,其特征在于:包括以下步骤:

2.如权利要求1所述一种基于时间序列的长度归一化方法,其特征在于:所述步骤S4具体的描述如下:

3.如权利要求1所述一种基于时间序列的长度归一化方法,其特征在于:在步骤S5中,所述采用WRP方法对数据进行长度归一化的操作如下:

【技术特征摘要】

1.一种基于时间序列的长度归一化方法,其特征在于:包括以下步骤:

2.如权利要求1所述一种基于时间序列的长度归一化方法,其特征在于:所述步骤s4具...

【专利技术属性】
技术研发人员:庄雨霖郑茜茹何宇曾冰吉段博方
申请(专利权)人:北京信息科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1