System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 时序数据转为多层图数据方法、时序对间相似性计算方法技术_技高网

时序数据转为多层图数据方法、时序对间相似性计算方法技术

技术编号:40206965 阅读:8 留言:0更新日期:2024-02-02 22:18
本发明专利技术公开了一种时序数据转为多层图数据方法、时序对间相似性计算方法,以解决现有的方法对序列状态的设置过于细致或粗糙,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确的技术问题。具体采用对数运算对序列进行非线性变换,再对变换后的序列采用序列值分类的方法确定序列状态,可对时间序列设置更为准确的状态,使转化后的图结构数据能更为准确地反映时序数据的特征,进而计算获得更准确的时间序列对相似性分数。

【技术实现步骤摘要】

本专利技术涉及数据转化方法,具体涉及一种时序数据转为多层图数据方法、时序对间相似性计算方法


技术介绍

1、随着物联网、大数据等新一代信息技术逐渐在各领域中越来越广泛的应用,人们从社会生产生活过程中采集到的数据越来越多。时序数据是其中的一种重要形式。时序数据通常是一个过程的观察结果,其值是从均匀时间间隔或给定采样频率下测量收集的,常用表示,其中n是观测的样本个数,m、n分别为观测值个数以及观测变量个数。当n=1时,称为单变量时间序列;当n≥2时,称为多变量时间序列。

2、时序数据分析中,经常需要计算时间序列数据对之间的相似性。一种可行的方法是将时序数据先转化为图结构数据,再通过计算图之间的相似性分数来度量相应时间序列之间的相似性。现有的将时序数据转化为图结构数据的方法通过直接采用序列值、聚类序列值、聚类或分类子序列某些特征值(子序列可重叠)等方法来确定序列的状态(即图中的节点),对序列状态的设置过于细致或粗糙;此外,现有的将时序数据转化为图结构数据的方法中,对状态的转移只考虑了相邻两个状态的转移特征,而没有考虑状态的多尺度转移特征,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确。


技术实现思路

1、本专利技术的目的是提供一种时序数据转为多层图数据方法、时序对间相似性计算方法,以解决现有的方法对序列状态的设置过于细致或粗糙,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确的技术问题。

2、为了达到上述目的,本专利技术提供了一种时间序列数据转化为多层图结构数据的方法,其特殊之处在于,包括以下步骤:

3、步骤1、对单变量时间序列x=[x1,x2,…,xm]t施以如下标准化运算,标准化后的序列记为x’:

4、

5、其中,x(k)=xk表示单变量时间序列x的第k个取值,1≤k≤m,且k为整数,m表示单变量时间序列x的长度,δp=10i为正值的缩放因子,i是使xmin_pos缩放后小于10而大于0的整数,xmin_pos是x中正值的最小值;δn=10j为负值的缩放因子,j是使|xmax_neg|缩放后小于10而大于0的整数,xmax_neg是x中负值的最大值;

6、步骤2、对x’施行以a为底的对数运算,其中a>1,记结果为x”,则:

7、

8、步骤3、以x”(k)的最小值x”min为基础,以步长s为单位,建立x”的状态区间,s是大于0的实数,即以下列r+1个点构成等距离的r个区间:

9、

10、其中,br≥x”max,x”max为x”(k)的最大值,第一个状态区间的取值范围为[b0,b1],其余状态区间的取值范围为(br-1,br],r=2,3,...,r;

11、步骤4、依次将x”的每个值按其所落入的状态区间转化为状态符号,将x”转化为状态符号序列s,则:

12、

13、步骤5、记状态转移尺度集为ts={1,2,…,l};状态转移尺度ts∈ts指在状态符号序列s上进行状态转移时,下一状态与当前状态之间的位置序号间隔距离,则当前状态位置序号为k,若ts=1,则下一状态的位置序号为k+1;若ts=2,则下一状态的位置序号为k+2,以此类推;则以间隔(ts-1)对状态序列进行采样,记采样序列为sts;以s中的每种状态符号为一个节点,以各转移尺度下的状态转移为有向边,将状态符号序列s转化为一个多层有向图mg:

14、mg=(n,ets,ats,wts),ts∈ts;

15、其中n为图的节点集合,即状态符号节点的集合,每层网络的状态符号节点都相同;上标ts表示网络层的编号,第ts层网络根据转移尺度为ts时的状态转移生成;为第ts层网络的状态转移边集合,存在的条件为为第ts层网络的节点的属性集合,表示状态符号节点i在sts中出现的相对频率;其中,|·|表示集合的基数,len(·)表示序列的长度;为边的权重集合,表示第ts层网络中从状态i转移到状态j的相对频率。

16、本专利技术还提供了一种计算时间序列对之间相似性的方法,基于上述的时间序列数据转化为多层图结构数据的方法,其特殊之处在于,包括以下步骤:

17、步骤1、将待计算相似度的所有单变量时间序列xix顺序连接,构成一个时间序列x,上标ix表示时间序列的编号;对时间序列x施以标准化运算,得到时间序列x’;

18、步骤2、对时间序列x’施行以a为底数的指数运算,得到时间序列x”;

19、步骤3、以x”的最小值为基础,以步长s为单位,建立x”的状态区间;

20、步骤4、依次将x”的每项取值转化为状态区间中的对应状态,将x”转化为状态符号序列s;从序列s中得到单变量时间序列xix相对应的状态符号序列six;

21、步骤5、给定状态转移尺度集,分别为每个状态符号序列six构建一个多层有向网络mgix;对任意两个时间序列xix,依据其对应的有向图mgix计算他们之间的相似性分数。

22、进一步地,步骤5具体为:

23、给定状态转移尺度集ts={1,2,…,l},分别为每个状态符号序列six构建一个多层有向网络mgix;对mgix的每层有向网络计算其下列属性:

24、状态符号节点出现概率分布的复杂度其中上标ix表示时间序列的编号,上标ts表示该时间序列转化为多层网络后的网络层编号;下标state是表示该概率分布是状态符号节点出现概率分布标签;

25、状态转移停留在各节点的概率分布的复杂度其中下标staying为该概率分布是状态转移停留在各节点的概率分布标签;

26、状态转移出各节点的概率分布的复杂度其中下标out为该概率分布是状态转移出各节点的概率分布标签;

27、状态转移入各节点的概率分布的复杂度其中下标in为该概率分布是状态转移入各节点的概率分布标签;

28、将各层有向网络的上述属性向量依次按序拼接,得到mgix的特征向量

29、

30、计算对应两个特征向量之间的欧式距离并取负值,作为对应两时间序列xix之间的相似性分数。

31、进一步地,步骤5中:

32、所述状态符号节点出现概率分布根据每种状态在状态序列six,ts中出现的频次计算;six,ts是序列xix在转移尺度为ts时的状态转移序列;

33、所述状态转移停留在各节点的概率分布根据在状态序列six,ts中每个节点转移到自己的频次计算;

34、所述状态转移出各节点的概率分布根据在状态序列six,ts中每个节点转移到其他节点的频次计算;

35、所述状态转移入各节点的概率分布根据在状态序列six,ts中每个节点从其他节点转移而来的频次计算。

36、进一步地,步骤5中:

37、所述状态符号节点出现概率分布通过下式计算:

38、<本文档来自技高网...

【技术保护点】

1.一种时间序列数据转化为多层图结构数据的方法,其特征在于,包括以下步骤:

2.一种计算时间序列对之间相似性的方法,基于权利要求1所述的时间序列数据转化为多层图结构数据的方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的计算时间序列对之间相似性的方法,其特征在于,步骤5具体为:

4.根据权利要求3所述的计算时间序列对之间相似性的方法,其特征在于,步骤5中:

5.根据权利要求4所述的计算时间序列对之间相似性的方法,其特征在于,步骤5中:

6.根据权利要求5所述的计算时间序列对之间相似性的方法,其特征在于:步骤5中,各个所述概率分布的复杂度计算方式如下:

【技术特征摘要】

1.一种时间序列数据转化为多层图结构数据的方法,其特征在于,包括以下步骤:

2.一种计算时间序列对之间相似性的方法,基于权利要求1所述的时间序列数据转化为多层图结构数据的方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的计算时间序列对之间相似性的方法,其特征在于,步骤5具体为:<...

【专利技术属性】
技术研发人员:孙韩林高聪陈彦萍王忠民马素刚吕宁
申请(专利权)人:西安邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1