System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 时序数据转为图数据的方法、时序对间相似性计算方法技术_技高网

时序数据转为图数据的方法、时序对间相似性计算方法技术

技术编号:40250056 阅读:8 留言:0更新日期:2024-02-02 22:44
本发明专利技术公开了一种时序数据转为图数据的方法、时序对间相似性计算方法,以解决现有的方法对序列状态的设置过于细致或粗糙,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确的技术问题。具体采用Logistic运算对序列进行非线性变换,再对变换后的序列采用序列值分类的方法确定序列状态,可对时间序列设置更为准确的状态,使转化后的图结构数据能更为准确地反映时序数据的特征,进而计算获得更准确的时间序列对相似性分数。

【技术实现步骤摘要】

本专利技术涉及时间序列数据转化为图结构数据的方法,具体涉及一种时序数据转为图数据的方法、时序对间相似性计算方法


技术介绍

1、随着物联网、大数据等新一代信息技术逐渐在各领域中越来越广泛的应用,人们从社会生产生活过程中采集到的数据越来越多。时序数据是其中的一种重要形式。时序数据通常是一个过程的观察结果,其值是从均匀时间间隔或给定采样频率下测量收集的,常用表示,其中n是观测的样本个数,m、n分别为观测值个数以及观测变量个数。当n=1时,称为单变量时间序列;当n≥2时,称为多变量时间序列。

2、时序数据分析中经常需要计算时间序列数据对之间的相似性。一种可行的方法是将时序数据先转化为图结构数据,再通过计算图之间的相似性分数来度量相应时间序列之间的相似性。现有的将时序数据转化为图结构数据的方法通过直接采用序列值、聚类序列值、聚类或分类子序列某些特征值(子序列可重叠)等方法来确定序列的状态(即图中的节点),对序列状态的设置过于细致或粗糙,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确。


技术实现思路

1、本专利技术的目的是提供一种时序数据转为图数据的方法、时序对间相似性计算方法,以解决现有的方法对序列状态的设置过于细致或粗糙,导致转化后的图结构数据未能准确反映时序数据的特征,进一步导致对其相似度的计算不够准确的技术问题。

2、为了达到上述目的,本专利技术提供了一种基于logistic运算的时间序列数据转化为图结构数据的方法,其特殊之处在于,包括以下步骤:

3、步骤1、对单变量时间序列x=[x1,x2,…,xm]t施行min-max标准化运算,将其取值范围调整至区间[-a,a],a是大于0的实数,记结果为x’,即:

4、

5、其中,x(k)=xk表示单变量时间序列x中第k个取值,1≤k≤m,且k为整数,m表示序列x的长度;xmax和xmin分别是序列x的最大值和最小值;

6、步骤2、对x’的每项值施行logistic运算:

7、

8、将其取值范围调整至区间[b,c],记结果为x”,其中0<b<c<1,b=1/(1+ea),c=1/(1+e-a);

9、步骤3、对x”中的每项值乘以尺度系数δ,δ为不小于1.0的实数,记得到的时间序列为x”’,则:

10、x”’(k)=x”(k)×δ;

11、步骤4、以x”’的最小值x”’min为基础,以步长s为单位,建立时间序列数据x”’的状态区间,s为大于0的实数,即以下列r+1个点构成等距离的r个区间:

12、

13、其中br≥x”’max,x”’max是x”’的最大值;第一个状态区间的取值范围为[b0,b1],其余状态区间的取值范围为(br-1,br],r=2,3,..,r;

14、步骤5、依次将x”’的每项值按其所落入的状态区间转化为状态符号,将x”’转化为状态符号序列s,则:

15、

16、步骤6、以s中的每种状态符号为一个节点,以状态符号序列中前后相邻两个状态的转换为有向边,将状态符号序列转化为有向图g:

17、g=(n,e,a,w);

18、其中,n为图的节点集合,即状态符号节点的集合;e={eij}为状态转移边集合,eij存在的条件为i∈n,j∈n;a={ai}为节点的属性集合,表示状态符号节点i在s中出现的相对频率,其中|·|表示集合的基数,len(·)表示序列的长度;w={wij}为边的权重,表示从状态节点i转移到状态节点j的相对频率。

19、本专利技术还提供了一种计算时间序列对之间相似性的方法,采用上述的基于logistic运算的时间序列数据转化为图结构数据的方法,其特殊之处在于,包括以下步骤:

20、步骤1、将待计算相似度的所有单变量时间序列xix顺序连接,构成一个单变量时间序列x,上标ix表示时间序列的编号;对x施以施行min-max标准化运算,得到时间序列x’;

21、步骤2、对时间序列x’施行logistic运算,得到时间序列x”;

22、步骤3、对序列x”中的每项取值乘以尺度系数δ,得到时序数据为x”’

23、步骤4、以x”’的最小值为基础,以步长s为单位,建立x”’的状态区间;

24、步骤5、依次将x”’的每项取值转化为状态区间中的对应状态,将x”’转化为状态符号序列s;从s中获得每个时间序列xix的状态符号序列six;

25、步骤6、以six中的每种状态符号为一个节点,以状态序列中前后相邻两个状态的转移为有向边,将状态符号序列six转化为有向图gix;

26、步骤7、对任意两个时间序列xix,依据其对应的有向图gix计算二者之间的相似性分数。

27、进一步地,步骤7具体为:

28、对任意两个时间序列xix分别计算各个有向图gix的下列属性:

29、(1)状态符号节点出现概率分布的复杂度其中上标ix表示时间序列的编号;下标state是表示该概率分布是状态符号节点出现概率分布标签;

30、(2)状态转移停留在各节点的概率分布的复杂度其中下标staying为该概率分布是状态转移停留在各节点的概率分布标签;

31、(3)状态转移出各节点的概率分布的复杂度其中下标out为该概率分布是状态转移出各节点的概率分布标签;

32、(4)状态转移入各节点的概率分布的复杂度其中下标in为该概率分布是状态转移入各节点的概率分布标签;

33、将各个有向图gix的上述复杂度属性依序组成向量

34、作为各自的特征向量计算两个有向图gix特征向量之间的欧式距离并取负值,作为相应两个时间序列xix之间的相似性分数。

35、进一步地,步骤7中:

36、所述状态符号节点出现概率分布根据每种状态在状态序列six中出现的频次计算;

37、所述状态转移停留在各节点的概率分布根据在状态序列six中每个节点转移到自己的频次计算;

38、所述状态转移出各节点的概率分布根据在状态序列six中每个节点转移到其他节点的频次计算;

39、所述状态转移入各节点的概率分布根据在状态序列six中每个节点从其他节点转移而来的频次计算。

40、进一步地,步骤7中:

41、所述状态符号节点出现概率分布由下式计算:

42、

43、所述状态转移停留在各节点的概率分布由下式计算:

44、

45、所述状态转移出各节点的概率分布由下式计算:

46、

47、所述状态转移入各节点的概率分布由下式计算:

48、

49、其中,n为有向图的节点集合,w为边的权重,y、z是公式中的变量,表示n中的一个节点。

50、进本文档来自技高网...

【技术保护点】

1.一种基于Logistic运算的时间序列数据转化为图结构数据的方法,其特征在于,包括以下步骤:

2.一种计算时间序列对之间相似性的方法,采用权利要求1所述的基于Logistic运算的时间序列数据转化为图结构数据的方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的计算时间序列对之间相似性的方法,其特征在于,步骤7具体为:

4.根据权利要求3所述的计算时间序列对之间相似性的方法,其特征在于,步骤7中:

5.根据权利要求4所述的计算时间序列对之间相似性的方法,其特征在于,步骤7中:

6.根据权利要求5所述的计算时间序列对之间相似性的方法,其特征在于,步骤7中:

【技术特征摘要】

1.一种基于logistic运算的时间序列数据转化为图结构数据的方法,其特征在于,包括以下步骤:

2.一种计算时间序列对之间相似性的方法,采用权利要求1所述的基于logistic运算的时间序列数据转化为图结构数据的方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的计算时间序列对之间相...

【专利技术属性】
技术研发人员:孙韩林高聪陈彦萍王忠民马素刚吕宁
申请(专利权)人:西安邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1