周期性时间序列数据处理方法技术

技术编号:21453901 阅读:40 留言:0更新日期:2019-06-26 04:46
本发明专利技术涉及数据处理技术领域。本发明专利技术公开了一种周期性时间序列数据处理方法,以解决现有技术数据序列趋势转折点判断不准确的问题。本发明专利技术的周期性时间序列数据处理方法,包括步骤:a、将时间段K内的数据按自然周进行分组,分别提取各组中对应时间的数据,组成7个数据序列S(1)、S(2)……S(7);b、对7个数据序列中的对应位置的数据求和,得到第8数据序列S(8);c、求取数据序列S(1)、S(2)……S(8)的趋势转折点;其中:K≥7n,n为正整数。本发明专利技术的有益效果是,能够排除数据周期性变化对转折点识别的影响,提高转折点识别的准确性,真正反应数据的变化波动趋势,为决策提供更科学的依据。本发明专利技术简化了数据处理过程,提高了数据处理效率。

【技术实现步骤摘要】
周期性时间序列数据处理方法
本专利技术涉及数据处理
,特别涉及具有周期性特征的时间序列数据处理方法,具体而言,涉及数据序列周期性数据趋势转折点的识别方法。
技术介绍
我们在进行预测时,需要分析时间序列的形状特征,是上升?下降?还是平稳?这需要选取人们视觉中最关注的点,也就是时间序列数据转折点,转折点的共同特征就是两侧的变化趋势有明显不同。时间序列数据蕴含趋势信息,可以根据数据的趋势信息提取趋势转折点,达到压缩数据、减少噪声影响的目的。通过分析时间序列数据可以对事件的变化趋势进行预测和判断,为各种决策提供依据。常规的转折点识别方法都没考虑一周内的周期性波动。在一个典型的应用场景中,旅客的出行数据就具有明显的以自然周为周期的特征,旅客出行数据以7天为一个循环周期。由于7天内周期性波动的存在,把数据直接进行处理寻求转折点,无法把转折点准确地定位到某一天。实践中,大量的交通旅客出行数据呈周期性特征,比如铁路交通数据,周一、周二、……、周日有明显的周期性。京沪高铁北京-上海区段周五、周日客流明显高于其他日期。以全年为目标,7月~8月为暑运高峰期,6月有明显的上升趋势。这种数据序列一周之内有周期性变化,全年范围内还有上升或下降的趋势。由于以周为单位的数据周期性波动,按照普通转折点识别方法不方便找出全年范围的客运趋势转折点日期。如何方便准确地找到全年范围内数据上升或下降的转折点日期,为客运车次编组通过决策依据,是一个需要解决问题。
技术实现思路
本专利技术的主要目的在于提供周期性时间序列数据处理方法,以解决现有技术数据序列趋势转折点判断不准确的问题。为了实现上述目的,根据本专利技术具体实施方式的一个方面,提供了一种周期性时间序列数据处理方法,其特征在于,包括步骤:a、将时间段K内的数据按自然周进行分组,分别提取各组中对应时间的数据,组成7个数据序列S(1)、S(2)……S(7);b、对7个数据序列中的对应位置的数据求和,得到第8数据序列S(8);c、求取数据序列S(1)、S(2)……S(8)的趋势转折点;其中:K≥7n,n为正整数。进一步的,还包括步骤:d、以数据序列S(m+1)的趋势转折点数量作为时间段K的趋势转折点数量。进一步的,步骤c具体为:采用数学方法求取数据序列S(1)、S(2)……S(8)的趋势转折点。进一步的,所述数学方法具体为:将数据序列排列起来,用直线连接各个数据点,根据某数据点与左右两侧相邻数据点之间连线的斜率差来进行判断,斜率差大于设定阀值时,即将该数据列为转折点。或将数据序列排列起来,用直线连接首尾数据点,计算中间所有数据点与直线之间的竖向垂直距离,选取距离最大的点为转折点。随后这个转折点作为新的端点,端点与原有首尾点形成两个数据序列,同样的方法寻求新的转折点。依次循环下去直到所有点到直线的距离达到设定值,或者直到转折点数量达到设定值。进一步的,所述K的单位为年;n=52。进一步的,还包括步骤:e、把1年的趋势转折点定位于S(8)的转折点周,把该周7天和上周后3天形成连续10天的日期集Date(10),然后查看前面S(1)~S(7)的转折点日期,提取落在Date(10)集合中的转折点日期形成新的集合,在该新的集合中选取最小的日期值,进而把转折点周的转折点日期定位到这一天,该转折点日期也成为全年趋势转折点。进一步的,把最后一个转折点周的转折点日期定位到最后一天。本专利技术的有益效果是,能够排除数据周期性变化对转折点识别的影响,提高转折点识别的准确性,真正反应数据的变化波动趋势,为决策提供更科学的依据。本专利技术简化了数据处理过程,提高了数据处理效率。下面结合附图和具体实施方式对本专利技术做进一步的说明。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的具体实施方式、示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为某车站旅客发送量示意图;图2为实施例的数据拟合示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的具体实施方式、实施例以及其中的特征可以相互组合。现将参考附图并结合以下内容详细说明本专利技术。为了使本领域技术人员更好的理解本专利技术方案,下面将结合本专利技术具体实施方式、实施例中的附图,对本专利技术具体实施方式、实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的具体实施方式、实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施方式、实施例,都应当属于本专利技术保护的范围。本专利技术中,数据序列趋势转折点是一种反应数据变化趋势的特征数据,该数据点前后的数据变化趋势明显不同。本专利技术处理的时间序列数据具有一周7天内小周期循环、全年趋势复杂性的特性,因此,对时间序列数据进行降维尤其重要,即在保留时间序列数据大致形状的条件下,尽量减少其中点的个数。降维处理:时间序列有以自然周为单位的周期性特征,为了消除该周期性对转折点分析的干扰,把每周数据进行降维处理。据此,本专利技术引入8个时间序列。首先,把星期一到星期天的数据分组提取出来,形成了7组时间序列,需要注意的是,一年365天共52周多一天,这里讨论时把多余的一天省掉了。如下:所有星期一组成的时间序列S(1),52个数据;所有星期二组成的时间序列S(2),52个数据;所有星期三组成的时间序列S(3),52个数据;所有星期四组成的时间序列S(4),52个数据;所有星期五组成的时间序列S(5),52个数据;所有星期六组成的时间序列S(6),52个数据;所有星期天组成的时间序列S(7),52个数据。这7个序列消除了以周为单位的小周期循环特征,大体上能反应全年的数据变化趋势,但某些日期的数据有可能出现奇异值,会使得这7个序列的趋势形状不一致。其次,本专利技术对每周数据求和形成周数据序列,作为第8个时间序列S(8),这样一年的数据从365天变为52周,这样消除了每7天周期性波动的影响,还让一周内的各个日期数据的正负误差互相抵消,减小了数据奇异值的影响。这52个周数据形成的时间序列可以展现全年数据的趋势。可以通过这个时间序列选定全年数据的转折点周。对上面8个时间序列据进行转折点分析与提取,也就是把52个数据进行分段处理,每个时段内的时间序列数据可近似用直线段进行模拟。将时间序列数据表示相邻的线段簇,用若干条首尾相邻的直线段来近似代替原有时间序列,间隔并不一定相等。常规的方法有距离最大法(垂直距离、正交距离),基于斜率提取边缘点的时间序列分段线性方法等。我们把S(8)的趋势转折点作为全年趋势转折点周,但还需要把全年的趋势转折点定位到某一个具体日期,整个过程步骤如下:1、针对具有以周循环特征的铁路旅客需求数据,对一年中周一到周日的数据进行分组提取,分解为七个子序列S(1)、S(2)……S(7),序列中数据个数为52。2、对一周7天数据求和,形成52周数据序列S(8),该序列消除了以周为单位的小周期循环特征,还消除了未知因素干扰对单个日期数据产生的影响。该序列为第八个序列。3、对新生成的八个时间序列分别进行转折点提取。由于现实中存在很多干扰因素,步骤1本文档来自技高网...

【技术保护点】
1.周期性时间序列数据处理方法,其特征在于,包括步骤:a、将时间段K内的数据按自然周进行分组,分别提取各组中对应时间的数据,组成7个数据序列S(1)、S(2)……S(7);b、对7个数据序列中的对应位置的数据求和,得到第8数据序列S(8);c、求取数据序列S(1)、S(2)……S(8)的趋势转折点;其中:K≥7n,n为正整数。

【技术特征摘要】
1.周期性时间序列数据处理方法,其特征在于,包括步骤:a、将时间段K内的数据按自然周进行分组,分别提取各组中对应时间的数据,组成7个数据序列S(1)、S(2)……S(7);b、对7个数据序列中的对应位置的数据求和,得到第8数据序列S(8);c、求取数据序列S(1)、S(2)……S(8)的趋势转折点;其中:K≥7n,n为正整数。2.根据权利要求1所述的周期性时间序列数据处理方法,其特征在于,还包括步骤:d、以数据序列S(8)的趋势转折点数量作为时间段K的趋势转折点数量。3.根据权利要求1所述的周期性时间序列数据处理方法,其特征在于,步骤c具体为:采用数学方法求取数据序列S(1)、S(2)……S(8)的趋势转折点。4.根据权利要求3所述的周期性时间序列数据处理方法,其特征在于,所述数学方法具体为:将数据序列排列起来,用直线连接各个数据点,根据某数据点与左右两侧相邻数据点之间连线的斜率差来进行判断,斜率差大于设定阀值时,即将该数据列为转折点;或将数据序列排列起来...

【专利技术属性】
技术研发人员:文曙东
申请(专利权)人:四川眷诚天佑科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1