对序列进行处理的装置和方法制造方法及图纸

技术编号:9935540 阅读:64 留言:0更新日期:2014-04-18 07:44
一种对序列进行处理的装置,包括:划分单元,被配置用于以多个不同的子序列长度,分别将所述序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使所述相似度的平均值最大的子序列长度作为所述序列的周期;识别单元,被配置用于在与所述周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对所述异常子序列进行校正以获得新的序列。

【技术实现步骤摘要】
对序列进行处理的装置和方法
本专利技术涉及数据处理领域,具体涉及对序列进行处理的装置和方法。
技术介绍
短期负荷预测(ShortTermLoadForecasting,STLF)的目的在于预测特定时间间隔(如,一天或一星期)内的系统负荷。短期负荷预测用于对系统的操作进行控制和规划。进一步的分析,如负荷流分析,也是基于短期负荷预测的结果。大多数基于短期负荷预测的传统方法一般通过选择不同的预测模型,如线性回归(LinearRegression)模型、指数平滑(ExponentialSmoothing)模型、随机处理(StochasticProcess)模型、自回归-滑动平均(Auto-RegressiveMovingAverage,ARMA)模型、数据挖掘模型、以及人工神经网络(ArtificialNeuralNetworks,ANN)模型。然而,各种模型都可能受到数据中的噪声的影响。但在现存的技术中,很少考虑到识别数据中的噪声并去除噪声或异常,但这对于预测而言是很重要的。因此,需要一种能够识别并去除数据中的噪声或异常的技术。
技术实现思路
在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的一个主要目的在于,提供一种对序列进行处理的装置和方法。根据本专利技术的一个方面,提供了一种对序列进行处理的装置,包括:划分单元,被配置用于以多个不同的子序列长度,分别将序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使相似度的平均值最大的子序列长度作为序列的周期;识别单元,被配置用于在与周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对异常子序列进行校正以获得新的序列。根据本专利技术的另一个方面,提供了一种对序列进行处理的方法,包括:以多个不同的子序列长度,分别将序列划分为多个子序列;针对每一个子序列长度,计算每两个子序列之间的相似度;确定使相似度的平均值最大的子序列长度作为序列的周期;在与周期对应的多个子序列中识别异常子序列;以及对异常子序列进行校正以获得新的序列。另外,本专利技术的实施例还提供了用于实现上述方法的计算机程序。此外,本专利技术的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优点将更加明显。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。图1是示出根据本专利技术的实施例的对序列进行处理的方法100的流程图;图2示出了对电力负荷时间序列进行划分后的连续多个子序列的图;图3是示出根据本专利技术的实施例的对序列进行处理的装置300的结构的框图;图4是示出根据本专利技术的实施例的对序列进行处理的装置300’的结构的框图图5是示出根据本专利技术的实施例的对序列进行处理的装置300”的结构的框图;图6是示出根据本专利技术的实施例的对序列进行处理的装置300’”的结构的框图;以及图7是示出可以用于实施本专利技术的对序列进行处理的方法和装置的计算设备的举例的结构图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。图1是示出根据本专利技术的实施例的对序列进行处理的方法100的流程图。如图1所示,在步骤S102中,可以按照多个不同的子序列长度,分别将序列划分为多个子序列。假设序列的总长度为100,则可以按照各种子序列长度1、2、3、4……分别对序列进行划分,从而分别得到100个子序列、50个子序列、33个子序列、25个子序列……在步骤S104中,可以针对每一个子序列长度,计算每两个子序列之间的相似度。仍假设序列的总长度为100,可以计算划分出的100个子序列中每两个之间的相似度、50个子序列中每两个之间的相似度、33个子序列中每两个之间的相似度、25个子序列中每两个之间的相似度……在步骤S106中,确定使相似度的平均值最大的子序列长度作为序列的周期。仍假设序列的总长度为100,如果用子序列长度4得到的25个子序列中每两个之间的相似度的平均值大于以其他子序列长度划分出的子序列每两个之间的相似度的平均值,则确定4作为序列的周期。也就是说,可以对各种可能的周期长度进行扫描,最可能的周期长度所得到的子序列之间总体来说应是最相似的,据此原理确定序列的周期。假设序列X被表示为s1,s2,…,sn,其中n为大于1的整数,则可以通过下式来确定周期m,m为大于等于1的整数,其中,argmax表示使跟随其后的部分最大,[n/m]表示求n/m的整数部分,Si和Sj分别表示以m为单位划分出的子序列中的任意两个,即,Si可以被表示为s(i-1)*m+1,s(i-1)*m+2,…,si*m,Sj可以被表示为s(j-1)*m+1,s(j-1)*m+2,…,sj*m。尽管在上面的描述中按照两个子序列紧密相邻的方式来划分序列,但实际上,可以按照两个子序列之间部分重叠的方式来划分序列。例如,在分别以不同子序列长度划分序列时使两个子序列之间重叠相同的长度。仍假设序列的总长度为100,并假设子序列之间的重叠部分长度为1,则在步骤S102中,可以按照各种子序列长度2、3、4……分别对序列进行划分,从而分别得到99个子序列、49个子序列、33个子序列……在步骤S104中,可以计算划分出的99个子序列中每两个之间的相似度、49个子序列中每两个之间的相似度、33个子序列中每两个之间的相似度……如果用子序列长度4得到的33个子序列中每两个之间的相似度的平均值大于以其他子序列长度划分出的子序列每两个之间的相似度的平均值,则在步骤S106中确定4作为序列的周期。容易理解到,在按照两个子序列之间部分重叠的方式来划分序列的情况下,将以[n-o/m-o]来替代上述公式(1)中的[n/m],其中o表示重叠部分长度。在步骤S108中,在与步骤S106中确定的周期对应的多个子序列中识别异常子序列。换句话说,在识别异常子序列时,以步骤S106中确定的周期为单位。例如,可以计算与步骤S106中确定的周期对应的多个子序列中两两之间的相似度,然后基于所计算出的相似度来识别异常子序列本文档来自技高网...
对序列进行处理的装置和方法

【技术保护点】
一种对序列进行处理的装置,包括:划分单元,被配置用于以多个不同的子序列长度,分别将所述序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使所述相似度的平均值最大的子序列长度作为所述序列的周期;识别单元,被配置用于在与所述周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对所述异常子序列进行校正以获得新的序列。

【技术特征摘要】
1.一种对序列进行处理的装置,包括:划分单元,被配置用于以多个不同的子序列长度,分别将所述序列划分为多个子序列;相似度计算单元,被配置用于针对每一个子序列长度,计算每两个子序列之间的相似度;周期确定单元,被配置用于确定使所述相似度的平均值最大的子序列长度作为所述序列的周期;识别单元,被配置用于在与所述周期对应的多个子序列中识别异常子序列;以及校正单元,被配置用于对所述异常子序列进行校正以获得新的序列,其中,所述校正单元包括:生成子单元,被配置用于至少基于所述多个子序列中的正常子序列来生成新的子序列;以及替代子单元,被配置用于以所述新的子序列替代所述异常子序列,从而获得所述新的序列,其中,所述替代子单元被配置用于,在存在多个连续的异常子序列的情况下,以小于等于所述连续的异常子序列的数量的新的子序列来替代所述连续的异常子序列。2.根据权利要求1所述的装置,其中,所述识别单元包括:相似度计算子单元,被配置用于计算所述多个子序列中每两个子序列之间的相似度;以及确定子单元,被配置用于确定下述子序列作为所述异常子序列:该子序列与其他子序列的相似度,总体上小于其他子序列中每两个子序列之间的相似度。3.根据权利要求1所述的装置,其中,所述识别单元包括:相似度计算子单元,被配置用于计算待预测子序列所在周期中的已知部分与所述多个子序列中的每个子序列的对应部分的相...

【专利技术属性】
技术研发人员:杨宇航夏迎炬于浩
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1