用于多维时序数据分析的系统和方法技术方案

技术编号:13385835 阅读:161 留言:0更新日期:2016-07-22 00:15
提供了一种用于从多维时序数据中发现多维事件的系统,包括一维事件发现单元和多维事件发现单元。一维事件发现单元将多维时序数据分成多个单独的一维时序数据,并从每个单独的一维时序数据中发现一维事件。多维事件发现单元包括:共现矩阵计算单元,被配置为计算表示所有一维事件相互之间同时出现的频率的共现矩阵;时间顺序矩阵计算单元,被配置为计算表示所有一维事件相互之间的时间顺序矩阵;以及共现事件发现单元,被配置为根据共现矩阵和时间顺序矩阵发现多维事件。还提供了一种用于从多维时序数据中发现多维事件的方法。采用本发明专利技术,即使在事件之间存在时间差的情况下,也能准确地发现多维事件。

【技术实现步骤摘要】
用于多维时序数据分析的系统和方法
本申请涉及数据分析领域,具体涉及一种用于在多维时序数据中发现多维事件的系统和方法。
技术介绍
多维时序数据分析是指从按时间变化的序列值或事件组成的时序数据库中找出有用知识的方法或过程。目前,时序数据库使用很多,范围也很广,例如穿戴设备采集的温度、心率以及皮肤湿度,大气污染指标CO、NO2、SO2以及PM2.5等都属于多维时序数据范畴,通过对多维时序数据的挖掘,能够分析身体健康情况、空气质量情况等一系列具有特殊意义的应用,对某些事件发生的规律提供更好的理解。在多维时序数据线段图中,不同维度之间往往存在比较类似的同时发生的子序列段(事件或模态)。现有的多维事件发现方法主要分为精确查找和降维查找两种。精确查找虽然能够找到多维时序数据中所有的事件,但该方法没有考虑不同维度的事件之间可能存在的相关性。另一方面,降维查找方法不能够保证寻找到多维时序数据中的所有同时发生的事件。因而,存在对满足在大规模多维时序数据环境下精确发现事件的技术的需求。
技术实现思路
本专利技术提出了一种在多维时序数据中发现多维事件的技术,能够在有效的海量多维时序数据集中有效地发现多维事件。本专利技术主要涉及以下方面:一维时序数据的事件计算;相关信息(共现矩阵、时间顺序矩阵、重叠率矩阵)的计算;以及有序多维事件的发现。具体的,通过设置阈值从共现矩阵中找到多组多维事件,每组由一个主事件和多个辅事件组成。通过时间顺序矩阵判断主事件和辅事件的相互关系,将多维事件进行分类。备选的,还可以根据重叠率矩阵判断不同类别中的辅事件对主事件的重要性,从而得到有序的多维事件。根据本专利技术的第一方面,提供了一种用于从多维时序数据中发现多维事件的系统,包括:一维事件发现单元,被配置为将多维时序数据分成多个单独的一维时序数据,并从每个单独的一维时序数据中发现一维事件;以及多维事件发现单元。多维事件发现单元包括:共现矩阵计算单元,被配置为计算表示所有一维事件相互之间同时出现的频率的共现矩阵;时间顺序矩阵计算单元,被配置为计算表示所有一维事件相互之间的时间顺序的时间顺序矩阵;以及共现事件发现单元,被配置为根据共现矩阵和时间顺序矩阵发现多维事件。在一个实施例中,共现矩阵计算单元被配置为:针对一维主事件a和一维辅事件b,通过计算事件a和b同时出现的次数并将该次数除以主事件a出现的次数,得到一维主事件a和一维辅事件b相互之间同时出现的频率。在一个实施例中,时间顺序矩阵计算单元被配置为:针对一维事件i和一维事件j,判断事件i的所有子模式是否均超前于事件j的相应子模式而出现,或者事件i的所有子模式是否均滞后于事件j的相应子模式而出现,或者事件i的所有子模式与事件j的相应子模式之间没有固定的先后顺序。在一个实施例中,共现事件发现单元被配置为:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;以及根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件。在一个实施例中,多维事件发现单元还包括重叠率矩阵计算单元,重叠率矩阵计算单元被配置为计算表示所有多维事件相互之间的重叠率的重叠率矩阵。共现事件发现单元被配置为:根据共现矩阵、时间顺序矩阵和重叠率矩阵发现多维事件。在一个实施例中,重叠率矩阵计算单元被配置为:针对一维主事件a和一维辅事件b,通过计算事件a和b在时间上的重叠长度并将该重叠长度除以主事件a的长度,得到一维主事件a和一维辅事件b相互之间的重叠率。在一个实施例中,共现事件发现单元被配置为:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件;以及根据重叠率矩阵,对多维事件进行排序。在一个实施例中,共现事件发现单元被配置为:将个数多的一维事件排在前面;如果两个一维事件的个数相同,则将最早出现事件的一维事件排在另一个一维事件的前面。根据本专利技术的第二方面,提供了一种用于从多维时序数据中发现多维事件的方法,包括:将多维时序数据分成多个单独的一维时序数据,并从每个单独的一维时序数据中发现一维事件;计算表示所有一维事件相互之间同时出现的频率的共现矩阵;计算表示所有一维事件相互之间的时间顺序的时间顺序矩阵;以及根据共现矩阵和时间顺序矩阵发现多维事件。在一个实施例中,计算表示所有一维事件相互之间同时出现的频率的共现矩阵包括:针对一维主事件a和一维辅事件b,通过计算事件a和b同时出现的次数并将该次数除以主事件a出现的次数,得到一维主事件a和一维辅事件b相互之间同时出现的频率。在一个实施例中,计算表示所有一维事件相互之间的时间顺序的时间顺序矩阵包括:针对一维事件i和一维事件j,判断事件i的所有子模式是否均超前于事件j的相应子模式而出现,或者事件i的所有子模式是否均滞后于事件j的相应子模式而出现,或者事件i的所有子模式与事件j的相应子模式之间没有固定的先后顺序。在一个实施例中,发现多维事件包括:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;以及根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件。在一个实施例中,该方法还包括:计算表示所有多维事件相互之间的重叠率的重叠率矩阵。根据共现矩阵、时间顺序矩阵和重叠率矩阵发现多维事件。在一个实施例中,计算表示所有多维事件相互之间的重叠率的重叠率矩阵包括:针对一维主事件a和一维辅事件b,通过计算事件a和b在时间上的重叠长度并将该重叠长度除以主事件a的长度,得到一维主事件a和一维辅事件b相互之间的重叠率。在一个实施例中,发现多维事件包括:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件;以及根据重叠率矩阵,对多维事件进行排序。在一个实施例中,对一维事件进行排序包括:将个数多的一维事件排在前面;如果两个一维事件的个数相同,则将最早出现事件的一维事件排在另一个一维事件的前面。本专利技术保证了在事件之间存在时间差的情况下也能发现多维事件。此外,本专利技术充分考虑到子维事件之间的相互关系,能够将多维事件分成不同类别。附图说明通过下文结合附图的详细描述,本专利技术的上述和其它特征将会变得更加明显,其中:图1是示出了根据本专利技术一个实施例的用于从多维时序数据中发现多维事件的系统的框图。图2是示出了根据本专利技术一个实施例的用于计算共现矩阵的示意图。图3是示出了根据本专利技术一个实施例的用于计算时间顺序矩阵的示意图。图4是示出了根据本专利技术一个实施例的用于计算一维事件的示意图。图5(a)是示出了根据本专利技术一个实施例的示例时间顺序矩阵的示意图。图5(b)是示出了根据本专利技术一个实施例的示例共现矩阵本文档来自技高网...

【技术保护点】
一种用于从多维时序数据中发现多维事件的系统,包括:一维事件发现单元,被配置为将多维时序数据分成多个单独的一维时序数据,并从每个单独的一维时序数据中发现一维事件;以及多维事件发现单元,所述多维事件发现单元包括:共现矩阵计算单元,被配置为计算表示所有一维事件相互之间同时出现的频率的共现矩阵;时间顺序矩阵计算单元,被配置为计算表示所有一维事件相互之间的时间顺序的时间顺序矩阵;以及共现事件发现单元,被配置为根据共现矩阵和时间顺序矩阵发现多维事件。

【技术特征摘要】
1.一种用于从多维时序数据中发现多维事件的系统,所述多维时序数据包括与空气质量有关的数据,所述多维事件包括与空气质量有关的多维事件,所述系统包括:一维事件发现单元,被配置为将多维时序数据分成多个单独的一维时序数据,并从每个单独的一维时序数据中发现一维事件,所述一维时序数据包括与空气质量有关的数据,所述一维事件包括与空气质量有关的一维事件;以及多维事件发现单元,所述多维事件发现单元包括:共现矩阵计算单元,被配置为计算表示所有一维事件相互之间同时出现的频率的共现矩阵;时间顺序矩阵计算单元,被配置为计算表示所有一维事件相互之间的时间顺序的时间顺序矩阵;以及共现事件发现单元,被配置为根据共现矩阵和时间顺序矩阵发现所述多维事件。2.根据权利要求1所述的系统,其中,所述共现矩阵计算单元被配置为:针对一维主事件a和一维辅事件b,通过计算事件a和b同时出现的次数并将该次数除以主事件a出现的次数,得到一维主事件a和一维辅事件b相互之间同时出现的频率。3.根据权利要求1所述的系统,其中,所述时间顺序矩阵计算单元被配置为:针对一维事件i和一维事件j,判断事件i的所有子模式是否均超前于事件j的相应子模式而出现,或者事件i的所有子模式是否均滞后于事件j的相应子模式而出现,或者事件i的所有子模式与事件j的相应子模式之间没有固定的先后顺序。4.根据权利要求1所述的系统,其中,所述共现事件发现单元被配置为:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;以及根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件。5.根据权利要求1所述的系统,其中,所述多维事件发现单元还包括重叠率矩阵计算单元,所述重叠率矩阵计算单元被配置为计算表示所有多维事件相互之间的重叠率的重叠率矩阵;以及所述共现事件发现单元被配置为:根据共现矩阵、时间顺序矩阵和重叠率矩阵发现多维事件。6.根据权利要求5所述的系统,其中,所述重叠率矩阵计算单元被配置为:针对一维主事件a和一维辅事件b,通过计算事件a和b在时间上的重叠长度并将该重叠长度除以主事件a的长度,得到一维主事件a和一维辅事件b相互之间的重叠率。7.根据权利要求5所述的系统,其中,所述共现事件发现单元被配置为:计算每个一维时序数据的一维事件的个数,并根据该个数对一维事件进行排序;根据共现矩阵,对排序后的所有一维事件进行两两比较,以判断相应的两个一维事件是否属于共现事件;根据时间顺序矩阵,确定属于共现事件的两个一维事件的时间顺序,并根据时间顺序生成多维事件;以及根据重叠率矩阵,对多维事件进行排序。8.根据权利要求4或7所述的系统,其中,所述共现事件发现单元被配置为:将个数多的一...

【专利技术属性】
技术研发人员:刘博李林胡卫松刘晓炜
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1