连续数据流上的可变持续时间窗口制造技术

技术编号:12947197 阅读:62 留言:0更新日期:2016-03-02 09:11
提供了用于处理数据流的改进技术。事件有资格保留在基于时间的窗口中的持续时间对于经由相同事件流接收的不同事件是可变的。在某些实施例中,输入事件在基于时间的窗口中所花费的持续时间是该事件的一个或多个属性的一个或多个值的函数。由于不同的事件可以具有不同的一个或多个属性值,因此不同的事件可以在用于那个事件流的基于时间的窗口中花费不同的时间量。事件在基于时间的窗口中所花费的时间量可以经由该事件的一个或多个属性来控制。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 对相关申请的交叉引用 本申请要求于2013年1月15日提交的标题为"VARIABLE DURATION WINDOWS 0N CONTINUOUS DATA STREAMS"的美国临时申请No. 61/752, 850的权益和优先权。本申请还要 求于 2013 年 3 月 15 日提交的标题为 "VARIABLE DURATION WINDOWS ON CONTINUOUS DATA STREAMS"的美国非临时申请No. 13/838, 259的权益和优先权,该申请又要求美国临时申请 No. 61/752, 850的优先权。61/752, 850和13/838, 259申请的全部内容通过引入被结合于 此,用于所有目的。
所公开的实施例一般而言涉及数据处理系统,并且更具体而言涉及用于利用可变 持续时间窗口处理连续事件流的技术。
技术介绍
在传统的数据库系统中,数据通常以表的形式存储在一个或多个数据库中。然后, 所存储的数据利用诸如SQL的数据管理语言被查询和操纵。例如,SQL查询可以被定义并 执行,以便从存储在数据库中的数据识别相关的数据。因此,SQL查询对存储在数据库中的 有限数据集执行。另外,当SQL查询被执行时,它对有限数据集执行一次并且产生有限的静 态结果。因此,数据库最佳配备为在有限存储的数据集上运行。 但是,众多的现代应用和系统以连续数据或事件流而不是有限数据集的形式生成 数据。这种应用的例子包括但不限于传感器数据应用、金融行情(financial tickers)、网 络性能测量工具(例如,网络监视和流量管理应用)、点击流分析工具、汽车交通监视,等 等。例如,温度传感器可被配置为发出温度读数。这种应用已经引起了对可以处理数据流 的新型应用的需求。 管理和处理用于这些类型的基于事件流的应用的数据涉及利用强时间焦点建立 数据管理和查询能力。需要包括对连续无界限数据集进行长期运行查询的不同种类的查询 机制。虽然一些厂商现在提供针对事件流处理的产品套件,但是这些产品供应仍然缺乏处 理如今的事件处理需求所需要的处理灵活性。
技术实现思路
本专利技术的某些实施例一般而言涉及数据处理系统,并且更具体而言涉及利用可变 持续时间的窗口处理连续事件流的技术。技术可以包括,例如,利用对事件数据流操作的计 算机实现的方法实现的技术,处理事件数据流的计算设备、系统或装置,存储可由一个或多 个处理单元执行的多条指令的计算机可读存储器,等等。 在某些实施例中,事件有资格保留在基于时间的窗口中的持续时间可以对经由相 同事件流接收的不同事件变化。例如,对于经由事件流接收的第一输入事件,第一事件有资 格保留在基于时间的窗口中的持续时间可以是"X",并且对于经由相同事件流接收的第二 输入事件,第二事件有资格保留在基于时间的窗口中的持续时间可以是"Y",其中X与Y不 同。第一和第二事件可以具有相同的关联时间戳或不同的时间戳。因此,本专利技术的实施例 使得事件在基于时间的窗口中所花费的时间量受控。 在某些实施例中,输入事件在基于时间的窗口中所花费的持续时间是该事件的一 个或多个属性的一个或多个值的函数。由于不同的事件可以具有不同的一个或多个属性 值,因此不同的事件可以在基于时间的窗口中花费不同的时间量。这使得事件在基于时间 的窗口中所花费的时间量能够经由该事件的一个或多个属性来控制。 在一种实施例中,多个事件可以被计算设备经由事件流接收。例如,第一事件和第 二事件可以经由事件流接收。第一持续时间可以为第一事件确定,其中第一持续时间指示 第一事件有资格保留在为该事件流指定的基于时间的窗口中的持续时间。第二持续时间可 以为第二事件确定,其中第二持续时间指示第二事件有资格保留在该基于时间的窗口中的 持续时间,其中第二持续时间不同于第一持续时间。 在某些实施例中,第一和第二事件可以添加到为事件流指定的基于时间的窗口。 第一事件保留在基于时间的窗口中第一持续时间,然后从基于时间的窗口除去或删除。第 二事件保留在基于时间的窗口中第二持续时间,然后从基于时间的窗口除去或删除。以这 种方式,第一事件在基于时间的窗口内所花费的持续时间可以不同于第二事件在基于时间 的窗口内所花费的持续时间。 在上述第一和第二事件示例实施例中,第一事件可以具有关联的第一时间并且第 二事件可以具有关联的第二时间。在一种情况下,第一时间和第二时间可以相同。在第二 种情况下,第一时间可以与第二时间不同。 在某些实施例中,事件有资格在基于时间的窗口内花费的持续时间可以基于该事 件的一个或多个属性的值。 在某些实施例中,行-时间范围窗口可以是不同的分区。事件所属的分区可以基 于第一事件的属性的值。事件有资格在用于分区的行-时间范围窗口内花费的时间量可以 基于该事件的一个或多个属性的一个或多个值。因此,对于属于特定分区的事件,不同的事 件可以有资格在用于特定分区的行-时间范围窗口中花费不同的持续时间。 在某些实施例中,基于与第一事件关联的第一时间和第一持续时间,可以为第一 事件计算第一到期时间。基于与第二事件关联的第二时间和第二持续时间,可以为第二事 件计算第二到期时间。在第一到期时间发生时或者之后,第一事件从基于时间的窗口被除 去或删除。同样,在第二到期时间发生时或者之后,第二事件可以从基于时间的窗口被除去 或删除。 根据本公开内容的一方面,提供了计算设备。计算设备包括配置为确定用于第一 事件的第一持续时间的第一确定单元,其中第一事件是由计算设备经由事件流接收的,第 一持续时间指示第一事件有资格保留在为事件流指定的基于时间的窗口中的持续时间。计 算设备可以包括配置为确定用于第二事件的第二持续时间的第二确定单元,其中第二事件 是由计算设备经由事件流接收的,第二持续时间指示第二事件有资格保留在该基于时间的 窗口中的持续时间。第二持续时间可以不同于第一持续时间。 在某些实施例中,计算设备还包括配置为在第一时间事件已经在基于时间的窗口 中第一持续时间之后从基于时间的窗口除去第一事件的第一去除单元,以及配置为在第二 时间事件已经在基于时间的窗口中第二持续时间之后从基于时间的窗口除去第二事件的 第二去除单元。 在某些实施例中,第一事件具有关联的第一时间并且第二事件具有关联的第二时 间,其中第一时间与第二时间相同。 在某些实施例中,第一事件具有关联的第一时间并且第二事件具有关联的第二时 间,其中第一时间与第二时间不同。 在某些实施例中,确定第一持续时间包括基于第一事件的一个或多个属性的一个 或多个值计算第一持续时间。另外,确定第二持续时间包括基于第二事件的一个或多个属 性的一个或多个值计算第二持续时间。 在某些实施例中,第一确定单元配置为基于第一事件的第一属性的值确定用于第 一事件的第一分区。第二确定单元配置为基于第二事件的第一属性的值确定第二事件属于 第一分区。基于时间的窗口用于该第一分区。 在某些实施例中,第一确定单元配置为基于与第一事件关联的第一时间和第一持 续时间确定用于第一事件的第一到期时间。第二确定单元配置为基于与第二事件关联的第 二时间和第二持续时间确定用于第二事件的第二到期时间。第一去除单元配置为在第一到 期时间发生时或者之后从基于时间的窗口除本文档来自技高网
...

【技术保护点】
一种方法,包括:由计算设备,确定经由事件流接收的第一事件的第一持续时间,该第一持续时间指示第一事件有资格保留在为该事件流指定的基于时间的窗口中的持续时间;及由计算设备,确定经由事件流接收的第二事件的第二持续时间,该第二持续时间指示第二事件有资格保留在所述基于时间的窗口中的持续时间,其中第二持续时间与第一持续时间不同。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S·比施诺娃A·斯里尼瓦桑
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1