【技术实现步骤摘要】
【国外来华专利技术】管理实时数据流处理
[0001]本公开涉及管理实时数据流处理。
技术介绍
[0002]随着今天的应用产生大量的数据,分析工具已经变得更加强大。换句话说,这些分析工具可以从丰富的数据深度提取,以支持它们的功能。在数据量巨大的情况下,诸如仪表板,实时警报和其它数据可视化的分析工具正被用户更频繁地部署,以理解他们的数据。随着这种使用的增加,一些分析工具需要最小的延迟,同时希望分析实时或接近实时的数据。由于支持这些工具的数据经常被存储在分布式系统(例如,云存储)中,因此这些分布式存储系统正在寻址方式以满足这些需求,尤其是当它们存储的数据可以作为连续数据流到达时。
技术实现思路
[0003]本专利技术的一个方面提供了一种用于管理数据处理的方法。该方法包括在在数据处理硬件处,从数据查询系统的用户接收数据查询,所述数据查询的数据存储在与所述数据查询系统通信的数据存储器中。所述方法还包括在所述数据处理硬件处,接收指示所述数据查询的上时间边界的停滞参数,所述上时间边界将查询响应限制到所述数据存储器内的比所述上时间边界早的数据。该方法还包括由数据处理硬件确定存储在所述数据存储器内的所述数据是否满足所述停滞参数。当所述数据存储器内的所述数据的一部分不满足所述停滞参数时,该方法包括所述数据处理硬件生成所述查询响应,所述查询响应排除所述数据的比所述停滞参数的所述上时间边界更近地写入所述数据存储器的所述一部分。
[0004]本公开的实施方式可以包括以下可选特征中的一个或多个。在一些实施方式中,接收所述停滞参数包括,从所述 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法(300),其特征在于,所述方法包括:在数据处理硬件(134)处,从数据查询系统(150)的用户(10)接收数据查询(170),所述数据查询(170)的数据存储在与所述数据查询系统(150)通信的数据存储器(142)中;在所述数据处理硬件(134)处,接收指示所述数据查询(170)的上时间边界的停滞参数(174),所述上时间边界将查询响应(172)限制到所述数据存储器(142)内的比所述上时间边界早的数据(12);由所述数据处理硬件(134)确定存储在所述数据存储器(142)内的所述数据(12)是否满足所述停滞参数(174);以及当所述数据存储器(142)内的所述数据(12)的一部分不满足所述停滞参数(174)时,由所述数据处理硬件(134)生成所述查询响应(172),所述查询响应(172)排除所述数据(12)的比所述停滞参数(174)的所述上时间边界更近地写入所述数据存储器(142)的所述一部分。2.如权利要求1所述的方法(300),其特征在于,接收所述停滞参数(174)包括,从所述数据查询系统(150)的所述用户(10)接收所述停滞参数(174)。3.如权利要求1或2所述的方法(300),其特征在于,还包括,由所述数据处理硬件(134)通过以下步骤来确定所述停滞参数(174)的所述上时间边界:在所述数据处理硬件(134)处接收来自所述用户(10)的用户数据(12);由所述数据处理硬件(134)将接收到的用户数据(12)摄入到所述数据存储器(142)中,以第一时间形成一个或多个日志文件(212);由所述数据处理硬件(134)在第二时间将所述一个或多个日志文件(212)转换为列数据格式,所述列数据格式对于相应的查询(170)被优化;由所述数据处理硬件(134)确定所述第一时间与所述第二时间之间的时间差;以及由所述数据处理硬件(134)将所述时间差分配给所述停滞参数的所述上时间边界(174)。4.如权利要求1
‑
3中任一项所述的方法(300),其特征在于,还包括:由所述数据处理硬件(134)识别存储在所述数据存储器(142)内的所述数据(12)的日志文件(212),每个日志文件(212)包括多行数据,所述多行数据中的每行数据(12)包括时间戳(214);以及由所述数据处理硬件(134)确定所述日志文件(212)内最接近地匹配所述停滞参数(174)的所述上时间边界的相应时间戳(214);以及对于所述查询响应(172),由所述数据处理硬件(134)读取所述日志文件(212)内的数据(12),所述数据(12)比最接近地匹配所述停滞参数(174)的所述上时间边界的时间戳(214)更早。5.如权利要求4所述的方法(300),其特征在于,所述时间戳(214)指示所述数据存储器(142)在相应日志文件(212)中生成所述相应数据行(12)的时间。6.如权利要求1
‑
5中任一项所述的方法(300),其特征在于,还包括:在所述数据处理硬件(134)处从所述用户(10)接收数据集合(12);由所述数据处理硬件(134)将所述数据集合(12)摄入到所述数据存储器(142)中;以及由所述数据处理硬件(134)为所述数据集合(12)生成一个或多个日志文件(212),每个
日志文件(212)包括对应于来自所述数据集合(12)的数据(12)的数据行,并且其中生成所述一个或多个日志文件(212)为相应日志文件(212)内的每行数据(12)生成时间戳(214)。7.一种方法(400),其特征在于,包括:在数据处理硬件(134)处接收查询(170),所述查询(170)请求存储在存储系统中的相应时间间隔(176)的数据(12);由所述数据处理硬件(134)确定所述相应时间间隔(176)的任何部分是否对应于从先前查询(170)缓存的静态数据(244),所述静态数据(244)对应于在所述存储系统的存储操作期间保持不变的存储数据(12);以及当所述相应时间间隔(176)的一部分对应于从所述先前查询(170)缓存的静态数据(244)时,由所述数据处理硬件(134)生成对所述查询(170)的相应响应(172),所述查询(170)包括对应于所述相应时间间隔(176)的所述一部分的缓存的静态数据(244),而不对所述存储系统的所述相应时间间隔(176)的所述一部分内的存储数据(12)执行读取操作。8.如权利要求7所述的方法(400),其特征在于,还包括:在所述数据处理硬件(134)处接收初始查询(170),所述初始查询(170)请求在初始时间间隔(176)存储在所述存储系统中的数据(12);由所述数据处理硬件(134)确定在所述初始时间间隔(176)存储在所述存储系统中的所述数据(12)的一部分包括静态数据(244);由所述数据处理硬件(134)生成对所述初始查询(170)的响应(172),所述初始查询(170)包括所请求的数据(12)并且包括与所述初始时间间隔(176)的相应静态数据(244)相对应的数据(12)的所述一部分;以及由所述数据处理硬件(134)缓存对应于所述初始时间间隔(176)的静态数据(244)的所述数据(12)的所述一部分。9.如权利要求8所述的方法(400),其特征在于,确定在所述初始时间间隔(176)存储在所述存储系统中的所述数据(12)的所述一部分包括静态数据(244)包括,标识与存储在所述存储系统中的所述数据(12)的列格式相关联的时间戳(214),所述时间戳(214)指示给定列中的所述存储数据(12)的最后修改日期。10.如权利要求8所述的方法(400),其特征在于,确定在所述初始时间间隔(176)存储在所述存储系统中的所述数据(12)的所述一部分包括静态数据(244)包括,确定与所述存储系统中的存储数据(12)的给定列相关联的时间戳(214)满足静态数据阈值,所述时间戳(214)指示所述给定列中的所述存储数据(12)的最后修改日期,所述静态数据阈值指示所述给定列中的所述存储数据(12)在所述存储系统的未来存储操作期间保持不变的可能性。11.如权利要求7
‑
10中任一项所述的方法(400),其特征在于,生成对所述查询(170)的所述相应响应(172)包括,在所述相应时间间隔(176)内但不在对应于从所述先前查询(170)缓存的所述静态数据(244)的所述相应时间间隔(176)的所述一部分内,在所述存储系统对所存储的数据(12)执行读取操作。12.如权利要求7
‑
11中任一项所述的方法(400),其特征在于,还包括:当所述相应时间间隔(176)的任何部分未能对应于从先前查询(170)缓存的静态数据(244)时,由所述数据处理硬件(134)确定在所述相应时间间隔(176)存储在所述存储系统中的数据(12)的一部分包括静态数据(244);
由所述数据处理硬件(134)生成对所述相应查询(170)的所述相应响应(172),所述相应查询(170)包括所请求的数据(12)并且包括对应于所述相应时间间隔(176)的所述相应静态数据(244)的数据(12)的所述一部分;以及由所述数据处理硬件(134)缓存对应于所述相应时间间隔(176)的静态数据(244)的所述数据(12)的所述一部分。13.如权利要求7
‑
12中任一项所述的方法(400),其特征在于,所述存储操作包括存储来自所述存储系统的用户(10)的实时数据(12)的连续数据(12)流。14.如权利要求7
‑
13中任一项所述的方法(400),其特征在于,还包括由所述数据处理硬件(134)将对所述查询(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。