数据处理方法、装置、设备及介质制造方法及图纸

技术编号:37671080 阅读:17 留言:0更新日期:2023-05-26 04:32
本公开提供了一种数据处理方法、装置、设备及介质。本公开通过基于预先设置好的数据处理需求,确定多个数据分组,以通过不同的数据分组存储数据产生时间在不同时间段内的待处理数据,从而可以在获取到待处理数据的情况下,基于待处理数据的数据产生时间,将待处理数据存储到对应的数据分组中,以使对于作为多个数据分组中任一数据分组的目标数据分组,均可以基于目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据,实现对满足数据处理需求的目标数据的确定。通过本公开所提供的方案,可以在实时数据处理过程中,直接以数据产生时间作为统计时间,提高实时数据处理过程的处理结果准确性。处理结果准确性。处理结果准确性。

【技术实现步骤摘要】
数据处理方法、装置、设备及介质


[0001]本公开的实施方式涉及数据处理
,更具体地,本公开的实施方式涉及一种数据处理方法、装置、设备及介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着网络的高速发展,网络中所产生的数据量也大幅增长,而企业对数据的分析需求也逐步从离线场景转变到了实时数据分析场景。
[0004]相关技术中,主要通过Flink框架来实现对数据的实时处理,海量数据进入Flink处理引擎后,可以在短时间内获取到计算结果,以实现对数据的实时处理。
[0005]但是,Flink处理引擎在对数据进行处理时,是以处理时间作为统计指标的,例如,某个数据的实际产生时间是在t1时刻,但由于数据上报不及时或Flink处理引擎处理不及时等问题,在t2时刻才对该数据进行了处理,而Flink处理引擎在进行统计时,会直接以t2时刻作为统计时间,使得统计时间和数据的实际产生时间不一致,影响数据处理结果的准确性。

技术实现思路

[0006]在本上下文中,本公开的实施方式期望提供一种数据处理方法、装置、设备及介质,以提高数据实时处理过程的处理结果准确性。
[0007]在本公开实施方式的第一方面中,提供了一种数据处理方法,该方法包括:
[0008]基于预先设置好的数据处理需求,确定多个数据分组,每个数据分组用于存储数据产生时间在对应时间段内的待处理数据;
[0009]响应于获取到待处理数据,基于待处理数据的数据产生时间,将待处理数据存储到对应数据分组中;
[0010]对于目标数据分组,基于目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据,确定满足数据处理需求的目标数据,目标数据分组为多个数据分组中的任一数据分组。
[0011]在本公开的一个实施例中,数据处理需求包括时间需求信息,时间需求信息包括产生时间需求和时间间隔需求,产生时间需求用于指示满足数据处理需求的待处理数据的数据产生时间,时间间隔需求用于指示满足数据处理需求的目标数据之间的时间间隔;
[0012]基于预先设置好的数据处理需求,确定多个数据分组,包括:
[0013]按照数据处理需求所指示的时间需求信息,将产生时间需求所指示的时间段划分为多个时间槽位,每个时间槽位对应于一个数据分组,每个数据分组所对应的时长满足时间间隔需求。
[0014]在本公开的一个实施例中,基于待处理数据的数据产生时间,将待处理数据存储
到对应数据分组中,包括:
[0015]确定待处理数据的数据产生时间所对应的目标时间槽位;
[0016]将待处理数据存储至目标时间槽位所对应的目标数据分组中。
[0017]在本公开的一个实施例中,基于目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据,确定满足数据处理需求的目标数据,包括:
[0018]对目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据进行累加,以得到满足数据处理需求的目标数据。
[0019]在本公开的一个实施例中,对目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据进行累加,以得到满足数据处理需求的目标数据之后,该方法还包括:
[0020]基于目标数据分组所对应的时间槽位,确定目标数据分组所对应的世界时。
[0021]在本公开的一个实施例中,响应于获取到待处理数据,基于待处理数据的数据产生时间,将待处理数据存储到对应数据分组中之前,该方法还包括:
[0022]确定数据处理需求所指示的待获取的目标数据的数据类型;
[0023]在数据类型指示目标数据为可累加指标数据的情况下,执行响应于获取到待处理数据,基于待处理数据的数据产生时间,将待处理数据存储到对应数据分组中的步骤。
[0024]在本公开的一个实施例中,确定数据处理需求所指示的待获取数据的数据类型之后,该方法还包括:
[0025]在数据类型指示目标数据为不可累加指标数据的情况下,基于预设筛选维度,对待处理数据所对应的数据维度进行筛选;
[0026]基于经过维度筛选的待处理数据的数据产生时间,将经过维度筛选的待处理数据存储到对应数据分组中。
[0027]在本公开实施方式的第二方面中,提供了一种数据处理装置,该装置包括:
[0028]第一确定模块,用于基于预先设置好的数据处理需求,确定多个数据分组,每个数据分组用于存储数据产生时间在对应时间段内的待处理数据;
[0029]存储模块,用于响应于获取到待处理数据,基于待处理数据的数据产生时间,将待处理数据存储到对应数据分组中;
[0030]第二确定模块,用于对于目标数据分组,基于目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据,确定满足数据处理需求的目标数据,目标数据分组为多个数据分组中的任一数据分组。
[0031]在本公开实施方式的第三方面中,提供了一种计算设备,计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行程序时实现如上述第一方面以及第一方面中的任一实施例所提供的数据处理方法所执行的操作。
[0032]在本公开实施方式的第四方面中,提供了一种计算机可读存储介质,计算机可读存储介质上存储有程序,程序被处理器执行如上述第一方面以及第一方面中的任一实施例所提供的数据处理方法所执行的操作。
[0033]在本公开实施方式的第五方面中,提供了一种计算机程序产品,计算机程序产品包括计算机程序,程序被处理器执行时实现上述第一方面以及第一方面中的任一实施例所
提供的数据处理方法所执行的操作。
[0034]本公开通过基于预先设置好的数据处理需求,确定多个数据分组,以通过不同的数据分组存储数据产生时间在不同时间段内的待处理数据,从而可以在获取到待处理数据的情况下,基于待处理数据的数据产生时间,将所获取到的待处理数据存储到对应的数据分组中,以使对于作为多个数据分组中任一数据分组的目标数据分组,均可以基于目标数据分组中所存储的待处理数据以及对应时间段在目标数据分组之前的数据分组中所存储的待处理数据,实现对满足数据处理需求的目标数据的确定。通过本公开所提供的方案,可以在实时数据处理过程中,直接以数据产生时间作为统计时间,避免出现因统计时间和数据的实际产生时间不一致导致数据处理结果不准确的情况的出现,提高实时数据处理过程的处理结果准确性。
附图说明
[0035]通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
[0036]图1是本公本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:基于预先设置好的数据处理需求,确定多个数据分组,每个数据分组用于存储数据产生时间在对应时间段内的待处理数据;响应于获取到待处理数据,基于所述待处理数据的数据产生时间,将所述待处理数据存储到对应数据分组中;对于目标数据分组,基于所述目标数据分组中所存储的待处理数据以及对应时间段在所述目标数据分组之前的数据分组中所存储的待处理数据,确定满足所述数据处理需求的目标数据,所述目标数据分组为所述多个数据分组中的任一数据分组。2.根据权利要求1所述的方法,其特征在于,所述数据处理需求包括时间需求信息,所述时间需求信息包括产生时间需求和时间间隔需求,所述产生时间需求用于指示满足所述数据处理需求的待处理数据的数据产生时间,所述时间间隔需求用于指示满足所述数据处理需求的目标数据之间的时间间隔;所述基于预先设置好的数据处理需求,确定多个数据分组,包括:按照所述数据处理需求所指示的时间需求信息,将所述产生时间需求所指示的时间段划分为多个时间槽位,每个时间槽位对应于一个数据分组,每个数据分组所对应的时长满足所述时间间隔需求。3.根据权利要求2所述的方法,其特征在于,所述基于所述待处理数据的数据产生时间,将所述待处理数据存储到对应数据分组中,包括:确定所述待处理数据的数据产生时间所对应的目标时间槽位;将所述待处理数据存储至所述目标时间槽位所对应的目标数据分组中。4.根据权利要求3所述的方法,其特征在于,所述基于所述目标数据分组中所存储的待处理数据以及对应时间段在所述目标数据分组之前的数据分组中所存储的待处理数据,确定满足所述数据处理需求的目标数据,包括:对所述目标数据分组中所存储的待处理数据以及对应时间段在所述目标数据分组之前的数据分组中所存储的待处理数据进行累加,以得到满足所述数据处理需求的目标数据。5.根据权利要求4所述的方法,其特征在于,所述对所述目标数据分组中所存储的待处理数据以及对应时间段在所述目标数据分组之前的数据分组中所存储的待处理数据进行累加,以得到满足所...

【专利技术属性】
技术研发人员:周广振
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1