【技术实现步骤摘要】
数据表存储周期确定方法、装置、设备及存储介质
[0001]本申请涉及大数据数据处理
,尤其涉及一种数据表存储周期确定方法、装置、设备及存储介质。
技术介绍
[0002]现有数据中台中大量数据通常进行分层计算和存储,需要对表的存储周期进行管理。目前针对大数据表的存储周期的采集方法,如果有些数据表可能目前只有部分日期的数据,无法直接提供准确的日期数据信息,则需要对原始数据表进行探查。相关技术中通常利用数据库的count()函数,针对表的日期字段进行分组统计,计算得到表内有数据的日期。对于数据量大的表,采用这种方式需要扫描大量的数据文件,从而消耗大量的计算资源,甚至由于资源不足难以得到计算结果。
技术实现思路
[0003]本申请提供一种数据表存储周期确定方法、装置、设备及存储介质,旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]第一方面,本申请提供一种数据表存储周期确定方法,包括:从数据库的元数据表获取目标数据表多个子分区的开始日期和结束日期;基于分区时间升序依次确定第一子分区,并从第一子分区的第一结束日期向第一开始日期对第一子分区的数据进行探查,直至确定最后一条数据的最小存储日期;基于分区时间降序依次确定第二子分区,并从第二子分区的第二开始日期向第二结束日期对第二子分区的数据进行探查,直至确定最后一条数据的最大存储日期;以及将最小存储日期至最大存储日期作为目标数据表的实际存储周期。
[0005]第二方面,本申请提供一种数据表存储周期确定装置,包括:获取模块,用于从数据 ...
【技术保护点】
【技术特征摘要】
1.一种数据表存储周期确定方法,其特征在于,包括:从数据库的元数据表获取目标数据表多个子分区的开始日期和结束日期;基于分区时间升序依次确定第一子分区,并从所述第一子分区的第一结束日期向第一开始日期对所述第一子分区的数据进行探查,直至确定最后一条数据的最小存储日期;基于分区时间降序依次确定第二子分区,并从所述第二子分区的第二开始日期向第二结束日期对所述第二子分区的数据进行探查,直至确定最后一条数据的最大存储日期;以及将所述最小存储日期至所述最大存储日期作为所述目标数据表的实际存储周期。2.根据权利要求1所述的方法,其特征在于,所述将所述最小存储日期至所述最大存储日期作为所述目标数据表的实际存储周期之后,还包括:确定需求存储周期的需求开始日期和需求结束日期;以及响应于所述最小存储日期小于需求开始日期,和/或所述最大存储日期大于所述需求结束日期,将所述目标数据表中最小存储日期至需求开始日期,和/或需求结束日期至最大存储日期的数据进行清理。3.根据权利要求1所述的方法,其特征在于,所述将所述最小存储日期至所述最大存储日期作为所述目标数据表的实际存储周期之后,还包括:响应于当前时间达到更新时间、且所述最小存储日期没有数据,对所述最小存储日期进行更新;和/或响应于当前时间达到更新时间、且所述最大存储日期的下一个日期有数据,对所述最大存储日期进行更新。4.根据权利要求3所述的方法,其特征在于,所述对所述最小存储日期进行更新,包括:响应于包含所述最小存储日期的第一子分区存在,从所述最小存储日期向所述第一结束日期对所述第一子分区的数据进行探查,直至确定第一条数据的存储日期作为更新后的所述最小存储日期;或者响应于包含所述最小存储日期的第一子分区不存在,基于当前分区时间升序依次确定第三子分区,并从所述第三子分区的第三结束日期向第三开始日期对所述第三子分区的数据进行探查,直至确定最后一条数据的存储日期作为更新后的所述最小存储日期。5.根据权利要求3所述的方法,其特征在于,所述对所述最大存储日期进行更新,包括:在所述第二结束日期没有数据的情况下,从所述最大存储日期的下一个日期开始向所述第二结束日期对所述第二子分区的数据进行探查,直至确定最后一条数据的存储日期作为更新后的所述最大存储日期;在所述第二结束日期有数据的情况下,基于当前分区时间降序依次确定第四子分区,并从所述第四子分区的第四开始日期向第四结束日期对所述第四子分区的数据进行探查,直至确定最后一条数据的存储日期作为更新后的所述最大存储日期。6.根据权利要求2所述的方法,其特征在于,所述确定需求存储周期的需求开始日期和需求结束日期,包括:获取所述需求开始日期和至少一个周期编码,其中,每个所述周期编码包括:1位数据保存期限标识,分为永久保存标识或非永久保存标识;2位度量标识,首位分为以下任一项:年标识、季标识、月标识、旬标识、周标识、日标识,
次位分为以下任一项:初标识、末标识、工作日标识、周末标识、指定日期标识、整标识;4位计量标识,取值为0000~9999的数字;以及基于所述需求开始日期和所述周期编码,确定所述需求结束日期。7.一种数据表存储周期确定装置,其特征在于,包括:获取模块,用于从数据库的元数据表获取目标数据表多个子分区的开始日期和结束日期;第一探查模块,用于基于分区时间升序依次确定第一子分区,并从所述第一子分区的第一结束日期向第一开始日期对所述第一子分区的数据进行探查,直至确定...
【专利技术属性】
技术研发人员:杨辰凯,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。