一种报表数据的压缩方法、装置、设备和介质制造方法及图纸

技术编号:39317085 阅读:12 留言:0更新日期:2023-11-12 15:59
本申请公开一种报表数据的压缩方法、装置、设备和介质,可应用于大数据领域或金融领域,获取待压缩报表,待压缩报表包括n行数据和m列数据,n行数据中的每行数据对应为一个用户的业务数据,m列数据中的每列数据对应于一个数据项。依次针对m列数据中的每列数据,将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块,压缩文件块对应的块数据为一个目标块数据,压缩文件块的块标识用于指示压缩文件块所属列为第i列、目标块数据所属行的行编号。当相同的行数据有多行时,只需存储一个即可,如此避免重复存储的问题。基于此,采用本申请后,可以实现对报表中重复的行数据的压缩存储,有利于降低存储成本。本。本。

【技术实现步骤摘要】
一种报表数据的压缩方法、装置、设备和介质


[0001]本申请涉及大数据领域,特别是涉及一种报表数据的压缩方法、装置、设备和介质。

技术介绍

[0002]报表是企业数据分析管理的重要工具,报表中存储有数据,可以用于数据分析管理。尤其对于金融行业,对报表需求量极大,报表在日常经营管理、客户营销、风险防控中发挥了重要作用。
[0003]报表一般按照一定的业务类型(如机构层级、贷款投向行业分类等)加工,可细分为明细数据报表、汇总数据报表等。对于明细数据报表(如客户贷款余额表),涉及的数据量巨大,带来极大的存储成本。
[0004]由此可见,如何降低报表的存储成本,具有重要意义。

技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种报表数据的压缩方法、装置、设备和介质,当相同的行数据有多行时,采用本申请这种基于压缩文件块的方式,只需存储一个即可,如此可以避免重复存储的问题。基于此,在采用本申请这种基于压缩文件块的方式时,可以实现对报表中重复的行数据的压缩存储,有利于降低存储成本。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供了一种报表数据的压缩方法,所述方法包括:
[0008]获取待压缩报表;所述待压缩报表包括n行数据和m列数据,所述n行数据中的每行数据对应为一个用户的业务数据,不同行对应的用户不同,所述m列数据中的每列数据对应于一个数据项,不同列对应的数据项不同,n和m均为大于1的整数;
[0009]依次针对所述m列数据中的每列数据,将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块;所述压缩文件块对应的块数据为一个所述目标块数据,所述压缩文件块的块标识用于指示所述压缩文件块所属列为第i列、所述目标块数据所属行的行编号,其中,i为大于或等于1且小于或等于m的整数。
[0010]在一种可能的实现方式中,所述将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块,包括:
[0011]对构成所述第i列数据的n行数据进行排序,得到所述第i列数据对应的n行排序数据;
[0012]将所述n行排序数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块;所述压缩文件块的块标识用于指示所述目标块数据所属行的起始行编号和结束行编号,从所述起始行编号到所述结束行编号的所有行数据为所述目标块数据。
[0013]在一种可能的实现方式中,所述m列数据对应的数据项包括维度数据和事实数据,所述将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件
块,包括:
[0014]若所述第i列数据对应的数据项为所述维度数据,将构成所述第i列数据的n行数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块。
[0015]在一种可能的实现方式中,所述方法还包括:
[0016]若所述第i列数据对应的数据项为所述事实数据,根据构成所述第i列数据的n行数据确定事实文件块;所述事实文件块对应的块数据为所述构成所述第i列数据的n行数据,所述事实文件块的块标识用于指示所述事实文件块所属列为第i列、所述事实文件块所属行的起始行编号和结束行编号,所述起始行编号为第1行、所述结束行编号为第n行。
[0017]在一种可能的实现方式中,所述m列数据中的k列数据对应的数据项为所述事实数据,k为大于1且小于m的整数,所述方法还包括:
[0018]根据构成所述k列数据的n行数据确定事实文件块;所述事实文件块对应的块数据为所述构成所述k列数据的n行数据,所述事实文件块的块标识用于指示所述事实文件块所属列的列编号为所述k列数据对应的列编号、所述事实文件块所属行的起始行编号和结束行编号,所述起始行编号为第1行、所述结束行编号为第n行。
[0019]在一种可能的实现方式中,所述根据构成所述k列数据的n行数据确定事实文件块,包括:
[0020]对所述m列数据进行排序整合,将所述k列数据整合为k列相邻数据;
[0021]将构成所述k列相邻数据的第j行数据作为第j个子数据,得到n个子数据;j为大于或等于1且小于或等于n的整数;
[0022]根据所述n个子数据确定所述事实文件块;所述事实文件块对应的块数据包括依次记载的所述n个子数据,所述事实文件块所属列的列编号包括起始列编号和结束列编号,所述起始列编号为所述k列相邻数据中的第1列相邻数据对应的列编号,所述结束列编号为所述k列相邻列数据中的第k列相邻数据对应的列编号。
[0023]在一种可能的实现方式中,所述待压缩报表对应的所述压缩文件块包括多个压缩文件块,所述方法还包括:
[0024]响应于报表查看请求,依次按照所述多个压缩文件块中的每个压缩文件块的块标识,对所述每个压缩文件块进行回显,得到所述每个压缩文件块对应的回显报表;
[0025]根据所述多个压缩文件块分别对应的回显报表确定所述待压缩报表。
[0026]另一方面,本申请实施例提供了一种报表数据的压缩装置,所述装置包括获取单元和压缩单元:
[0027]所述获取单元,用于获取待压缩报表;所述待压缩报表包括n行数据和m列数据,所述n行数据中的每行数据对应为一个用户的业务数据,不同行对应的用户不同,所述m列数据中的每列数据对应于一个数据项,不同列对应的数据项不同,n和m均为大于1的整数;
[0028]所述压缩单元,用于依次针对所述m列数据中的每列数据,将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块;所述压缩文件块对应的块数据为一个所述目标块数据,所述压缩文件块的块标识用于指示所述压缩文件块所属列为第i列、所述目标块数据所属行的行编号,其中,i为大于或等于1且小于或等于m的整数。
[0029]在一种可能的实现方式中,所述压缩单元还用于:
[0030]对构成所述第i列数据的n行数据进行排序,得到所述第i列数据对应的n行排序数
据;
[0031]将所述n行排序数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块;所述压缩文件块的块标识用于指示所述目标块数据所属行的起始行编号和结束行编号,从所述起始行编号到所述结束行编号的所有行数据为所述目标块数据。
[0032]在一种可能的实现方式中,所述m列数据对应的数据项包括维度数据和事实数据,所述压缩单元还用于:
[0033]若所述第i列数据对应的数据项为所述维度数据,将构成所述第i列数据的n行数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块。
[0034]在一种可能的实现方式中,所述压缩单元还用于:
[0035]若所述第i列数据对应的数据项为所述事实数据,根据构成所述第i列数据的n行数据确定事实文件块;所述事实文件块对应的块数据为所述构成所述第i列数据的n行数据,所述事实文件块的块标识用于指示所述事实文件块所属列为第i列、所述事本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种报表数据的压缩方法,其特征在于,所述方法包括:获取待压缩报表;所述待压缩报表包括n行数据和m列数据,所述n行数据中的每行数据对应为一个用户的业务数据,不同行对应的用户不同,所述m列数据中的每列数据对应于一个数据项,不同列对应的数据项不同,n和m均为大于1的整数;依次针对所述m列数据中的每列数据,将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块;所述压缩文件块对应的块数据为一个所述目标块数据,所述压缩文件块的块标识用于指示所述压缩文件块所属列为第i列、所述目标块数据所属行的行编号,其中,i为大于或等于1且小于或等于m的整数。2.根据权利要求1所述的方法,其特征在于,所述将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块,包括:对构成所述第i列数据的n行数据进行排序,得到所述第i列数据对应的n行排序数据;将所述n行排序数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块;所述压缩文件块的块标识用于指示所述目标块数据所属行的起始行编号和结束行编号,从所述起始行编号到所述结束行编号的所有行数据为所述目标块数据。3.根据权利要求1所述的方法,其特征在于,所述m列数据对应的数据项包括维度数据和事实数据,所述将构成第i列数据的n行数据中相同的行数据作为目标块数据进行压缩,得到压缩文件块,包括:若所述第i列数据对应的数据项为所述维度数据,将构成所述第i列数据的n行数据中相同的行数据作为所述目标块数据进行压缩,得到所述压缩文件块。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述第i列数据对应的数据项为所述事实数据,根据构成所述第i列数据的n行数据确定事实文件块;所述事实文件块对应的块数据为所述构成所述第i列数据的n行数据,所述事实文件块的块标识用于指示所述事实文件块所属列为第i列、所述事实文件块所属行的起始行编号和结束行编号,所述起始行编号为第1行、所述结束行编号为第n行。5.根据权利要求3所述的方法,其特征在于,所述m列数据中的k列数据对应的数据项为所述事实数据,k为大于1且小于m的整数,所述方法还包括:根据构成所述k列数据的n行数据确定事实文件块;所述事实文件块对应的块数据为所述构成所述k列数据的n行数据,所述事实文件块的块标识用于指示所述事实文件块所属列的列编号为所述k列数据对应的列编号、所...

【专利技术属性】
技术研发人员:汪德华
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1