数据更新方法、装置、设备及介质制造方法及图纸

技术编号:37851276 阅读:23 留言:0更新日期:2023-06-14 22:41
本发明专利技术实施例公开了一种数据更新方法、装置、设备及介质。该方法包括:获取原始数据对应的至少一个列式数据文件;所述列式数据文件中包括数据索引和至少一个数据行组;获取待更新数据,并确定所述待更新数据的主键;根据所述待更新数据的主键和数据索引,从各所述列式数据文件中选取待更新列式数据文件,并确定所述待更新列式数据文件中的待更新数据行组;根据所述待更新数据,对所述待更新列式数据文件中的所述待更新数据行组进行更新,得到目标列式数据文件。上述方案,提高了列式数据文件的更新效率。新效率。新效率。

【技术实现步骤摘要】
数据更新方法、装置、设备及介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种数据更新方法、装置、设备及介质。

技术介绍

[0002]列式存储的数据按列分开存储,由于同一列的数据类型一样,可以高效的压缩编码,降低存储成本,同时在查询分析的时候可以仅读取需要的列,对相同的列方便计算机进行高效向量运算,用于支撑快速查询分析。然而在少量记录需要更新(如修改或删除)的时候,列式数据文件需要对整个文件进行处理,当列式数据文件中存储的数据较多时,对列式数据文件的更新效率会比较低。

技术实现思路

[0003]本专利技术提供一种数据更新方法、装置、设备及介质,以提高对列式数据文件的更新效率。
[0004]根据本专利技术实施例的一方面,提供了一种数据更新方法,包括:
[0005]获取原始数据对应的至少一个列式数据文件;所述列式数据文件中包括数据索引和至少一个数据行组;
[0006]获取待更新数据,并确定所述待更新数据的主键;
[0007]根据所述待更新数据的主键和数据索引,从各所述列式数据文件中选取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据更新方法,其特征在于,包括:获取原始数据对应的至少一个列式数据文件;所述列式数据文件中包括数据索引和至少一个数据行组;获取待更新数据,并确定所述待更新数据的主键;根据所述待更新数据的主键和数据索引,从各所述列式数据文件中选取待更新列式数据文件,并确定所述待更新列式数据文件中的待更新数据行组;根据所述待更新数据,对所述待更新列式数据文件中的所述待更新数据行组进行更新,得到目标列式数据文件。2.根据权利要求1所述的方法,其特征在于,所述数据索引包括行组索引和文件索引。3.根据权利要求2所述的方法,其特征在于,所述根据所述待更新数据的主键和数据索引,从各所述列式数据文件中选取待更新列式数据文件,并确定所述待更新列式数据文件中的待更新数据行组,包括:根据所述待更新数据的主键和所述文件索引,从至少一个列式数据文件中确定所述待更新列式数据文件;根据所述待更新数据的主键和所述行组索引,确定所述待更新列式数据文件中的所述待更新数据行组,以及所述待更新数据行组在所述待更新列式数据文件中的位置;相应的,在对所述根据所述待更新数据,对所述待更新列式数据文件中的所述待更新数据行组进行更新之后,所述方法还包括:根据更新后的待更新数据行组中各数据的主键,对所述待更新列式数据文件的文件索引,以及所述待更新数据行组对应的行组索引进行更新。4.根据权利要求2或3所述的方法,其特征在于,所述行组索引包括判断索引和/或区间索引。5.根据权利要求4所述的方法,其特征在于,所述根据所述待更新数据的主键和所述行组索引,确定所述待更新列式数据文件中的所述待更新数据行组,以及所述待更新数据行组在所述待更新列式数据文件...

【专利技术属性】
技术研发人员:吕虎张恒薛羽
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1