一种文件并行装载入库的方法及装置制造方法及图纸

技术编号:40711175 阅读:19 留言:0更新日期:2024-03-22 11:12
本发明专利技术提供一种文件并行装载入库的方法及装置,包括:当接收到待装载文件时,获取待装载文件的数据量;判断待装载文件的数据量是否大于阈值;当待装载文件的数据量大于阈值时,根据预设规则对待装载文件进行分片处理,得到多个目标数据文件;根据预设并行数量,将所有目标数据文件并行装载到数据库。将单个数据量大于阈值的待装载文件进行有效拆分,充分利用系统并行处理能力进行并行装载处理,实现了大数据文件装载效率的大幅提升,解决了数据ETL装载过程中对超大文件作业运行时间过久、占用系统与数据库资源过多的问题。

【技术实现步骤摘要】

本专利技术涉及数据库,尤其涉及一种文件并行装载入库的方法及装置


技术介绍

1、随着信息时代的来临,数据出现爆炸式增长。银行在面对海量的业务数据时,对数据的装载效率和资源耗用提出了更高的要求。数据库运维人员在日常运维中遇到超大数据文件装载作业时,通常会监控到作业缓慢、资源不足等问题。

2、针对这类问题,目前通常是采用给服务器加cpu、内存、存储等硬件资源,做系统扩容的方式解决资源不足等问题,但是增加硬件资源往往需要停机进行维护,不仅耗费了更多的时间,而且只是单独的增加硬件资源,会导致数据etl过程中临时表统计信息失效,sql的执行计划并非最优,不会使etl的作业效率得到线性提升。而且如果超大数据文件不是常态化的话,直接扩容会导致资源在大部分时间利用率较低,增加了整个it预算成本。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种文件并行装载入库的方法及装置,以解决数据etl装载过程中对超大文件作业运行时间过久、占用系统与数据库资源过多的问题。

2、为实现上述目的,本专利技术实施例提本文档来自技高网...

【技术保护点】

1.一种文件并行装载入库的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据预设规则对所述待装载文件进行分片处理,得到多个目标数据文件,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据预设并行数量,将所有目标数据文件并行装载到数据库,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述数据库临时表对数据库目标表进行更新,包括:

5.根据权利要求1所述的方法,其特征在于,判断所述待装载文件的数据量是否大于阈值之后,还包括:

6.一种文件并行装载入库的装置,其特征在于,所述装置包...

【技术特征摘要】

1.一种文件并行装载入库的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据预设规则对所述待装载文件进行分片处理,得到多个目标数据文件,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据预设并行数量,将所有目标数据文件并行装载到数据库,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述数据库临时表对数据库目标表进行更新,包括:

5.根据权利要求1所述...

【专利技术属性】
技术研发人员:夏映阳
申请(专利权)人:中国建设银行股份有限公司广东省分行
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1