数据文件合并方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号：37349159 阅读：12 留言：0更新日期：2023-04-22 21:46

本公开的实施例公开了数据文件合并方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：根据所接收的各个导入数据组，确定各个导入数据组所对应的各个导入数据文件；根据各个导入数据文件，确定各个导入数据文件的数量是否满足预设数量条件；响应于确定各个导入数据文件的数量满足预设数量条件，根据各个导入数据文件，确定各个目标数据文件；将各个目标数据文件组合为目标数据文件队列；响应于确定目标数据文件队列中的各个目标数据文件满足合并条件，对各个目标数据文件进行合并，以生成合并数据文件。该实施方式实现了避免超限导致的导入失败，节约了用户时间和资源，提高了导入数据的性能。提高了导入数据的性能。提高了导入数据的性能。

全部详细技术资料下载

【技术实现步骤摘要】
数据文件合并方法、装置、电子设备和计算机可读介质

[0001]本公开的实施例涉及计算机
，具体涉及数据文件合并方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]将导入至联机分析处理系统的数据进行合并，用户使用联机分析处理系统查询数据更加便捷。目前，在对导入数据进行合并时，通常采用的方式为：限制导入的数据量，对所导入的数据对用户进行展示以及异步的合并导入数据，或对导入的数据进行合并之后再对用户进行展示。
[0003]然而，专利技术人发现，当采用上述方式对导入数据进行合并时，经常会存在如下技术问题：第一，当将数据导入之后对用户进行展示且异步合并导入数据时，若用户对所展示的未合并的数据进行操作，造成用户对导入数据的操作效率较低，且对用户导入的数据量进行限制，系统不能预估需导入的数据量，造成用户导入较多数据时才超限以造成导入失败，从而导入数据的性能较差，以及浪费用户时间和计算资源。
[0004]第二，当对导入数据合并之后再对用户进行展示时，对所有的导入数据进行合并，造成合并导入数据的时间较长，合并数据的效率较低，导致用户等待的时间较长，导入数据的性能较差。
[0005]该
技术介绍
部分中所公开的以上信息仅用于增强对本专利技术构思的背景的理解，并因此，其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案...

【技术保护点】

【技术特征摘要】
1.一种数据文件合并方法，包括：根据所接收的各个导入数据组，确定所接收的各个导入数据组所对应的各个导入数据文件，其中，所述各个导入数据组中的导入数据组对应所述各个导入数据文件中的导入数据文件；根据所述各个导入数据文件，确定所述各个导入数据文件的数量是否满足预设数量条件；响应于确定所述各个导入数据文件的数量满足所述预设数量条件，根据所述各个导入数据文件，确定各个目标数据文件；将所述各个目标数据文件组合为目标数据文件队列；响应于确定所述目标数据文件队列中的各个目标数据文件满足合并条件，对所述各个目标数据文件进行合并，以生成合并数据文件。2.根据权利要求1所述的方法，其中，在所述根据所接收的各个导入数据组，确定所接收的各个导入数据组所对应的各个导入数据文件之前，所述方法还包括：响应于接收到导入数据组，执行以下更新步骤：根据所述导入数据组，生成对应所接收的导入数据组的导入数据文件和元数据；将所述导入数据文件添加至导入数据文件集合，以对所述导入数据文件集合进行更新；将所述元数据添加至元数据集合，以对所述元数据集合进行更新。3.根据权利要求2所述的方法，其中，在所述根据所述各个导入数据文件，确定所述各个导入数据文件的数量是否满足预设数量条件之后，所述方法还包括：响应于确定所述各个导入数据文件的数量不满足所述预设数量条件，确定是否存在满足预设新增条件的导入数据组；响应于确定存在满足所述预设新增条件的导入数据组，根据满足所述预设新增条件的导入数据组，执行所述更新步骤。4.根据权利要求2所述的方法，其中，在所述将所述各个目标数据文件组合为目标数据文件队列之后，所述方法还包括：根据所述目标数据文件队列，执行以下步骤：将所述目标数据文件队列发送至合并处理线程；确定是否存在满足预设新增条件的导入数据组；响应于确定存在满足预设新增条件的导入数据组，根据满足预设新增条件的导入数据组，执行所述更新步骤。5.根据权利要求1所述的方法，其中，在所述将所述各个目标数据文件组合为目标数据文件队列之后，所述方法还包括：对于目标数据文件队列，执行以下扫描步骤：对目标数据文件队列进行扫描；确定目标数据文件队列中的各个目标数据文件是否均满足所述合并条件；响应于确定目标数据文件队列中的各个目标数据文件均不满足所述合并条件，根据所更新的各个目标数据文件所组合的目标数据文件队列，再次执行所述扫描步骤。6.根据权利要求5所述的方法，其中，在所述响应于确定所述目标数据文件队列中的各
个目标数据文件满足合并条件，对所述各个目标数据文件进行合并，以生成合并数据文件之后，所述方法还包括：根据所述合并数据文件中各个目标数据文件的各个序号，生成对应所述合并数据文件的文件名称作为第一文件名称；根据所述合并数据文件，生成对应所述合并数据文件的元数据作为目标元数据；根据所述合并数据文件，确定对应所述合并数据文件的各个导入数据组；删除元数据集合中对应所确定的各个导入数据组的各个元数据；将所述目标元数据添加至元数据集合，以对元数据集合进行更新；根据所更新的各个目标数据文件所组合的目标数据文件队列，再次执行所述扫描步骤。7.根据权利要求6所述的方法，其中，在所述响应于确定所述目标数据文件队列中的各个目标数据文件满足合并条件，对所述各个目标数据文件进行合并，以生成合并数据文件之后，所...

【专利技术属性】
技术研发人员：张正宇，
申请(专利权)人：北京飞轮数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人