一种数据写入方法、装置、设备及可读存储介质制造方法及图纸

技术编号：35306099 阅读：21 留言：0更新日期：2022-10-22 12:56

本申请公开了一种数据写入方法、装置、设备及可读存储介质，该方法包括Flink接收配置文件，并从配置文件中读取任务信息；根据任务信息，获取任务对应的数据；从数据中读取分区字段，并根据分区字段，将数据写入文件系统中对应的时间分区；若数据为延迟发送的数据，则将数据写入文件系统的历史分区。通过配置文件得到任务信息，并根据任务信息获取对应的数据。从数据中可以读取并基于分区字段，便可将数据写入文件系统中对应的时间分区。解决了具体如何将数据匹配性写入文件系统中的各个分区。此外，对于延迟数据，将其写入到文件系统的历史分区，可以避免延迟数据过多，全写入正常分区中导致机器的文件句柄打开过多造成的集群问题。群问题。群问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据写入方法、装置、设备及可读存储介质

[0001]本申请涉及存储
，特别是涉及一种数据写入方法、装置、设备及可读存储介质。

技术介绍

[0002]将数据写入文件系统，常规的做法是使用flink内置封装的StreamingFileSink来进行实现。但是，在于分布式文件系统适配的过程中，仍然存在问题，如数据具体如何写入分布式文件系统中的分区，以及句柄打开过多等。
[0003]综上所述，如何有效地解决数据写入等问题，是目前本领域技术人员急需解决的技术问题。

技术实现思路

[0004]本申请的目的是提供一种数据写入方法、装置、设备及可读存储介质，能够有效解决数据写入问题。
[0005]为解决上述技术问题，本申请提供如下技术方案：
[0006]一种数据写入方法，包括：
[0007]Flink接收配置文件，并从所述配置文件中读取任务信息；
[0008]根据所述任务信息，获取任务对应的数据；
[0009]从所述数据中读取分区字段，并根据所述分区字段，将所述数据写入文件系统中对应的时间分区；
[0010]若所述数据为延迟发送的数据，则将所述数据写入所述文件系统的历史分区。
[0011]优选地，将所述数据写入文件系统中对应的时间分区，包括：
[0012]在所述数据的大小达到写入大小阈值，则执行将所述数据写入文件系统中对应的时间分区的步骤；
[0013]在所述数据大小未达到所述写入大小阈值的情况下，若超时未向所述文件系统写入数据...

【技术保护点】

【技术特征摘要】
1.一种数据写入方法，其特征在于，包括：Flink接收配置文件，并从所述配置文件中读取任务信息；根据所述任务信息，获取任务对应的数据；从所述数据中读取分区字段，并根据所述分区字段，将所述数据写入文件系统中对应的时间分区；若所述数据为延迟发送的数据，则将所述数据写入所述文件系统的历史分区。2.根据权利要求1所述的数据写入方法，其特征在于，将所述数据写入文件系统中对应的时间分区，包括：在所述数据的大小达到写入大小阈值，则执行将所述数据写入文件系统中对应的时间分区的步骤；在所述数据大小未达到所述写入大小阈值的情况下，若超时未向所述文件系统写入数据，则执行将所述数据写入文件系统中对应的时间分区的步骤。3.根据权利要求2所述的数据写入方法，其特征在于，超时未向所述文件系统写入数据，包括：若获取到定时产生的时钟数据，则确定超时未向所述文件系统写入数据。4.根据权利要求1所述的数据写入方法，其特征在于，所述接收配置文件，包括：接收配置文件夹；所述任务文件夹包括至少两个任务分别对应的所述配置文件。5.根据权利要求1所述的数据写入方法，其特征在于，将所述数据写入文件系统中对应的时间分区，包括：从数据库中获取所述数据对应的字段大小和字段类型；按照所述字段大小和所述字段类型，将所述数据写入文件系统中对应的时间分区。6.根据权利要求1所述的数据写入方法，其特征在于，还包括：从所述历史分区中读取暂存的延迟数据...

【专利技术属性】
技术研发人员：姜春阳，
申请(专利权)人：深圳市网心科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人