数据存储方法和数据存储装置制造方法及图纸

技术编号:38086104 阅读:13 留言:0更新日期:2023-07-06 08:54
本申请提供了一种数据存储方法和数据存储装置,涉及数据库领域,应用于包括多个源文件系统服务器和数据湖服务器的系统,实现了对文件数据的统一检索,有利于提高文件数据的检索效率。该方法包括:获取多个源文件系统服务器存储的文件数据的第一元数据;建立文件数据在多个源文件系统服务器所在的目录与上述数据湖服务器中预设目录之间的第一映射关系,以及上述文件数据在上述多个源文件系统服务器的属性名称与上述数据湖服务器中预设属性名称之间的第二映射关系;基于第一映射关系和上述第二映射关系,确定第二元数据;将文件数据和上述第二元数据同步存储至数据湖服务器中,并建立文件数据与上述第二元数据之间的对应关系。关系。关系。

【技术实现步骤摘要】
数据存储方法和数据存储装置


[0001]本申请涉及数据库领域,尤其涉及一种数据存储方法和数据存储装置。

技术介绍

[0002]目前在油田系统中的文件数据(包括文档,地震数据和测井曲线数据)分布在各个专业系统和统建系统中,其中元数据部分存储在不同的数据库中的不同库表结构中,文件体存储在不同的介质中。
[0003]但是,分散存储文件数据的方法,存在无法对上述文件数据统一检索、分析的问题,导致检索效率较低。

技术实现思路

[0004]本申请提供一种数据存储方法和数据存储装置,实现了对文件数据的统一检索,有利于提高文件数据的检索效率。
[0005]第一方面,提供了一种数据存储方法,应用于包括多个源文件系统服务器和数据湖服务器的系统,包括:获取上述多个源文件系统服务器存储的文件数据的第一元数据,上述第一元数据包括上述文件数据的在上述多个源文件系统服务器所在的目录、上述文件数据在上述多个源文件系统服务器的属性名称以及上述属性名称对应的属性值;建立上述文件数据在上述多个源文件系统服务器所在的目录与上述数据湖服务器中预设目录之间的第一映射关系,以及上述文件数据在上述多个源文件系统服务器的属性名称与上述数据湖服务器中预设属性名称之间的第二映射关系;基于上述第一映射关系和上述第二映射关系,确定第二元数据,上述第二元数据包括上述预设目录和上述预设属性名称;将上述文件数据和上述第二元数据同步存储至上述数据湖服务器中,并建立上述文件数据与上述第二元数据之间的对应关系。
[0006]在本申请中,通过将分散存储在多个文件系统服务器中的文件数据用统一的数据结构存储至数据湖中,解决了分散存储带来的不能统一检索上述文件数据的问题,有效提高后续对文件数据的检索效率,进而还有利于后续对文件数据的统一管理或者使用。此外,本申请保留了源系统中文件数据的各种属性信息,即在不丢失源系统中文件数据与其他数据的关联关系的前提下,提高对文件数据的检索效率。
[0007]结合第一方面,在第一方面的某些实现方式中,上述方法还包括:向检索服务器发送上述文件数据的索引信息,上述索引信息用于对上述文件数据进行检索。
[0008]结合第一方面,在第一方面的某些实现方式中,上述索引信息包括下列至少一个:上述文件数据的名称、上述文件数据的标识、上述文件数据的创建时间、上述文件数据的大小、上述预设属性名称以及上述预设属性名称对应的属性值。
[0009]结合第一方面,在第一方面的某些实现方式中,来自上述多个源文件系统服务器中的不同源文件系统服务器的上述文件数据在上述数据湖服务器中的存储路径的命名方式统一。
[0010]第二方面,提供了一种数据存储装置,包括获取模块和处理模块,其中获取模块用于:获取上述多个源文件系统服务器存储的文件数据的第一元数据,上述第一元数据包括上述文件数据在上述多个源文件系统服务器所在的目录、上述文件数据在上述多个源文件系统服务器的属性名称以及上述属性名称对应的属性值;处理模块用于:建立上述文件数据在上述多个源文件系统服务器所在的目录与预设目录之间的第一映射关系,以及上述文件数据在上述多个源文件系统服务器的属性名称与预设属性名称之间的第二映射关系;基于上述第一映射关系和上述第二映射关系,确定第二元数据,上述第二元数据包括上述上述预设目录和上述预设属性名称;以及,将上述文件数据和上述第二元数据同步存储至上述数据湖服务器中,并建立上述文件数据与上述第二元数据之间的对应关系。
[0011]结合第二方面,在第二方面的某些实现方式中,上述处理模块用于:向检索服务器发送上述文件数据的索引信息,上述索引信息用于对上述文件数据进行检索。
[0012]结合第二方面,在第二方面的某些实现方式中,上述索引信息包括下列至少一个:上述文件数据的名称、上述文件数据的标识、上述文件数据的创建时间、上述文件数据的大小、上述预设属性名称以及上述预设属性名称对应的属性值。
[0013]结合第二方面,在第二方面的某些实现方式中,来自上述多个源文件系统服务器中的不同源文件系统服务器的上述文件数据在上述数据湖服务器中的存储路径的命名方式统一。
[0014]第三方面,提供了一种处理器,包括:输入电路、输出电路和处理电路。处理电路用于通过输入电路接收信号,并通过输出电路发射信号,使得处理器执行上述第一方面中任一种可能实现方式中的方法。
[0015]在具体实现过程中,上述处理器可以为芯片,输入电路可以为输入管脚,输出电路可以为输出管脚,处理电路可以为晶体管、门电路、触发器和各种逻辑电路等。输入电路所接收的输入的信号可以是由例如但不限于接收器接收并输入的,输出电路所输出的信号可以是例如但不限于输出给发射器并由发射器发射的,且输入电路和输出电路可以是同一电路,该电路在不同的时刻分别用作输入电路和输出电路。本申请实施例对处理器及各种电路的具体实现方式不做限定。
[0016]第四方面,提供了一种处理装置,包括处理器和存储器。该处理器用于读取存储器中存储的指令,并可通过接收器接收信号,通过发射器发射信号,以执行上述第一方面中任一种可能实现方式中的方法。
[0017]可选地,处理器为一个或多个,存储器为一个或多个。
[0018]可选地,存储器可以与处理器集成在一起,或者存储器与处理器分离设置。
[0019]在具体实现过程中,存储器可以为非瞬时性(non

transitory)存储器,例如只读存储器(read only memory,ROM),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。
[0020]上述第四方面中的处理装置可以是一个芯片,该处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于该处理器之外,独立存在。
[0021]第五方面,提供了一种计算机程序产品,计算机程序产品包括:计算机程序(也可以称为代码,或指令),当计算机程序被运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
[0022]第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)当其在计算机上运行时,使得计算机执行上述第一方面中任一种可能实现方式中的方法。
附图说明
[0023]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本申请实施例提供的系统架构的示意图;
[0025]图2是本申请实施例提供的数据存储方法的示意性流程图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法,其特征在于,应用于包括多个源文件系统服务器和数据湖服务器的系统,所述方法包括:获取所述多个源文件系统服务器存储的文件数据的第一元数据,所述第一元数据包括所述文件数据在所述多个源文件系统服务器所在的目录、所述文件数据在所述多个源文件系统服务器的属性名称以及所述属性名称对应的属性值;建立所述文件数据在所述多个源文件系统服务器所在的目录与所述数据湖服务器中预设目录之间的第一映射关系,以及所述文件数据在所述多个源文件系统服务器的属性名称与所述数据湖服务器中预设属性名称之间的第二映射关系;基于所述第一映射关系和所述第二映射关系,确定第二元数据,所述第二元数据包括所述预设目录和所述预设属性名称;将所述文件数据和所述第二元数据同步存储至所述数据湖服务器中,并建立所述文件数据与所述第二元数据之间的对应关系。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:向检索服务器发送所述文件数据的索引信息,所述索引信息用于对所述文件数据进行检索。3.根据权利要求2所述的方法,其特征在于,所述索引信息包括下列至少一个:所述文件数据的名称、所述文件数据的标识、所述文件数据的创建时间、所述文件数据的大小、所述预设属性名称以及所述预设属性名称对应的属性值。4.根据权利要求1至3中任一项所述的方法,其特征在于,来自所述多个源文件系统服务器中的不同源文件系统服务器的所述文件数据在所述数据湖服务器中的存储路径的命名方式统一。5.一种数据存储装置,其特征在于,包括:获取模块,用于获取多个源文件系统服务器存储的文件数据的第一元数...

【专利技术属性】
技术研发人员:杨勇孟令培刘君琦赵秋生张骁
申请(专利权)人:昆仑数智科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1