数据提取方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:29673085 阅读:18 留言:0更新日期:2021-08-13 21:54
本公开提出一种数据提取方法、装置、计算机设备及存储介质,该方法包括:确定第一数据的第一标识;根据第一标识,确定与第一数据对应的数据依赖关系,数据依赖关系包括:第一标识,以及与第一数据存在依赖关系的第二数据的第二标识;根据数据依赖关系,生成目标层级关系,目标层级关系,描述第一数据和第二数据之间的存储关系;根据第一标识提取第一数据,并根据第二标识提取第二数据;以及根据目标层级关系对第一数据和第二数据进行存储。通过本公开能够实现在数据提取的过程中,有效地降低数据之间依赖关系描述的复杂度,有效地辅助提升数据提取效率,保障数据提取的完整性和准确性,提升数据提取效果。

【技术实现步骤摘要】
数据提取方法、装置、计算机设备及存储介质
本公开涉及计算机
,尤其涉及一种数据提取方法、装置、计算机设备及存储介质。
技术介绍
在工程实践中,通常会涉及大批量的业务数据提取与复制,例如,将A业务场景中的数据A批量提取复制至B业务场景中,在数据提取与复制过程中,通常采用编写计算机程序代码的方式,将业务场景中的全部数据的提取复制处理逻辑写入计算机程序代码中,从而计算机程序代码可能会包含:全部数据的数据关系、数据提取和数据恢复以及定制化操作等一系列处理逻辑相关的程序代码段。这种方式下,业务场景中数据之间的数据关系的描述较为复杂,从而导致数据关系变更困难,较难维护,数据提取成本较高,影响数据提取的效率和准确性。
技术实现思路
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本公开的目的在于提出一种数据提取方法、装置、计算机设备及存储介质,能够有效地实现在数据提取的过程中,有效地降低数据之间依赖关系描述的复杂度,有效地辅助提升数据提取效率,保障数据提取的完整性和准确性,提升数据提取效果。为达到上述目的,本公开第一方面实施例提出的数据提取方法,包括:确定第一数据的第一标识;根据所述第一标识,确定与所述第一数据对应的数据依赖关系,所述数据依赖关系包括:所述第一标识,以及与所述第一数据存在依赖关系的第二数据的第二标识;根据所述数据依赖关系,生成目标层级关系,所述目标层级关系,描述第一数据和所述第二数据之间的存储关系;根据所述第一标识提取所述第一数据,并根据所述第二标识提取所述第二数据;以及根据所述目标层级关系对所述第一数据和所述第二数据进行存储。本公开第一方面实施例提出的数据提取方法,通过确定第一数据的第一标识,根据第一标识,确定与第一数据对应的数据依赖关系,数据依赖关系包括:第一标识,以及与第一数据存在依赖关系的第二数据的第二标识,并根据数据依赖关系,生成目标层级关系,目标层级关系,描述第一数据和第二数据之间的存储关系,根据第一标识提取第一数据,并根据第二标识提取第二数据,以及根据目标层级关系对第一数据和第二数据进行存储,实现在数据提取的过程中,有效地降低数据之间依赖关系描述的复杂度,有效地辅助提升数据提取效率,保障数据提取的完整性和准确性,提升数据提取效果。为达到上述目的,本公开第二方面实施例提出的数据提取装置,包括:第一确定模块,用于确定第一数据的第一标识;第二确定模块,用于根据所述第一标识,确定与所述第一数据对应的数据依赖关系,所述数据依赖关系包括:所述第一标识,以及与所述第一数据存在依赖关系的第二数据的第二标识;生成模块,用于根据所述数据依赖关系,生成目标层级关系,所述目标层级关系,描述第一数据和所述第二数据之间的存储关系;提取模块,用于根据所述第一标识提取所述第一数据,并根据所述第二标识提取所述第二数据;以及存储模块,用于根据所述目标层级关系对所述第一数据和所述第二数据进行存储。。本公开第二方面实施例提出的数据提取装置,通过确定第一数据的第一标识,根据第一标识,确定与第一数据对应的数据依赖关系,数据依赖关系包括:第一标识,以及与第一数据存在依赖关系的第二数据的第二标识,并根据数据依赖关系,生成目标层级关系,目标层级关系,描述第一数据和第二数据之间的存储关系,根据第一标识提取第一数据,并根据第二标识提取第二数据,以及根据目标层级关系对第一数据和第二数据进行存储,实现在数据提取的过程中,有效地降低数据之间依赖关系描述的复杂度,有效地辅助提升数据提取效率,保障数据提取的完整性和准确性,提升数据提取效果。本公开第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的数据提取方法。本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的数据提取方法。本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如本公开第一方面实施例提出的数据提取方法。本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。附图说明本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本公开一实施例提出的数据提取方法的流程示意图;图2是本公开实施例中数据源之间的数据依赖关系示意图;图3是本公开实施例中数据源之内的数据依赖关系示意图;图4是本公开实施例中数据提取流程示意图;图5是本公开实施例中数据提取装置的结构示意图;图6是本公开另一实施例提出的数据提取方法的流程示意图;图7是本公开一实施例提出的数据提取装置的结构示意图;图8是本公开另一实施例提出的数据提取装置的结构示意图;图9示出了适于用来实现本公开实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制。相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本公开一实施例提出的数据提取方法的流程示意图。其中,需要说明的是,本实施例的数据提取方法的执行主体为数据提取装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。本公开能够解决在提取与复制业务模块的数据过程中,数据的提取过程存在的技术问题,在提取业务模块的数据的应用场景中,为了实现将数据完整复制到多种环境中(如本业务所属环境中的另一个业务,其它线上环境以及其它公司本地私有化环境),可以将数据导出并存储至本地和/或云服务器。如图1所示,该数据提取方法,包括:S101:确定第一数据的第一标识。其中,当前待提取的数据,可以被称为第一数据,第一数据,可以是一张数据表中的字段,或者也可以是一张数据表中的全部数据,该第一数据,还可以是业务场景的业务模块A中的数据,在执行数据提取任务时,可以将第一数据提取至数据提取装置的本地存储介质中,对此不做限制。其中,用于描述第一数据的标识,可以被称为第一标识,该第一标识,可以例如第一数据在数据表中的身份标识号(Identitydocument,ID)号,对此不做限制。举例而言,可以接收数据提取请求,从数据提取请求之中解析得到第一数据的第一标识,而后可以触发后续步骤。S102:根据第一标识,确定与第一数据对应的数据依赖关系,数据依赖关系包括:第一标识,以及与第一数据存在依赖关系的第二数据的第二标识。上述确定第一数据的第一标识之后,可以根据本文档来自技高网...

【技术保护点】
1.一种数据提取方法,其特征在于,所述方法包括:/n确定第一数据的第一标识;/n根据所述第一标识,确定与所述第一数据对应的数据依赖关系,所述数据依赖关系包括:所述第一标识,以及与所述第一数据存在依赖关系的第二数据的第二标识;/n根据所述数据依赖关系,生成目标层级关系,所述目标层级关系,描述第一数据和所述第二数据之间的存储关系;/n根据所述第一标识提取所述第一数据,并根据所述第二标识提取所述第二数据;以及/n根据所述目标层级关系对所述第一数据和所述第二数据进行存储。/n

【技术特征摘要】
1.一种数据提取方法,其特征在于,所述方法包括:
确定第一数据的第一标识;
根据所述第一标识,确定与所述第一数据对应的数据依赖关系,所述数据依赖关系包括:所述第一标识,以及与所述第一数据存在依赖关系的第二数据的第二标识;
根据所述数据依赖关系,生成目标层级关系,所述目标层级关系,描述第一数据和所述第二数据之间的存储关系;
根据所述第一标识提取所述第一数据,并根据所述第二标识提取所述第二数据;以及
根据所述目标层级关系对所述第一数据和所述第二数据进行存储。


2.如权利要求1所述的方法,其特征在于,在所述确定第一数据的第一标识之后,还包括:
确定与所述第一标识对应的第一数据源信息;
所述根据所述第一标识提取所述第一数据,包括:
从所述第一数据源信息指示的第一数据源之中,提取与所述第一标识对应的数据并作为所述第一数据。


3.如权利要求2所述的方法,其特征在于,所述数据依赖关系还包括:与所述第二标识对应的第二数据源信息,其中,所述根据所述第一标识提取所述第一数据,并根据所述第二标识提取所述第二数据,包括:
在根据所述第一标识提取所述第一数据的同时,从所述第二数据源信息指示的第二数据源之中,提取与所述第二标识对应的数据并作为所述第二数据。


4.如权利要求2所述的方法,其特征在于,所述根据所述数据依赖关系,生成目标层级关系,包括:
确定所述第一标识和所述第二标识之间的依赖关系类型;
根据所述依赖关系类型生成所述目标层级关系。


5.如权利要求4所述的方法,其特征在于,所述依赖关系类型包括:字段类型的依赖关系,和/或数据表类型的依赖关系,和/或数据源类型的依赖关系,其中,所述根据所述依赖关系类型生成所述目标层级关系,包括...

【专利技术属性】
技术研发人员:李晴阳姬宁李柏润
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1