【技术实现步骤摘要】
控制数据产品生命周期的方法、装置及电子设备
[0001]本公开涉及数据处理
,进一步涉及大数据领域,尤其涉及一种控制数据产品生命周期的方法、装置及电子设备。
技术介绍
[0002]数据产品生命周期管理,是指在大数据处理环节中,对数据产品的关键信息和状态进行管理的技术。在当今的互联网大数据时代,每个企业都会生产、加工大量高价值数据,这些数据具备规模大、链路长、参与角色多的特点,随着企业大数据爆炸式增长,必然引发数据追踪、数据管理、数据安全等实际问题,因此,数据治理成为了企业必需开展的重要工作。
[0003]相关技术在进行数据治理时,一般采用基于数据挂载的数据产品管理机制和基于自动退场与信息同步的数据产品生命周期管理机制。其中,基于数据挂载的数据产品管理机制能够提供简单的数据产品信息管理及检索的功能,但是无法进行数据产品生命周期的管理,在长时间运行后,数据产品信息的可靠性变差;基于自动退场与信息同步的数据产品生命周期管理机制能够保障数据产品信息的准确性与实时性,但是在复杂数据链路场景下无法准确管理数据产品生命周期。
技术实现思路
[0004]本公开提供了一种控制数据产品生命周期的方法、装置及电子设备,以至少解决相关技术对于数据产品生命周期进行管理时的可靠性低下的技术问题。
[0005]根据本公开的一方面,提供了一种控制数据产品生命周期的方法,包括:获取目标数据产品在数据生命周期中不同阶段分别对应的数据产品属性,其中,数据生命周期包括:多个阶段,目标数据产品在数据生命周期中不同阶段之间 ...
【技术保护点】
【技术特征摘要】
1.一种控制数据产品生命周期的方法,包括:获取目标数据产品在数据生命周期中不同阶段分别对应的数据产品属性,其中,所述数据生命周期包括:多个阶段,所述目标数据产品在所述数据生命周期中不同阶段之间进行状态流转;按照所述数据产品属性确定所述数据生命周期中不同阶段对应的数据适用范围;基于所述目标数据产品在所述数据生命周期中不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行数据约束审核,得到审核结果;利用所述审核结果重新调整所述目标数据产品在所述数据生命周期中不同阶段之间的状态流转。2.根据权利要求1所述的方法,其中,所述多个阶段用于描述所述目标数据产品的数据生产、数据使用以及数据下线整个过程,所述多个阶段包括:初始化阶段、创建中阶段、已创建阶段、待发布阶段、已校验阶段、已部署阶段、已发布阶段、已下线阶段。3.根据权利要求2所述的方法,其中,所述数据产品属性包括:基本信息、元信息、负责人信息、产出周期信息、时效信息、优先级信息。4.根据权利要求3所述的方法,其中,获取所述目标数据产品在所述数据生命周期中不同阶段分别对应的数据产品属性包括:在所述初始化阶段获取所述基本信息;在所述已创建阶段获取所述元信息;在所述已部署阶段以及后续阶段获取所述产出周期信息、所述时效信息和所述优先级信息;在所述已发布阶段获取所述负责人信息。5.根据权利要求3所述的方法,其中,按照所述数据产品属性确定所述数据生命周期中不同阶段对应的数据适用范围包括:按照所述基本信息和所述元信息,确定所述数据生命周期中的第一部分数据的第一适用范围,其中,所述第一适用范围用于表示所述第一部分数据对调试作业处于可见状态,所述第一部分数据包括:目标租户已创建数据和除所述目标租户之外其余租户已发布数据;按照所述基本信息、所述元信息、所述产出周期信息、所述时效信息和所述优先级信息,确定所述数据生命周期中的第二部分数据的第二适用范围,其中,所述第二适用范围用于表示所述第二部分数据对第一例行作业处于可见状态,所述第二部分数据包括:所述目标租户已部署数据和除所述目标租户之外其余租户已发布数据;按照所述基本信息、所述元信息、所述产出周期信息、所述时效信息、所述优先级信息和所述负责人信息,确定所述数据生命周期中的第三部分数据的第三适用范围,其中,所述第三适用范围用于表示所述第三部分数据对第二例行作业处于可见状态,所述第三部分数据包括:所有租户已发布数据。6.根据权利要求3所述的方法,其中,基于所述目标数据产品在所述数据生命周期中不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行数据约束审核,得到所述审核结果包括:基于所述目标数据产品在所述已下线阶段之前不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行第一约束审核,得到第一审核结果,其中,所述第一审核结
果用于审核所述时效信息;基于所述目标数据产品在所述已下线阶段之前不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行第二约束审核,得到第二审核结果,其中,所述第二审核结果用于审核更改后的时效信息对血缘链路中的上游数据和下游数据的影响;基于所述目标数据产品在所述已下线阶段之前不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行第三约束审核,得到第三审核结果,其中,所述第三审核结果用于审核所述目标数据产品的作业成功率。7.根据权利要求3所述的方法,其中,基于所述目标数据产品在所述数据生命周期中不同阶段对应的数据状态和数据适用范围,对所述目标数据产品进行数据约束审核,得到所述审核结果包括:基于所述目标数据产品在所述已下线阶段对应的数据状态和数据适用范围,对所述目标数据产品进行第四约束审核,得到第四审核结果,其中,所述第四审核结果用于审核所述目标数据产品是否被血缘链路中的下游数据所引用;基于所述目标数据产品在所述已下线阶段对应的数据状态和数据适用范围,对所述目标数据产品进行第五约束审核,得到第五审核结果,其中,所述第五审核结果用于审核所述目标数据产品是否不再产生数据。8.一种控制数据产品生命周期的装置,包括:获取模块,用于获取目标数据产品在数据生命周期中不同阶段分别对应的数据产品属性,其中,所述数据生命周期包括:多个阶段...
【专利技术属性】
技术研发人员:崔金涛,叶玮彬,刘涛,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。