构建字段血缘树的方法、装置、存储介质以及终端制造方法及图纸

技术编号:46609872 阅读:0 留言:0更新日期:2025-10-14 21:08
本说明书实施例公开了一种构建字段血缘树的方法、装置、存储介质以及终端。首先获取目标字段、其数据库查询语句及上游血缘信息,以目标字段为根节点,生成封装其计算逻辑的第一可执行计算函数,使计算过程显性化、模块化。通过解析该函数的输入参数,自动识别并确立直接依赖的上游字段作为子节点。随后递归处理各子节点,生成对应的计算函数并解析其依赖,层层追溯直至所有叶子节点(即原始底表字段),输出包含所有节点及对应计算函数的完整血缘树,并通过可视化接口展示。实现了从目标字段到原始数据源的自动化精准追溯,构建了可计算、可复用的血缘知识框架,为数据理解、问题排查及智能化数据服务提供了坚实基础。

【技术实现步骤摘要】

本说明书实施例涉及数据处理,尤其涉及一种构建字段血缘树的方法、装置、存储介质以及终端


技术介绍

1、当前,数据已经成为了企业大量生产经营活动所依赖的、不可或缺的信息,尤其在如今各种机器学习模型高速发展的时代,模型训练数据的质量直接影响着模型的收敛效率与精度。传统数据生产方案仍然普遍存在着知识面窄、指令单一等问题,并且由于传统方案对人工标注工作存在着高度依赖,这不仅消耗人力成本,人工生成的数据与应用场景中真实数据之间的偏差还会不断累积放大,进而损害模型的训练效果。在此背景下,如何得到可靠、优质的数据,已成为该领域中亟需解决的关键问题。


技术实现思路

1、本说明书实施例提供一种构建字段血缘树的方法、装置、存储介质以及终端,可以解决相关技术中生产过程中所使用的数据质量不佳的技术问题。

2、第一方面,本说明书实施例提供一种构建字段血缘树的方法,该方法包括:

3、获取目标表中的目标字段、上述目标表对应的数据库查询语句及上述目标字段依赖的上游血缘信息;

4、以上述目标字段为血缘树的根本文档来自技高网...

【技术保护点】

1.一种构建字段血缘树的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标字段、所述数据库查询语句及所述上游血缘信息,生成所述目标字段对应的第一可执行计算函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述目标字段、所述数据库查询语句及所述上游血缘信息,生成所述目标字段对应的第一计算逻辑包,包括:

4.根据权利要求3所述的方法,其特征在于,所述对各子节点执行递归调用操作,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取目标表中的目标字段、所述目标表对应的数据库查询语句及所述...

【技术特征摘要】

1.一种构建字段血缘树的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述目标字段、所述数据库查询语句及所述上游血缘信息,生成所述目标字段对应的第一可执行计算函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述目标字段、所述数据库查询语句及所述上游血缘信息,生成所述目标字段对应的第一计算逻辑包,包括:

4.根据权利要求3所述的方法,其特征在于,所述对各子节点执行递归调用操作,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取目标表中的目标字段、所述目标表对应的数据库查询语句及所述目标字段依赖的上游血缘信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述元信息确定所述目标表中满足预设条件的目标字段,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述每个字段的上游血缘信息,计算每个字段对应的血缘分数,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述将包含所有节点以及各节点对应可执行计算函数的血...

【专利技术属性】
技术研发人员:吴东明陈婷
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1