数据血缘分析方法、装置、终端设备及计算机程序产品制造方法及图纸

技术编号:44819983 阅读:33 留言:0更新日期:2025-03-28 20:09
本申请适用于人工智能技术领域,提供了一种数据血缘分析方法、装置、终端设备及计算机程序产品,包括:获取待查询语句,并确定与待查询语句对应的元数据信息;基于待查询语句和元数据信息,构建得到图结构数据;图结构数据包括多个节点和多条边,基于图结构数据和图注意力网络,得到与待查询语句对应的数据血缘分析结果;图注意力网络包括多头注意力层,多头注意力层用于捕捉不同类型的节点关系。与现有技术相比,本申请结合图注意力网络对待查询语句对应的图结构数据进行血缘分析,提高了数据血缘分析的准确率和细粒度;同时,多头注意力层可以捕捉不同类型的节点关系,从而可以得到更为全面且丰富的理解,从而提高了对数据血缘分析的准确率。

【技术实现步骤摘要】

本申请属于人工智能,尤其涉及一种数据血缘分析方法、装置、终端设备及计算机程序产品


技术介绍

1、目前,数据已成为企业和组织的核心资产。随着数据量呈指数级增长,数据处理流程日益复杂化,准确理解和追踪数据的来源、流动和转换过程变得至关重要。这一需求催生了数据血缘分析技术的发展,旨在揭示数据在复杂系统中的流动路径和相互依赖关系。其中,数据血缘(data lineage),又称为数据血统、数据起源、数据谱系,是指在数据的全生命周期中,从数据的产生、处理、加工、融合、流转到最终消亡,数据之间自然形成的一种类似人类血缘的关联关系。

2、现有的数据血缘分析方法通常是采用元数据分析方式,即基于数据库的元数据信息构建血缘关系。然而,现有技术难以发现复杂查询中的细粒度数据转换,从而降低了数据血缘分析的准确率。


技术实现思路

1、本申请实施例提供了一种数据血缘分析方法、装置、终端设备及计算机程序产品,以解决现有技术中存在的难以发现复杂查询中的细粒度数据转换,从而降低了数据血缘分析的准确率的问题。</p>

2、第一本文档来自技高网...

【技术保护点】

1.一种数据血缘分析方法,其特征在于,包括:

2.如权利要求1所述的数据血缘分析方法,其特征在于,所述基于所述待查询语句和所述元数据信息,构建得到图结构数据,包括:

3.如权利要求1所述的数据血缘分析方法,其特征在于,所述数据血缘分析结果为血缘关系图;所述基于所述图结构数据和图注意力网络,得到与所述待查询语句对应的数据血缘分析结果,包括:

4.如权利要求3所述的数据血缘分析方法,其特征在于,所述图注意力网络包括所述输入层、多头注意力层以及多层图卷积层;所述将所述图结构数据输入至所述图注意力网络进行处理,得到所述图结构数据中的每个所述节点对应的节点向量,...

【技术特征摘要】

1.一种数据血缘分析方法,其特征在于,包括:

2.如权利要求1所述的数据血缘分析方法,其特征在于,所述基于所述待查询语句和所述元数据信息,构建得到图结构数据,包括:

3.如权利要求1所述的数据血缘分析方法,其特征在于,所述数据血缘分析结果为血缘关系图;所述基于所述图结构数据和图注意力网络,得到与所述待查询语句对应的数据血缘分析结果,包括:

4.如权利要求3所述的数据血缘分析方法,其特征在于,所述图注意力网络包括所述输入层、多头注意力层以及多层图卷积层;所述将所述图结构数据输入至所述图注意力网络进行处理,得到所述图结构数据中的每个所述节点对应的节点向量,包括:

5.如权利要求3所述的数据血缘分析方法,其特征在于,所述数据流动路径包括在不同设定数据粒度级别下的目标流动路径;所述基于各个所述节点向量,确定数据流动路径,包括:

6.如权利要求1-5任意一项所述的数据血缘分析方法,其特征在于,所述数据血缘分析结果为血缘关系图,所述血缘关系图包括数据流动路径,所述数据流动路径包括多个数据节点;在所述基于所述图结构数据和图注意力网络,得到与所述待查询语句对应的数据血缘分析结果之后,还包括:

7.如权利要求1...

【专利技术属性】
技术研发人员:包涵
申请(专利权)人:上海思格源智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1