基于图模型的数据血缘关系存储方法、系统、介质和设备技术方案

技术编号：22135343 阅读：28 留言：0更新日期：2019-09-18 09:03

本发明专利技术提供一种基于图模型的数据血缘关系存储方法，包括：解析数据加工脚本中的SQL语句；创建初始图模型；将所述解析结果与初始图模型关联；重复以上操作，遍历所有数据加工脚本中的SQL语句，生成一血缘关系图模型。本发明专利技术实施例的上述方案利用图模型直接将数据作为图的节点、关系、属性存储到图数据库中，无需预先设计复杂的关系型数据表结构，大幅降低了此类场景的设计难度和复杂度；第二，得益于图数据库Neo4j的内存计算机制和优化的数据结构，在大量数据下，能够在几毫秒内快速完成数据血缘上下游层级数量、依赖表数量的统计，以及快速完成数据字段和数据表依赖关系的检索。

Data Kinship Storage Method, System, Media and Equipment Based on Graph Model

全部详细技术资料下载

【技术实现步骤摘要】
基于图模型的数据血缘关系存储方法、系统、介质和设备
本专利技术涉及软件
，具体而言，涉及一种基于图模型的数据血缘关系存储方法、系统、介质和电子设备。
技术介绍
现有技术中，数据仓库为了支持不同的业务会产生大量的数据表与数据，当排查数据质量问题、清理冗余数据及研究数据流向链路的时候，难以快速理清大量数据之间的血缘依赖关系。通常采用人工记录或基于mysql等关系型数据库的形式来存储基于图模型的数据血缘关系，然而，这种方式复杂度较高、容易出错、无法支持复杂的数据血缘分析、难以应对在大规模数据下的性能要求。因此，在长期的研发当中，专利技术人对基于图模型的数据血缘关系的存储进行了大量的研究，提出了一种基于图模型的数据血缘关系存储方法，以解决上述技术问题之一。
技术实现思路
本专利技术的目的在于提供一种基于图模型的数据血缘关系存储方法、系统、介质和电子设备，能够解决上述提到的至少一个技术问题。具体方案如下：根据本专利技术的具体实施方式，第一方面，本专利技术提供一种基于图模型的数据血缘关系存储方法，其特征在于，包括：解析数据加工脚本中的SQL语句；创建初始图模型；将所述解析结果与初始图模型关联；重复以上操作，遍历所有数据加工脚本中的SQL语句，生成一血缘关系图模型。其中，所述解析数据加工脚本中的SQL语句之后，包括：获取数据源表名称及字段名称、数据目标表名称及字段名称、数据源表与数据目标表字段之间的关系。其中，所述创建初始图模型具体包括：在图数据库Neo4j中创建初始图模型。其中，所述将所述解析结果与初始图模型关联包括：将所述数据源表字段名称及所述数据目标表字段名称分...

【技术保护点】
1.一种基于图模型的数据血缘关系存储方法，其特征在于，包括：解析数据加工脚本中的SQL语句；创建初始图模型；将所述解析结果与初始图模型关联；重复以上操作，遍历所有数据加工脚本中的SQL语句，生成一血缘关系图模型。

【技术特征摘要】
1.一种基于图模型的数据血缘关系存储方法，其特征在于，包括：解析数据加工脚本中的SQL语句；创建初始图模型；将所述解析结果与初始图模型关联；重复以上操作，遍历所有数据加工脚本中的SQL语句，生成一血缘关系图模型。2.根据权利要求1所述的方法，其特征在于，其中所述解析数据加工脚本中的SQL语句之后，包括：获取数据源表名称及字段名称、数据目标表名称及字段名称、数据源表与数据目标表字段之间的关系。3.根据权利要求2所述的方法，其特征在于，其中所述创建初始图模型具体包括：在图数据库Neo4j中创建初始图模型。4.根据权利要求3所述的方法，其特征在于，其中所述将所述解析结果与初始图模型关联包括：将所述数据源表字段名称及所述数据目标表字段名称分别作为所述初始图模型的节点，写入所述图数据库Neo4j。5.根据权利要求3所述的方法，其特征在于，其中所述将所述解析结果与初始图模型关联还包括：将所述数据源表名称及所述数据目标表名称分别作为所述初始图模型节点的属性，写入所述图数据库Neo4j。6.根据权利要求3所述的方法，其特征在于，其中所述将所述解析结果与初始图模型关联包括：将所述数据源表字段名称及所述数据目标表字段名称的关系作为所述初始图模型的边，写入所述图数据库Neo4j。...

【专利技术属性】
技术研发人员：陈政，潘强，蔡灿，张翼飞，
申请(专利权)人：重庆天蓬网络有限公司，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人