一种血缘关系图谱追溯方法及装置制造方法及图纸

技术编号:34015289 阅读:14 留言:0更新日期:2022-07-02 15:36
本发明专利技术涉及数据处理领域,揭露一种血缘关系图谱追溯方法及装置,所述方法包括:选择待入库数据文件的数据入库模型,根据数据入库模型抽取待入库数据文件的实体数据项,得到实体数据集;对实体数据集进行数据清洗,生成标准实体数据集;对标准实体数据集进行数据融合,得到融合实体数据集,建立融合实体数据集中数据之间的数据关系网络;对数据关系网络进行数据治理,得到标准数据关系网络;从预设的图数据库中选择标准实体数据集、标准数据关系网络对应的图数据库,得到目标图数据库,将标准实体数据集、标准数据关系网络导入至目标图数据库中,得到待入库数据文件的血缘关系图谱。本发明专利技术可以保障数据的深度分析和全面把控。发明专利技术可以保障数据的深度分析和全面把控。发明专利技术可以保障数据的深度分析和全面把控。

【技术实现步骤摘要】
一种血缘关系图谱追溯方法及装置


[0001]本专利技术涉及数据处理领域,尤其涉及一种血缘关系图谱追溯方法、装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]在目前信息系统中,存在关联关系的实体或模块之间,一般通过列表的方式进行展示,列表能够清晰、直观、方便的展示出各个实体或模块之间简单的关联关系,但是一般情况下,列表的形式只能展示两者或三者的关系,并不能直观的展示出所有的关联关系。
[0003]随着信息系统的发展,使用列表方式展示简单的关联关系已经满足不了更多维度,更深层次的关系展示,列表关系展示操作繁琐且关系显示不全面,这也会迫使用户在使用系统时,因无法全面直观的观察多维度、深层次的关系展示,从而无法实现数据的深度分析和全面把控。

技术实现思路

[0004]为了解决上述问题,本专利技术提供了一种血缘关系图谱追溯方法、装置、电子设备以及计算机可读存储介质,可以解决简单的关联关系无法满足更多维度,更深层次的数据关系展示的问题,从而可以保障数据的深度分析和全面把控。
[0005]第一方面,本专利技术提供了一种血缘关系图谱追溯方法,包括:
[0006]选择待入库数据文件的数据入库模型,并根据所述数据入库模型抽取所述待入库数据文件的实体数据项,得到实体数据集;
[0007]对所述实体数据集进行数据清洗,生成标准实体数据集;
[0008]对所述标准实体数据集进行数据融合,得到融合实体数据集,建立所述融合实体数据集中数据之间的数据关系网络;
[0009]对所述数据关系网络进行数据治理,得到标准数据关系网络;
[0010]从预设的图数据库中选择所述标准实体数据集、所述标准数据关系网络对应的图数据库,得到目标图数据库,将所述标准实体数据集、所述标准数据关系网络导入至所述目标图数据库中,得到所述待入库数据文件的血缘关系图谱。
[0011]在第一方面的一种可能实现方式中,所述选择待入库数据文件的数据入库模型,包括:
[0012]将所述待入库数据文件转换成固定格式的数据项集合;
[0013]识别所述数据项集合中的数据项,并对所述数据项进行数据分类,得到分类数据项;
[0014]根据所述分类数据项,从预设的数据模型库中选择待入库数据文件的数据入库模型。
[0015]在第一方面的一种可能实现方式中,所述根据所述数据入库模型抽取所述待入库数据文件的实体数据项,得到实体数据集,包括:
[0016]加载所述待入库数据文件的初始数据项;
[0017]建立所述初始数据项与所述数据入库模型之间的数据映射关系;
[0018]根据所述数据映射关系抽取所述待入库数据文件的初始数据项,得到实体数据集。
[0019]在第一方面的一种可能实现方式中,所述对所述实体数据集进行数据清洗,生成标准实体数据集,包括:
[0020]识别所述实体数据集中每个实体数据的实体数据项;
[0021]根据所述实体数据项配置所述实体数据集的数据清洗逻辑和数据清洗方式;
[0022]根据数据清洗逻辑和数据清洗方式,生成所述实体数据集的数据清洗规则;
[0023]根据所述实体数据集的数据清洗规则,执行对所述实体数据集的数据清洗,生成标准实体数据集。
[0024]在第一方面的一种可能实现方式中,所述对所述标准实体数据集进行数据融合,得到融合实体数据集,包括:
[0025]拆分所述标准实体数据集中每个标准实体数据的数据项,得到拆分数据项;
[0026]查询所述拆分数据项中的相同数据项,得到结果相同数据项;
[0027]根据所述相同数据项,对所述标准实体数据集进行数据融合,得到融合实体数据集。
[0028]在第一方面的一种可能实现方式中,所述建立所述融合实体数据集中数据之间的数据关系网络,包括:
[0029]建立所述融合实体数据集中数据之间的网络节点和节点关系;
[0030]通过所述网络节点和所述节点关系,构建所述所述融合实体数据集中数据之间的网络布局;
[0031]根据所述网络布局,生成所述融合实体数据集中数据之间的数据关系网络。
[0032]在第一方面的一种可能实现方式中,所述对所述数据关系网络进行数据治理,得到标准数据关系网络,包括:
[0033]挖掘所述数据关系网络的数据特征,得到所述数据关系网络的关系网络特征;
[0034]根据所述关系网络特征,制定所述数据关系网络的数据治理方案;
[0035]根据所述数据治理方案对所述数据关系网络进行数据治理,得到标准数据关系网络。
[0036]在第一方面的一种可能实现方式中,所述从预设的图数据库中选择所述标准实体数据集、所述标准数据关系网络对应的图数据库,得到目标图数据库,包括:
[0037]提取所述标准实体数据集、所述标准数据关系网络的特征,得到数据特征和网络特征;
[0038]将所述数据特征与预设的图数据库中的图数据库进行特征匹配,并将匹配成功的图数据库作为初始图数据库;
[0039]将所述网络特征与所述初始图数据库中的初始图数据库进行特征匹配,并将匹配成功的初始图数据库作为目标图数据库。
[0040]在第一方面的一种可能实现方式中,所述将所述标准实体数据集、所述标准数据关系网络导入至所述目标图数据库中,得到所述待入库数据文件的血缘关系图谱,包括:
[0041]将所述标准实体数据集、所述标准数据关系网络数据作为待入库数据,并创建所述待入库数据与所述目标图数据库的数据连接链路;
[0042]根据所述数据连接链路创建所述待入库数据的脚本执行环境,并将所述待入库数据转换成所述目标图数据库的脚本语句;
[0043]在所述脚本执行环境中执行所述脚本语句,以生成所述待入库数据文件的血缘关系图谱。
[0044]第二方面,本专利技术提供了一种血缘关系图谱追溯装置,所述装置包括:
[0045]数据抽取模块,用于选择待入库数据文件的数据入库模型,并根据所述数据入库模型抽取所述待入库数据文件的实体数据项,得到实体数据集;
[0046]数据清洗模块,用于对所述实体数据集进行数据清洗,生成标准实体数据集;
[0047]数据融合模块,用于对所述标准实体数据集进行数据融合,得到融合实体数据集,建立所述融合实体数据集中数据之间的数据关系网络;
[0048]数据治理模块,用于对所述数据关系网络进行数据治理,生成标准数据关系网络;
[0049]数据入库模块,用于将所述标准实体数据集、所述标准数据关系网络导入至所述目标图数据库中,得到所述待入库数据文件的血缘关系图谱。
[0050]与现有技术相比,本方案的技术原理及有益效果在于:
[0051]本专利技术实施例首先根据预设待入库数据文件,选择数据入库模型,并根据所述数据模型抽取所述预设入库数据文件的数据项,得到实体数据集,可以用来完善实体数据的属性信息,方便更好的展示后续图数据库中节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种血缘关系图谱追溯方法,其特征在于,所述方法包括:选择待入库数据文件的数据入库模型,并根据所述数据入库模型抽取所述待入库数据文件的实体数据项,得到实体数据集;对所述实体数据集进行数据清洗,生成标准实体数据集;对所述标准实体数据集进行数据融合,得到融合实体数据集,建立所述融合实体数据集中数据之间的数据关系网络;对所述数据关系网络进行数据治理,得到标准数据关系网络;从预设的图数据库中选择所述标准实体数据集、所述标准数据关系网络对应的图数据库,得到目标图数据库,将所述标准实体数据集、所述标准数据关系网络导入至所述目标图数据库中,得到所述待入库数据文件的血缘关系图谱。2.根据权利要求1所述的方法,其特征在于,所述选择待入库数据文件的数据入库模型,包括:将所述待入库数据文件转换成固定格式的数据项集合;识别所述数据项集合中的数据项,并对所述数据项进行数据分类,得到分类数据项;根据所述分类数据项,从预设的数据模型库中选择待入库数据文件的数据入库模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述数据入库模型抽取所述待入库数据文件的实体数据项,得到实体数据集,包括:加载所述待入库数据文件的初始数据项;建立所述初始数据项与所述数据入库模型之间的数据映射关系;根据所述数据映射关系抽取所述待入库数据文件的初始数据项,得到实体数据集。4.根据权利要求1所述的方法,其特征在于,所述对所述实体数据集进行数据清洗,生成标准实体数据集,包括:识别所述实体数据集中每个实体数据的实体数据项;根据所述实体数据项配置所述实体数据集的数据清洗逻辑和数据清洗方式,根据数据清洗逻辑和数据清洗方式,生成所述实体数据集的数据清洗规则;根据所述实体数据集的数据清洗规则,执行对所述实体数据集的数据清洗,生成标准实体数据集。5.根据权利要求1所述的方法,其特征在于,所述对所述标准实体数据集进行数据融合,得到融合实体数据集,包括:拆分所述标准实体数据集中每个标准实体数据的数据项,得到拆分数据项;查询所述拆分数据项中的相同数据项,得到结果相同数据项;根据所述结果相同数据项,对所述标准实体数据集进行数据融合,得到融合实体数据集。6.根据权利要求5所述的方法,其特征在于,所述建立所述融合实体数据集中数据之间的数据关系网络,包括:建立所述融合实体数据集中数据之间的网络节点和...

【专利技术属性】
技术研发人员:李林高占刚
申请(专利权)人:辽宁华盾安全技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1