数据修复方法、装置、电子设备、介质和程序产品制造方法及图纸

技术编号:37269030 阅读:12 留言:0更新日期:2023-04-20 23:39
本公开提供了一种基于知识图谱的数据修复方法、装置、电子设备、介质和计算机程序产品。上述方法和装置可用于人工智能技术领域。基于知识图谱的数据修复方法包括:获取t秒时间段内的m个存储过程信息,每个存储过程信息包括数据的来源和去处;根据m个存储过程信息,提取上级信息、下级信息和上级信息与下级信息之间的父子关系,其中,上级信息包括父存储过程

【技术实现步骤摘要】
数据修复方法、装置、电子设备、介质和程序产品


[0001]本公开涉及人工智能
,更具体地,涉及一种基于知识图谱的数据修复方法、装置、电子设备、介质和计算机程序产品。

技术介绍

[0002]金融市场交易系统的生产数据流入oracle数据库,会经过一个或多个存储过程层层加工,之后应用到各个业务模块和下游应用。当需要确定表字段的加工逻辑时,往往需要人工去分析排查。并且当生产数据出现错误时,金融市场交易系统相关联的各个业务模块和下游应用都会受到影响,可能触发生产问题。其中,数据出现错误的原因多种多样,比如程序逻辑有误、网络中断或者服务器宕机等。

技术实现思路

[0003]有鉴于此,本公开提供了一种智能化程度高,效率和准确率高的基于知识图谱的数据修复方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0004]本公开的一个方面提供了一种基于知识图谱的数据修复方法,包括:获取t秒时间段内的m个存储过程信息,每个所述存储过程信息包括数据的来源和去处,其中,m为大于等于1的整数,t大于等于1;根据所述m个存储过程信息,提取上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系,其中,所述上级信息包括父存储过程



字段,所述下级信息包括子存储过程



字段;根据所述上级信息、所述下级信息和所述父子关系构建知识图谱,其中,所述知识图谱的节点根据所述上级信息和所述下级信息构建,所述知识图谱的边根据所述父子关系构建;根据预先获得的所述t秒时间段内的问题数据在所述知识图谱中确定问题数据链;以及对所述问题数据链进行修复。
[0005]根据本公开实施例的基于知识图谱的数据修复方法,通过在t秒时间段内的m个存储过程信息中提取上级信息、下级信息和父子关系,根据上级信息、下级信息和父子关系即可构建t秒时间段内的存储过程信息的知识图谱,因此可以基于知识图谱的边关系,找到与t秒时间段内的问题数据相关联的其它数据,从而可以对问题数据和相关联的数据进行修复。本公开的数据修复方法依赖人工程度低,智能化程度高,效率和准确率高。
[0006]在一些实施例中,所述根据所述m个存储过程信息,提取上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系,包括:提取每个所述存储过程信息中的上级信息、下级信息和父子关系,得到中间数据结果;以及根据整合规则整合m个所述中间数据结果,得到最终数据结果,其中,所述最终数据结果包括所述m个存储过程信息中的上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系。
[0007]在一些实施例中,所述整合规则包括:将所述m个中间数据结果合并,且在每两个所述中间数据结果中,当其中一个所述中间数据结果的上级信息中的表

字段与另一个所述中间数据结果的下级信息中的表

字段相同时,在所述最终数据结果中将所述另一个所述中间数据结果的下级信息作为上级信息,将所述其中一个所述中间数据结果的上级信息
作为下级信息。
[0008]在一些实施例中,所述根据预先获得的所述t秒时间段内的问题数据在所述知识图谱中确定问题数据链,包括:根据预先获得的所述t秒时间段内的问题数据匹配所述知识图谱中的节点作为问题节点,所述问题数据包括问题表和/或问题字段;以及根据所述问题节点,利用图遍历算法,确定问题数据链。
[0009]在一些实施例中,所述对所述问题数据链进行修复,包括:将所述问题数据链中所述问题数据的上游节点确定为待确认节点;将所述问题数据链中所述问题数据及其下游节点确定为待修复节点;以及对所述待修复节点进行修复。
[0010]在一些实施例中,所述对所述待修复节点进行修复,包括:编写所述待修复节点的自定义脚本和/或对所述待修复节点执行任务重调。
[0011]本公开的另一个方面提供了一种基于知识图谱的数据修复装置,包括:获取模块,所述获取模块用于执行获取t秒时间段内的m个存储过程信息,每个所述存储过程信息包括数据的来源和去处,其中,m为大于等于1的整数,t大于等于1;提取模块,所述提取模块用于执行根据所述m个存储过程信息,提取上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系,其中,所述上级信息包括父存储过程



字段,所述下级信息包括子存储过程



字段;构建模块,所述构建模块用于执行根据所述上级信息、所述下级信息和所述父子关系构建知识图谱,其中,所述知识图谱的节点根据所述上级信息和所述下级信息构建,所述知识图谱的边根据所述父子关系构建;确定模块,所述确定模块用于执行根据预先获得的所述t秒时间段内的问题数据在所述知识图谱中确定问题数据链;以及修复模块,所述修复模块用于执行对所述问题数据链进行修复。
[0012]本公开的另一方面提供了一种电子设备,包括一个或多个处理器以及一个或多个存储器,其中,所述存储器用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现如上所述方法。
[0013]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0014]本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
[0015]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0016]图1示意性示出了根据本公开实施例的可以应用方法、装置的示例性系统架构;
[0017]图2示意性示出了根据本公开实施例的基于知识图谱的数据修复方法的流程图;
[0018]图3示意性示出了根据本公开实施例的根据m个存储过程信息,提取上级信息、下级信息和上级信息与下级信息之间的父子关系的流程图;
[0019]图4示意性示出了根据本公开实施例的知识图谱的示意图;
[0020]图5示意性示出了根据本公开实施例的根据获得的问题数据在知识图谱中确定问题数据链的流程图;
[0021]图6示意性示出了根据本公开实施例的对问题数据链进行修复的流程图;
[0022]图7示意性示出了根据本公开实施例的对待修复节点进行修复的流程图;
[0023]图8示意性示出了根据本公开实施例的基于知识图谱的数据修复装置的结构框图;
[0024]图9示意性示出了根据本公开实施例的提取模块的结构框图;
[0025]图10示意性示出了根据本公开实施例的确定模块的结构框图;
[0026]图11示意性示出了根据本公开实施例的修复模块的结构框图;
[0027]图12示意性示出了根据本公开实施例的修复单元的结构框图;
[0028]图13示意性示出了根据本公开实施例的基于知识图谱的数据修复装置的结构框图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的数据修复方法,其特征在于,包括:获取t秒时间段内的m个存储过程信息,每个所述存储过程信息包括数据的来源和去处,其中,m为大于等于1的整数,t大于等于1;根据所述m个存储过程信息,提取上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系,其中,所述上级信息包括父存储过程



字段,所述下级信息包括子存储过程



字段;根据所述上级信息、所述下级信息和所述父子关系构建知识图谱,其中,所述知识图谱的节点根据所述上级信息和所述下级信息构建,所述知识图谱的边根据所述父子关系构建;根据预先获得的所述t秒时间段内的问题数据在所述知识图谱中确定问题数据链;以及对所述问题数据链进行修复。2.根据权利要求1所述的方法,其特征在于,所述根据所述m个存储过程信息,提取上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系,包括:提取每个所述存储过程信息中的上级信息、下级信息和父子关系,得到中间数据结果;以及根据整合规则整合m个所述中间数据结果,得到最终数据结果,其中,所述最终数据结果包括所述m个存储过程信息中的上级信息、下级信息和所述上级信息与所述下级信息之间的父子关系。3.根据权利要求2所述的方法,其特征在于,所述整合规则包括:将所述m个中间数据结果合并,且在每两个所述中间数据结果中,当其中一个所述中间数据结果的上级信息中的表

字段与另一个所述中间数据结果的下级信息中的表

字段相同时,在所述最终数据结果中将所述另一个所述中间数据结果的下级信息作为上级信息,将所述其中一个所述中间数据结果的上级信息作为下级信息。4.根据权利要求1所述的方法,其特征在于,所述根据预先获得的所述t秒时间段内的问题数据在所述知识图谱中确定问题数据链,包括:根据预先获得的所述t秒时间段内的问题数据匹配所述知识图谱中的节点作为问题节点,所述问题数据包括问题表和/或问题字段;以及根据所述问题节...

【专利技术属性】
技术研发人员:戎伟峰伍如意秦家祥叶鸿浩
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1