一种用于更新知识图谱的数据处理系统技术方案

技术编号:32647086 阅读:17 留言:0更新日期:2022-03-12 18:31
本发明专利技术涉及一种用于更新知识图谱的数据处理系统,包括数据库、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现步骤:获取多个中间字段名,遍历原始数据集且当所有中间字段名与任一原始数据列表的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;当某一中间字段名与原始数据列表的所有字段名不相等时,从本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,根据第一目标字段名列表和第二目标字段名列表,构建成目标知识图谱,本发明专利技术当原始数据进行更新时,只需要更新关键字段集和本体列表,就能够更新全部的知识图谱,优化知识图谱的更新过程,提高知识图谱的效率。提高知识图谱的效率。提高知识图谱的效率。

【技术实现步骤摘要】
一种用于更新知识图谱的数据处理系统


[0001]本专利技术涉及计算机
,尤其涉及一种用于更新知识图谱的数据处理系统。

技术介绍

[0002]信息技术发展的时代,知识图谱(Knowl edge Graph)通常指可揭示实体之间的关系的语义网络,其基于数据挖掘、信息处理、图形绘制等手段,利用可视化的图谱将复杂的知识领域形象地展示出来,可在一定程度上体现知识领域的发展规律。
[0003]在现有技术中,基于每一数据的三元组构建成知识图谱,无法将相同类型实体的采用统一结构进行快速构建,即无法简化构建知识图谱过程,影响知识图谱的构建效率,同时也导致当数据更新时,只能重新构建三元组和知识图谱,因此,如何简化构建知识图谱过程,提高知识图谱的构建效率成为亟待解决的技术问题。

技术实现思路

[0004]本专利技术目的在于,提供一种用于更新知识图谱的数据处理系统,仅需要更新关键字段集和本体列表,完成知识图谱的更新,简化知识图谱的更新过程,提高知识图谱的效率。
[0005]本专利技术一方面提供了一种用于更新知识图谱的数据处理系统,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储原始数据集和负样本列表,当所述计算机程序被处理器执行时,实现以下步骤:
[0006]S101、获取目标数据列表且根据所述目标数据列表中所有字段名作为中间字段名,构建成中间字段列表P=(P1,P2,P3,
……
,P
m
),P
t
是指第t个中间字段名,t=2
……
m,m为中间字段名数量;
[0007]S103、获取原始数据集Q=(Q1,Q2,Q3,
……
,Q
N
),其中,Q
z
是指第z个原始数据列表,z=1
……
N,并遍历Q且当每一P
t
与Q中任一Q
z
的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;
[0008]S105、当某一P
t
与Q中任一Q
z
的所有字段名不相等时,基于P和负样本列表,从所述本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,其中,所述第一目标字段名列表为基于除P
t
之前的其他中间字段名构建的列表,所述第二目标字段名列表为基于P
t
构建的字段名列表;
[0009]S107、根据所述第一目标字段名列表以第一本体架构,得到第一目标三元组列表且根据所述第二目标字段名列表以第二本体架构,得到第二目标三元组列表,以根据第一目标三元组列表和第二目标三元组列表,构建成目标知识图谱。
[0010]本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术提供的一种用于更新知识图谱的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
[0011]本专利技术获取目标数据列表且根据所述目标数据列表中所有字段名作为中间字段
名,构建成中间字段列表;获取原始数据集并遍历,且当原始数据集每一中间字段名与任一原始数据列表的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;当某一中间字段名与原始数据列表的所有字段名不相等时,基于中间字段列表和负样本列表,从本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,根据所述第一目标字段名列表以第一本体架构,得到第一目标三元组列表且根据所述第二目标字段名列表以第二本体架构,得到第二目标三元组列表,以根据第一目标三元组列表和第二目标三元组列表,构建成目标知识图谱,可见,本专利技术当原始数据进行更新时,只需要更新关键字段集和本体列表,实现更新全部的知识图谱,无需再将每个数据生成三元组以构成知识图谱,优化知识图谱的更新过程,提高知识图谱的效率。
[0012]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0013]图1为本专利技术实施例提供的用于更新知识图谱的数据处理系统示意图;
[0014]图2为本专利技术实施例提供的用于更新知识图谱的数据处理流程图。
具体实施方式
[0015]为更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种获取目标位置的数据处理系统的具体实施方式及其功效,详细说明如后。
[0016]本专利技术实施例提供了一种用于更新知识图谱的数据处理系统,如图1所示,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库中存储原始数据集,当所述计算机程序被处理器执行时,实现以下步骤如图2所示:
[0017]S101、获取目标数据列表且将所述目标数据列表中所有字段名作为中间字段名,构建成中间字段列表P=(P1,P2,P3,
……
,P
m
),P
t
是指第t个中间字段名,t=2
……
m,m为中间字段名数量;
[0018]具体地,所述目标数据列表是在原始数据集中增加的原始数据列表。
[0019]S103、获取原始数据集Q=(Q1,Q2,Q3,
……
,Q
N
),其中,Q
z
是指第z个原始数据列表,z=1
……
N,并遍历Q且当每一P
t
与Q中任一Q
z
的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱。
[0020]具体地,在S103步骤中,获取Q
z
中所有原始字段名且根据任一所述原始字段名,从本体字段名列表中获取所述原始字段名对应的关联数据和从A中获取原始字段名的第一记录和第二记录,以建立预设本体架构。
[0021]具体地,还通过如下步骤确定本体字段名列表:
[0022]S201、基于所述字段名字列表中任一字段进行预处理,得到目标关键列表A0且基于A0,确定出M个关键字段列表,以根据A0和M个关键字段列表,构建成关键字段集A=(A0,A1,A2,
……
,A
M
),A
i
是第i个关键字段列表且A
i
中包括第一关键字段和第二关键字段,i=1
……
M;
[0023]S203、基于每一A
i
的第一关键字段和第二关键字段,从所述字段名列表中删除A
i
的第一关键字段和A
i
的第二关键字段,构建成本体字段名列表,其中,所述第一关键字段与所述第二关键字段之间存在关联关系。
[0024]进一步地,还通过如下步骤确定字段名列表:
[0025]基于每一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于更新知识图谱的数据处理系统,其特征在于,所述系统包括:数据库、处理器和存储有计算机程序的存储器,其中,所述数据库中存储原始数据集和负样本列表,当所述计算机程序被处理器执行时,实现以下步骤:S101、获取目标数据列表且将所述目标数据列表中所有字段名作为中间字段名,构建成中间字段列表P=(P2,P3,
……
,P
m
),P
t
是指第t个中间字段名,t=2
……
m,m为中间字段名数量;S103、获取原始数据集Q=(Q1,Q2,Q3,
……
,Q
N
),其中,Q
z
是指第z个原始数据列表,z=1
……
N,并遍历Q且当每一P
t
与Q中任一Q
z
的所有字段名均相等时,以基于预设本体架构,构建成目标知识图谱;S105、当某一P
t
与Q中任一Q
z
的所有字段名不相等时,基于P和负样本列表,从本体字段名列表中获取第一目标字段名列表和第二目标字段名列表,其中,所述第一目标字段名列表为基于除P
t
之前的其他中间字段名构建的列表,所述第二目标字段名列表为基于P
t
构建的字段名列表;S107、根据所述第一目标字段名列表以第一本体架构,得到第一目标三元组列表且根据所述第二目标字段名列表以第二本体架构,得到第二目标三元组列表,以根据第一目标三元组列表和第二目标三元组列表,构建成目标知识图谱。2.根据权利要求1所述的用于更新知识图谱的数据处理系统,其特征在于,所述目标数据列表是在原始数据集中增加的原始数据列表。3.根据权利要求1所述的用于更新知识图谱的数据处理系统,其特征在于,还通过如下步骤确定本体字段名列表:S1051、基于字段名列表中任一字段进行预处理,得到目标关键列表A0且基于A0,确定出M个关键字段列表,以根据A0和M个关键字段列表,构建成关键字段集A=(A0,A1,A2,
……
,A
M
),A
i
是第i...

【专利技术属性】
技术研发人员:傅晓航张正义林方刘羽
申请(专利权)人:中科雨辰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1