知识图谱的构建方法及装置、电子设备制造方法及图纸

技术编号:28715737 阅读:27 留言:0更新日期:2021-06-06 01:52
本发明专利技术提供了知识图谱的构建方法及装置、电子设备,该方法包括:确定当前原始数据的至少一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息;根据每一条原始数据中的至少一个第一三元组信息和每至少一个第二三元组信息,生成待构建知识图谱的本体库并生成待构建知识图谱;当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;根据至少一个新增第一三元组信息和至少一个新增第二三元组信息,更新本体库;根据更新后的本体库,更新待构建知识图谱。本方案能够提高知识图谱构建的智能化程度。方案能够提高知识图谱构建的智能化程度。方案能够提高知识图谱构建的智能化程度。

【技术实现步骤摘要】
知识图谱的构建方法及装置、电子设备


[0001]本专利技术涉及计算机
,特别涉及知识图谱的构建方法及装置、电子设备。

技术介绍

[0002]随着大数据时代的到来,知识图谱应运而生。知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及他们之间的相互联系,在工业领域得到了广泛应用。
[0003]现有的知识图谱一般通过数据采集、数据处理和数据库重构、知识转化和实战应用五个步骤,运用分布式存储、关联算法、语义推理等技术,再基于实体的属性联系、时空联系、语义联系、特征联系等建立相互的关系,即可构建一张多维多层的实体与实体、实体与事件的知识图谱。然而,现有技术的知识图谱构建的智能化程度较低。

技术实现思路

[0004]本专利技术实施例提供了知识图谱的构建方法及装置、电子设备,可以提高知识图谱构建的智能化程度。
[0005]第一方面,本专利技术实施例提供了知识图谱的构建方法,该方法包括:
[0006]从原始数据库中获取至少一条原始数据;
[0007]针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;
[0008]根据每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;
[0009]根据所述知识图谱的模式层和所述知识图谱的数据层,生成待构建知识图谱的本体库;
[0010]根据所述待构建知识图谱的本体库,生成待构建知识图谱;
[0011]当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;
[0012]根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库;
[0013]根据更新后的所述本体库,更新所述待构建知识图谱。
[0014]优选地,
[0015]所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;
[0016]所述针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据中的至少一个第一三元组信息包括:
[0017]D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;
[0018]D2:将所述结构化原始数据确定为一个所述第一三元组信息;
[0019]D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;
[0020]D4:解析所述当前原始数据;
[0021]D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;
[0022]D6:确定所述当前原始数据是否为非结构化原始数据;
[0023]D7:在确定出所述当前原始数据为所述非结构化原始数据时,抽取所述当前原始数据中的一个所述第一三元组信息。
[0024]优选地,
[0025]所述根据所述待构建知识图谱的本体库,生成待构建知识图谱,包括:
[0026]将每一个所述第一三元组中所包含的两个实体分别作为所述待构建知识图谱的两个节点,其中,所述两个实体与所述待构建知识图谱中的实体定义相同;
[0027]将每一个所述第一三元组中所包含的所述两个实体之间的关系或者实体属性信息作为所述待构建知识图谱的边,其中,所述两个实体之间的关系或者实体属性定义与所述待构建知识图谱中的所述两个实体之间的关系定义或者实体属性定义相同;
[0028]根据每一个所述第一三元组所构建的所述两个节点和所述边,生成待构建知识图谱。
[0029]优选地,
[0030]所述根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库,包括:
[0031]将所述至少一个新增第一三元组信息添加至所述待构建知识图谱的数据层;
[0032]将所述至少一个新增第二三元组信息添加至所述待构建知识图谱的模式层,以生成更新后的本体库。
[0033]优选地,
[0034]所述原始数据包括:至少一条公共安全领域的犯罪记录、舆情监测和热点事件。
[0035]第二方面,本专利技术实施例提供了知识图谱的构建装置,包括:
[0036]获取模块,用于从原始数据库中获取至少一条原始数据;
[0037]确定模块,用于针对所述获取模块获取到的所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;
[0038]处理模块,用于根据所述确定模块确定的每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;
[0039]图谱构建模块,用于根据所述处理模块得到的所述知识图谱的模式层和所述知识图谱的数据层,生成待构建知识图谱的本体库;根据所述待构建知识图谱的本体库,生成待构建知识图谱;当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库;根据更新后的所述本体库,更新所述待构建知识图谱。
[0040]优选地,
[0041]所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;
[0042]所述确定模块,用于执行:
[0043]D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;
[0044]D2:将所述结构化原始数据确定为一个所述第一三元组信息;
[0045]D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;
[0046]D4:解析所述当前原始数据;
[0047]D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;
[0048]D6:确定所述当前原始数据是否为非结构化原始数据;
[0049]D7:在确定出所述当前原始数据为所述非结构化原始数据时,抽取所述当前原始数据中的一个所述第一三元组信息。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.知识图谱的构建方法,其特征在于,该方法包括:从原始数据库中获取至少一条原始数据;针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;根据每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;根据所述知识图谱的模式层和所述知识图谱的数据层,生成待构建知识图谱的本体库;根据所述待构建知识图谱的本体库,生成待构建知识图谱;当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息和对应的至少一个新增第二三元组信息;根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库;根据更新后的所述本体库,更新所述待构建知识图谱。2.根据权利要求1所述的方法,其特征在于,所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;所述针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据中的至少一个第一三元组信息包括:D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;D2:将所述结构化原始数据确定为一个所述第一三元组信息;D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;D4:解析所述当前原始数据;D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;D6:确定所述当前原始数据是否为非结构化原始数据;D7:在确定出所述当前原始数据为所述非结构化原始数据时,抽取所述当前原始数据中的一个所述第一三元组信息。3.根据权利要求1所述的方法,其特征在于,所述根据所述待构建知识图谱的本体库,生成待构建知识图谱,包括:将每一个所述第一三元组中所包含的两个实体分别作为所述待构建知识图谱的两个节点,其中,所述两个实体与所述待构建知识图谱中的实体定义相同;将每一个所述第一三元组中所包含的所述两个实体之间的关系或者实体属性信息作为所述待构建知识图谱的边,其中,所述两个实体之间的关系或者实体属性定义与所述待
构建知识图谱中的所述两个实体之间的关系定义或者实体属性定义相同;根据每一个所述第一三元组所构建的所述两个节点和所述边,生成待构建知识图谱。4.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个新增第一三元组信息和所述至少一个新增第二三元组信息,更新所述本体库,包括:将所述至少一个新增第一三元组信息添加至所述待构建知识图谱的数据层;将所述至少一个新增第二三元组信息添加至所述待构建知识图谱的模式层,以生成更新后的本体库。5.根据权利要求1至4中任一所述的方法,其特征在于,所述原始数据包括:至少一条公共安全领域的犯罪记录、舆情监测和热点事件。6...

【专利技术属性】
技术研发人员:张虎刘同林贾鹏胡丽张高科王凌董昆史聪莉张进
申请(专利权)人:北京机电工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1