知识图谱的构建方法、问答方法、装置和存储介质制造方法及图纸

技术编号:36062585 阅读:17 留言:0更新日期:2022-12-24 10:27
本申请提供一种知识图谱的构建方法、问答方法、装置和存储介质。该知识图谱的构建方法包括:对多个文本进行分析,得到多个实体以及每个文本对应的属性信息;将多个实体以及属性信息与预设实体库进行匹配,确定各实体之间的关联关系以及属性信息与各所述实体之间的关联关系;预设实体库中包括标准业务实体、标准行为实体、标准事件实体和标准属性信息,标准行为实体、标准事件实体和标准属性信息均为标准业务实体的子节点;获取与属性信息对应的属性值;根据各实体之间的关联关系、属性信息与各实体之间的关联关系和属性值,构建知识图谱。本申请可以避免从文本中提取三元组数据,当文本中无法提取出三元组的实体与关系时,也可以构建出知识图谱。可以构建出知识图谱。可以构建出知识图谱。

【技术实现步骤摘要】
知识图谱的构建方法、问答方法、装置和存储介质


[0001]本申请涉及大数据技术,尤其涉及一种知识图谱的构建方法、问答方法、装置和存储介质。

技术介绍

[0002]知识图谱(Knowledge Graph)用于描述实体的属性和实体之间的联系。随着计算机科学的发展,人工智能领域的兴起,知识图谱的应用也越发广泛。
[0003]目前大多数的知识图谱都是基于大量的语料,提取出三元组数据,从而采用三元组数据组织知识,以形成三元组知识图谱。其中,三元组的形式可以为:(实体,关系,实体)。例如“张三,出生地,北京”就构成了一个三元组,当用户提问“张三的出生地在哪里”的时候,就可以提取出“张三”这一实体和“出生地”的关系,进而根据知识图谱中的上述三元组查找到与“张三”具有“出生地”关系的实体“北京”。
[0004]然而,对于语料中无法提取出三元组数据的情况,按照上述方式,将无法构建出知识图谱。

技术实现思路

[0005]本申请提供一种知识图谱的构建方法、问答方法、装置和存储介质,用以解决在语料中无法提取出三元组数据时,将无法构建知识图谱的技术问题。
[0006]第一方面,本申请提供一种知识图谱的构建方法,包括:
[0007]对多个文本进行分析,得到多个实体以及所述每个文本对应的属性信息,所述实体包括业务实体、行为实体和事件实体,所述业务实体用于表示业务类型,所述事件实体用于表示所述业务实体的操作状态,所述行为实体用于表示业务实体的操作行为,所述属性信息用于表示所述文本所属的类型;
>[0008]将所述多个实体以及所述属性信息与预设实体库进行匹配,确定各实体之间的关联关系以及所述属性信息与各所述实体之间的关联关系;所述预设实体库中包括标准业务实体、标准行为实体、标准事件实体和标准属性信息,所述标准行为实体、所述标准事件实体和所述标准属性信息均为所述标准业务实体的子节点;
[0009]获取与所述属性信息对应的属性值;
[0010]根据各实体之间的关联关系、所述属性信息与各所述实体之间的关联关系和所述属性值,构建知识图谱。
[0011]第二方面,本申请提供一种问答方法,包括:
[0012]对待处理文本进行分析,得到至少一个待匹配实体以及所述与待处理文本对应的待匹配属性信息;
[0013]根据所述至少一个待匹配实体和所述待匹配属性信息,基于知识图谱确定所述待处理文本对应的答案,其中,所述知识图谱包括节点和边,所述节点包括多个实体、属性信息以及所述属性信息对应的属性值,所述边表示各实体之间的关联关系、属性信息与各所
述实体之间的关联关系以及所述属性信息与所述属性值之间的关联关系;
[0014]输出所述待处理文本对应的答案。
[0015]第三方面,本申请实施例还提供了一种知识图谱的构建装置,包括:
[0016]分析模块,用于对多个文本进行分析,得到多个实体以及所述每个文本对应的属性信息,所述实体包括业务实体、行为实体和事件实体,所述业务实体用于表示业务类型,所述事件实体用于表示所述业务实体的操作状态,所述行为实体用于表示业务实体的操作行为,所述属性信息用于表示所述文本所属的类型;
[0017]确定模块,用于将所述多个实体以及所述属性信息与预设实体库进行匹配,确定各实体之间的关联关系以及所述属性信息与各所述实体之间的关联关系;所述预设实体库中包括标准业务实体、标准行为实体、标准事件实体和标准属性信息,所述标准行为实体、所述标准事件实体和所述标准属性信息均为所述标准业务实体的子节点;
[0018]所述获取模块,还用于获取与所述属性信息对应的属性值;
[0019]构建模块,还用于根据各实体之间的关联关系、所述属性信息与各所述实体之间的关联关系和所述属性值,构建知识图谱。
[0020]第四方面,本申请实施例还提供了一种问答装置,包括:
[0021]分析模块,用于对待处理文本进行分析,得到至少一个待匹配实体以及与所述待处理文本对应的待匹配属性信息;
[0022]确定模块,用于根据所述至少一个待匹配实体和所述待匹配属性信息,基于知识图谱确定所述待处理文本对应的答案,其中,所述知识图谱包括节点和边,所述节点包括多个实体、属性信息以及所述属性信息对应的属性值,所述边表示各实体之间的关联关系、属性信息与各所述实体之间的关联关系以及所述属性信息与所述属性值之间的关联关系;
[0023]输出模块,用于输出所述待处理文本对应的答案。
[0024]第五方面,本申请实施例还提供了一种电子设备,该电子设备可以包括处理器和存储器;其中,
[0025]所述存储器,用于存储计算机程序。
[0026]所述处理器,用于读取所述存储器存储的计算机程序,并根据所述存储器中的计算机程序执行上述第一方面的知识图谱的构建方法的技术方案或执行上述第二方面的问答方法的技术方案。
[0027]第六方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述第一方面任一种可能的实现方式中所述的知识图谱的构建方法或实现上述第二方面任一种可能的实现方式中所述的问答方法。
[0028]第七方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现上述第一方面任一种可能的实现方式所述的知识图谱的构建方法或实现上述第二方面任一种可能的实现方式所述的问答方法。
[0029]本申请实施例提供的知识图谱的构建方法、问答方法、装置和存储介质,通过预先设置预设实体库,在该预设实体库中设置标准业务实体、标准行为实体、标准事件实体和标准属性信息之间的关联关系。在对多个文本进行分析,得到多个实体以及每个文本对应的属性信息后,通过将多个实体以及属性信息与预设实体库进行匹配,以确定各实体之间的
关联关系以及属性信息与各实体之间的关联关系,在获取到与属性信息对应的属性值后,将根据各实体之间的关联关系、属性信息与各实体之间的关联关系和属性值,构建知识图谱。通过预先设置预设实体库,该预设实体库中包括各个标准实体之间的关联关系,通过采用确定出的实体和预设实体库中各个标准实体之间的关联关系进行匹配的方式构建知识图谱,可以避免必须从文本中提取三元组数据才能构建知识图谱的现象,当文本中无法提取出三元组的实体与关系,而且文本中名词实体较少时,采用上述方式也可以构建出知识图谱。
附图说明
[0030]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0031]图1为本申请实施例提供的知识图谱的构建方法的系统架构图;
[0032]图2为本申请实施例提供的一种知识图谱的构建方法的流程示意图;
[0033]图3为一种预设实体库的示意图;
[0034]图4为操作指令的界面示意图;
[0035]图5为知识图谱的一结构示意图;...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,包括:对多个文本进行分析,得到多个实体以及每个文本对应的属性信息,所述实体包括业务实体、行为实体和事件实体,所述业务实体用于表示业务类型,所述事件实体用于表示所述业务实体的操作状态,所述行为实体用于表示业务实体的操作行为,所述属性信息用于表示所述文本所属的类型;将所述多个实体以及所述属性信息与预设实体库进行匹配,确定各实体之间的关联关系以及所述属性信息与各所述实体之间的关联关系;所述预设实体库中包括标准业务实体、标准行为实体、标准事件实体和标准属性信息,所述标准行为实体、所述标准事件实体和所述标准属性信息均为所述标准业务实体的子节点;获取与所述属性信息对应的属性值;根据各实体之间的关联关系、所述属性信息与各所述实体之间的关联关系和所述属性值,构建所述知识图谱。2.根据权利要求1所述的方法,其特征在于,所述预设实体库中包括多个预设规则链,每个预设规则链中包括至少两个标准实体以及所述至少两个标准实体中各标准实体之间的关联关系,或者所述预设规则链中包括至少一个标准实体和标准属性信息以及所述至少一个标准实体和所述标准属性信息之间的关联关系;所述将所述多个实体以及所述属性信息与预设实体库进行匹配,确定各实体之间的关联关系以及所述属性信息与各所述实体之间的关联关系,包括:针对所述多个实体中的每个实体,与所述每个预设规则链中包括的标准实体进行匹配,以从所述多个预设规则链中确定包含所述实体的第一目标预设规则链;针对多个属性信息中的每个属性信息,与包括有标准属性信息的预设规则链进行匹配,以从所述多个预设规则链中确定包含所述属性信息的第二目标预设规则链;根据所述第一目标预设规则链中包括的各标准实体之间的关联关系,以及所述第二目标预设规则链中包括的所述至少一个标准实体和所述标准属性信息之间的关联关系,确定各实体之间的关联关系以及所述属性信息与各所述实体之间的关联关系。3.根据权利要求1或2所述的方法,其特征在于,当所述实体包括业务实体时;所述对多个文本进行分析,得到多个实体,包括:分别对所述多个文本进行分词处理,得到多个目标分词;分别确定所述多个目标分词与预设词之间的语义相似度,并将语义相似度大于第一预设值的目标分词确定为所述业务实体。4.根据权利要求3所述的方法,其特征在于,所述分别对所述多个文本进行分词处理,得到多个目标分词,包括:对所述多个文本进行聚类,得到多个文本类,每个文本类中包括至少一个文本;分别对每个文本类中的每个文本进行分词处理,得到所述文本类对应的多个分词;对所述文本类对应的多个分词进行词频统计,将频率大于第二预设值的分词确定为所述目标分词。5.根据权利要求1或2所述的方法,其特征在于,当所述实体包括行为实体时;所述对多个文本进行分析,得到多个实体,包括:将所述多个文本分别输入词性标注模型,确定每个文本中的候选动词;
从所述候选动词中,筛选用于表示所述业务实体操作行为的目标动词;将所述目标动词和所述业务实体,确定为所述行为实体。6.根据权利要求1或2所述的方法,其特征在于,当所述实体包括事件实体时;所述对多个文本进行分析,得到多个实体,包括:分别将所述多个文本输入事件抽取模型,确定多个事件;判断所述多个事件中每个事件与所述业务实体和/或所述行为实体之间是否存在对应关系;将与所述事件存在对应关系的所述业务实体和/或所述行为实体,以及所述事件确定为所述事件实...

【专利技术属性】
技术研发人员:邓泽贵罗通蒋宁王洪斌吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1