基于句向量的知识图谱查询方法及系统技术方案

技术编号:25550795 阅读:21 留言:0更新日期:2020-09-08 18:50
本发明专利技术公开了一种基于句向量的知识图谱查询方法、介质、设备及系统,其中方法包括:获取训练语料,并根据训练语料训练得到句向量模型;获取知识图谱,并将知识图谱中的实体或实体属性输入到句向量模型,以生成实体或实体属性对应的第一句向量值;根据第一句向量值训练得到邻域排序模型,以便根据邻域排序模型计算句向量距离权重;将待查询信息输入到句向量模型,以生成待查询信息对应的第二句向量值;根据第二句向量值和句向量距离权重计算第二句向量值和第一句向量值之间的距离,并根据距离确定待查询信息对应的查询结果;能够对待查询实体与知识图谱中实体之间的距离进行有效度量,提高知识图谱查询的鲁棒性和准确性。

【技术实现步骤摘要】
基于句向量的知识图谱查询方法及系统
本专利技术涉及知识图谱
,特别涉及一种基于句向量的知识图谱查询方法、一种计算机可读存储介质、一种计算机设备以及一种基于句向量的知识图谱查询系统。
技术介绍
相关技术中,在度量待查询实体与知识图谱中实体或实体属性的距离时;多采用关键词匹配、模糊或正则匹配的方式;然而,扩展图谱实体或实体属性关键词的方法存在很大的人为主观性和局限性,通常难以完全准确地枚举;使得最终查询结果准确度较低;并且,上述方式难以结合实体的上下文语境,存在多义性,需要对查询结果进行二次处理,而这种处理流程将导致查询结果的准确性被进一步的降低。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于句向量的知识图谱查询方法,能够对待查询实体与知识图谱中实体之间的距离进行有效度量,提高知识图谱查询的鲁棒性和准确性。本专利技术的第二个目的在于提出一种计算机可读存储介质。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种基于句本文档来自技高网...

【技术保护点】
1.一种基于句向量的知识图谱查询方法,其特征在于,包括以下步骤:/n获取训练语料,并根据所述训练语料进行句向量模型的训练,以生成句向量模型;/n获取知识图谱,并将所述知识图谱中的实体或实体属性输入到所述句向量模型,以生成所述实体或实体属性对应的第一句向量值;/n根据所述第一句向量值进行邻域排序模型的训练,以生成邻域排序模型,以便根据所述邻域排序模型计算句向量距离权重;/n获取待查询信息,并将所述待查询信息输入到所述句向量模型,以生成所述待查询信息对应的第二句向量值;/n根据所述第二句向量值和所述句向量距离权重计算第二句向量值和所述第一句向量值之间的距离,并根据所述距离确定所述待查询信息对应的查...

【技术特征摘要】
1.一种基于句向量的知识图谱查询方法,其特征在于,包括以下步骤:
获取训练语料,并根据所述训练语料进行句向量模型的训练,以生成句向量模型;
获取知识图谱,并将所述知识图谱中的实体或实体属性输入到所述句向量模型,以生成所述实体或实体属性对应的第一句向量值;
根据所述第一句向量值进行邻域排序模型的训练,以生成邻域排序模型,以便根据所述邻域排序模型计算句向量距离权重;
获取待查询信息,并将所述待查询信息输入到所述句向量模型,以生成所述待查询信息对应的第二句向量值;
根据所述第二句向量值和所述句向量距离权重计算第二句向量值和所述第一句向量值之间的距离,并根据所述距离确定所述待查询信息对应的查询结果。


2.如权利要求1所述的基于句向量的知识图谱查询方法,其特征在于,根据所述训练语料进行句向量模型的训练,以生成句向量模型,包括:
对所述训练语料进行预处理,以生成多个训练语句,并对每个训练语句进行拆分,以生成每个训练语句对应的词对;
将所述词对输入到词嵌入模型,以计算每个词对对应的词向量,并根据所述词向量进行句向量模型的训练,以生成句向量模型。


3.如权利要求1所述的基于句向量的知识图谱查询方法,其特征在于,在生成所述实体或实体属性对应的第一句向量值之后,还包括:
获取行业热词信息,并将所述行业热词信息输入到句向量模型,以生成所述行业热词信息对应的第三句向量值,以及根据所述第三句向量值对所述邻域排序模型进行更新。


4.如权利要求1所述的基于句向量的知识图谱查询方法,其特征在于,根据所述第一句向量值进行邻域排序模型的训练,以生成邻域排序模型,包括:
对所述第一句向量值进行标记,以生成训练数据,其中,所述训练数据包括目标实体句向量值和查询结果句向量值;
对所述训练数据进行划分,以生成训练集合和验证集合;
根据所述训练集合进行邻域排序模型的训练,并根据所述验证集合对训练得到的邻域排序模型进行拟合,以生成邻域排序模型。


5.一种计算机可读存储介质,其特征在于,其上存储有基于句向量的知识图谱查询程序,该基于句向量的知识图谱查询程序被处理器执行时实现如权利要求1-4中任一项所述的基于句向量的知识图谱查询方法。


6.一种计算机设备,包括存储器、处理器及存储在存储...

【专利技术属性】
技术研发人员:王甫宁万雪松
申请(专利权)人:天健厚德网络科技大连有限公司
类型:发明
国别省市:辽宁;21

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1