一种垂域知识图谱的知识查询方法技术

技术编号:39723445 阅读:8 留言:0更新日期:2023-12-17 23:28
本发明专利技术涉及人工智能技术领域,提供了一种垂域知识图谱的知识查询方法

【技术实现步骤摘要】
一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质


[0001]本专利技术属于人工智能
,尤其涉及一种垂域知识图谱的知识查询方法

装置

计算机设备和存储介质


技术介绍

[0002]知识图谱是一种以图形结构表示知识的方式,它通过将实体

属性和关系组织成节点和边的形式,形成一个语义丰富的知识网络

垂域知识图谱则是指在垂直领域内构建的知识图谱

知识查询
(
知识检索
)
主要通过线上问答的方式,向用户提供无限制的实时知识情报信息查询的服务

目前知识查询主要采用端到端的向量召回检索方式实现

即,主要将收集的查询文本与知识库中的目标进行匹配构建文本对后训练相关的查询模型后,利用该查询模型对用户实时输入的查询文本进行向量编码,再通过向量召回的方式实现知识库的问答查询

[0003]然而,通过向量召回的方式进行知识库问答虽然易于实现,但是对于医疗

娱乐

环保

教育

体育以及军事等垂直领域来说,由于其专业性和难以理解性,使得现有方式很难基于用户输入的查询文本(查询语句)理解出用户实质的查询意图,导致知识查询准确性降低


技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高知识查询准确性的垂域知识图谱的知识查询方法

装置

计算机设备和存储介质

[0005]本专利技术提供一种垂域知识图谱的知识查询方法,包括:
[0006]将查询文本输入多任务联合模型,由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素;
[0007]对所述查询文本分词,确定各所述分词在所述查询文本中的词权重;
[0008]根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词;
[0009]对所述查询要素进行实体链接和条件表达转义,得到链接实体和转义词;
[0010]根据所述查询意图类型获取知识库查询语句模板,将所述查询要素

所述链接实体

所述转义词

所述属性关系类别词填入所述知识库查询语句模板,得到知识库查询语句并利用所述知识库查询语句进行知识查询

[0011]在其中一个实施例中,所述由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素,包括:
[0012]利用文本特征编码层对所述查询文本进行编码,得到特征向量矩阵;其中,所述特征向量矩阵包括行特征向量和列特征向量,所述行特征向量与所述查询文本中的各字符一一对应,表示各所述字符的特征向量;
[0013]分别对所述列特征向量的特征值进行特征融合得到文本表示向量,使用第一多层感知机对所述文本表示向量进行分类得到概率向量,将所述概率向量中最大值维度对应的查询意图类型作为所述查询文本的查询意图类型;
[0014]使用第二多层感知机分别预测各所述行特征向量对应不同要素类型的评分,利用条件随机场模型基于所述评分输出最优要素类别序列,根据所述最优要素类别序列确定查询要素

[0015]在其中一个实施例中,所述对所述查询文本分词,确定各所述分词在所述查询文本中的词权重,包括:
[0016]对所述查询文本进行初步分词和词性标注后,根据停用词表以及词性过滤停用词和无意义词,得到最终的分词;
[0017]分别计算各所述分词的浅层语义权重

句法权重以及深层语义权重,并对所述浅层语义权重

所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重;
[0018]将各所述分词的总体权重进行归一化,得到各所述分词在所述查询文本中的词权重

[0019]在其中一个实施例中,所述分别计算各所述分词的浅层语义权重

句法权重以及深层语义权重,并对所述浅层语义权重

所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重,包括:
[0020]利用
TF

IDF
计算所述分词的词权重作为所述分词的浅层语义权重;
[0021]使用句法依赖构建句法树,根据各所述分词到所述句法树根结点的最短路径进行权重递减,获取所述分词的句法权重;
[0022]计算所述查询文本完整语义向量与所述分词的语义向量的余弦相似度,将数值1与所述余弦相似度的值作为所述分词的深层语义权重;
[0023]将所述浅层语义权重

所述句法权重以及所述深层语义权重进行加权或平均值计算,得到所述分词的总体权重

[0024]在其中一个实施例中,所述根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词,包括:
[0025]利用深度学习模型对所述分词以及知识库中各候选属性关系类别词进行特征向量表示,得到分词特征向量和候选属性关系类别词特征向量;
[0026]计算所述分词特征向量与所述候选属性关系类别词特征向量的相似度;
[0027]根据各所述分词对应的所述词权重将对应同一候选属性关系类别词的所述相似度进行加权求和,得到汇总相似度;
[0028]按照所述汇总相似度从高到低的顺序,从所述候选属性关系类别词中获取预设数量的属性关系类别词

[0029]在其中一个实施例中,所述多任务联合模型的训练过程包括:
[0030]获取用户的搜索查询日志,在所述搜索查询日志中搜索共同点击搜索查询文本簇和连续搜索查询文本簇;
[0031]对所述共同点击搜索查询文本簇和所述连续搜索查询文本簇中的代表查询文本分别进行标签标注,并将标注的标签推广到簇内的非代表查询文本上;其中,所述标签标注包括查询意图类型标注和要素类型标注;
[0032]将标签标注后的所述共同点击搜索查询文本簇和所述连续搜索查询文本簇作为训练数据对所述多任务联合模型进行训练

[0033]在其中一个实施例中,所述方法还包括:
[0034]在所述共同点击搜索查询文本簇和
/
或所述连续搜索查询文本簇中任意选择两个查询文本构建文本对,形成相似文本语料;
[0035]基于所述相似文本语料训练得到相似语义编码器;
[0036]利用所述相似语义编码器对所述共同点击搜索查询文本簇和
/
或所述连续搜索查询文本簇中的代表查询文本和簇外的查询文本进行语义相似度匹配;
[0037]根据所述语义相似度将所述簇外的查询文本作为补充数据加入到簇中

[0038]一种垂域知识图谱的知识查询装置,包括:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种垂域知识图谱的知识查询方法,其特征在于,包括:将查询文本输入多任务联合模型,由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素;对所述查询文本分词,确定各所述分词在所述查询文本中的词权重;根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词;对所述查询要素进行实体链接和条件表达转义,得到链接实体和转义词;根据所述查询意图类型获取知识库查询语句模板,将所述查询要素

所述链接实体

所述转义词

所述属性关系类别词填入所述知识库查询语句模板,得到知识库查询语句并利用所述知识库查询语句进行知识查询
。2.
根据权利要求1所述的方法,其特征在于,所述由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素,包括:利用文本特征编码层对所述查询文本进行编码,得到特征向量矩阵;其中,所述特征向量矩阵包括行特征向量和列特征向量,所述行特征向量与所述查询文本中的各字符一一对应,表示各所述字符的特征向量;分别对所述列特征向量的特征值进行特征融合得到文本表示向量,使用第一多层感知机对所述文本表示向量进行分类得到概率向量,将所述概率向量中最大值维度对应的查询意图类型作为所述查询文本的查询意图类型;使用第二多层感知机分别预测各所述行特征向量对应不同要素类型的评分,利用条件随机场模型基于所述评分输出最优要素类别序列,根据所述最优要素类别序列确定查询要素
。3.
根据权利要求1所述的方法,其特征在于,所述对所述查询文本分词,确定各所述分词在所述查询文本中的词权重,包括:对所述查询文本进行初步分词和词性标注后,根据停用词表以及词性过滤停用词和无意义词,得到最终的分词;分别计算各所述分词的浅层语义权重

句法权重以及深层语义权重,并对所述浅层语义权重

所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重;将各所述分词的总体权重进行归一化,得到各所述分词在所述查询文本中的词权重
。4.
根据权利要求1所述的方法,其特征在于,所述分别计算各所述分词的浅层语义权重

句法权重以及深层语义权重,并对所述浅层语义权重

所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重,包括:利用
TF

IDF
计算所述分词的词权重作为所述分词的浅层语义权重;使用句法依赖构建句法树,根据各所述分词到所述句法树根结点的最短路径进行权重递减,获取所述分词的句法权重;计算所述查询文本完整语义向量与所述分词的语义向量的余弦相似度,将数值1与所述余弦相似度的值作为所述分词的深层语义权重;将所述浅层语义权重

所述句法权重以及所述深层语义权重进行加权或平均值计算,得到所述分词的总体权重
。5.
根据权利要求1所述的...

【专利技术属性】
技术研发人员:段炼易志翔黄九鸣张圣栋
申请(专利权)人:湖南星汉数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1