【技术实现步骤摘要】
一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质
[0001]本专利技术属于人工智能
,尤其涉及一种垂域知识图谱的知识查询方法
、
装置
、
计算机设备和存储介质
。
技术介绍
[0002]知识图谱是一种以图形结构表示知识的方式,它通过将实体
、
属性和关系组织成节点和边的形式,形成一个语义丰富的知识网络
。
垂域知识图谱则是指在垂直领域内构建的知识图谱
。
知识查询
(
知识检索
)
主要通过线上问答的方式,向用户提供无限制的实时知识情报信息查询的服务
。
目前知识查询主要采用端到端的向量召回检索方式实现
。
即,主要将收集的查询文本与知识库中的目标进行匹配构建文本对后训练相关的查询模型后,利用该查询模型对用户实时输入的查询文本进行向量编码,再通过向量召回的方式实现知识库的问答查询
。
[0003]然而,通过向量召回的方式进行知识库问答虽然易于实现,但是对于医疗
、
娱乐
、
环保
、
教育
、
体育以及军事等垂直领域来说,由于其专业性和难以理解性,使得现有方式很难基于用户输入的查询文本(查询语句)理解出用户实质的查询意图,导致知识查询准确性降低
。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高知识查询准确性的垂域知识 ...
【技术保护点】
【技术特征摘要】
1.
一种垂域知识图谱的知识查询方法,其特征在于,包括:将查询文本输入多任务联合模型,由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素;对所述查询文本分词,确定各所述分词在所述查询文本中的词权重;根据所述分词以及所述分词的词权重进行属性关系类别对齐,得到属性关系类别词;对所述查询要素进行实体链接和条件表达转义,得到链接实体和转义词;根据所述查询意图类型获取知识库查询语句模板,将所述查询要素
、
所述链接实体
、
所述转义词
、
所述属性关系类别词填入所述知识库查询语句模板,得到知识库查询语句并利用所述知识库查询语句进行知识查询
。2.
根据权利要求1所述的方法,其特征在于,所述由所述多任务联合模型识别所述查询文本的查询意图类型和查询要素,包括:利用文本特征编码层对所述查询文本进行编码,得到特征向量矩阵;其中,所述特征向量矩阵包括行特征向量和列特征向量,所述行特征向量与所述查询文本中的各字符一一对应,表示各所述字符的特征向量;分别对所述列特征向量的特征值进行特征融合得到文本表示向量,使用第一多层感知机对所述文本表示向量进行分类得到概率向量,将所述概率向量中最大值维度对应的查询意图类型作为所述查询文本的查询意图类型;使用第二多层感知机分别预测各所述行特征向量对应不同要素类型的评分,利用条件随机场模型基于所述评分输出最优要素类别序列,根据所述最优要素类别序列确定查询要素
。3.
根据权利要求1所述的方法,其特征在于,所述对所述查询文本分词,确定各所述分词在所述查询文本中的词权重,包括:对所述查询文本进行初步分词和词性标注后,根据停用词表以及词性过滤停用词和无意义词,得到最终的分词;分别计算各所述分词的浅层语义权重
、
句法权重以及深层语义权重,并对所述浅层语义权重
、
所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重;将各所述分词的总体权重进行归一化,得到各所述分词在所述查询文本中的词权重
。4.
根据权利要求1所述的方法,其特征在于,所述分别计算各所述分词的浅层语义权重
、
句法权重以及深层语义权重,并对所述浅层语义权重
、
所述句法权重以及所述深层语义权重进行汇总,得到各所述分词的总体权重,包括:利用
TF
‑
IDF
计算所述分词的词权重作为所述分词的浅层语义权重;使用句法依赖构建句法树,根据各所述分词到所述句法树根结点的最短路径进行权重递减,获取所述分词的句法权重;计算所述查询文本完整语义向量与所述分词的语义向量的余弦相似度,将数值1与所述余弦相似度的值作为所述分词的深层语义权重;将所述浅层语义权重
、
所述句法权重以及所述深层语义权重进行加权或平均值计算,得到所述分词的总体权重
。5.
根据权利要求1所述的...
【专利技术属性】
技术研发人员:段炼,易志翔,黄九鸣,张圣栋,
申请(专利权)人:湖南星汉数智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。