知识图谱路径排序方法、系统、设备及存储介质技术方案

技术编号：29401087 阅读：16 留言：0更新日期：2021-07-23 22:38

本发明专利技术提供了一种知识图谱路径排序方法、系统、设备及存储介质，该方法包括：获取输入文本，得到所述输入文本的实体集合，将所述实体集合作为第一数据流；基于所述实体集合进行路径查询，得到候选路径集合，将所述候选路径集合中的各个候选路径分别作为一第二数据流；将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型，得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度；根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值，对所述候选路径进行排序。本发明专利技术解决了知识图谱中路径的不确定性，提高了知识图谱路径排序的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
知识图谱路径排序方法、系统、设备及存储介质
本专利技术涉及数据处理
，尤其涉及一种知识图谱路径排序方法、系统、设备及存储介质。
技术介绍
开放域文本问答(OpenQA)在给定问题的同时，不提供单篇段落或者文档，而是需要在文档集合或者整个网页中寻找答案。由于开放域问答对话技术涉及的知识面十分广阔，且理论上可无限扩展，因此传统的FAQ技术不适用于开放域场景。在采用知识图谱作为问答的知识来源时，涉及到的技术有句法分析、实体识别、图数据库查询和图谱路径排序等。知识图谱问答技术的关键在于正确识别问句的实体及语义，并在图谱中找到正确的路径以确定答案。现有的常见方法为：通过命名实体识别实体，通过关键词或句子模板确定属性，利用“实体-属性”的关系对进入知识图谱查找答案。但由于自然语言的多样性，识别出的“实体-属性”关系对可能较为模糊，或识别出多个关系对，给图谱路径的确认带来了不确定性。
技术实现思路
针对现有技术中的问题，本专利技术的目的在于提供一种知识图谱路径排序方法、系统、设备及存储介质，解决了知识图谱中路径的不确定性。本专利技术实施例提供一种知识图谱路径排序方法，包括如下步骤：获取输入文本，得到所述输入文本的实体集合，将所述实体集合作为第一数据流；基于所述实体集合进行路径查询，得到候选路径集合，将所述候选路径集合中的各个候选路径分别作为一第二数据流；将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型，得到所述双流深度学习模型输出的第一数据流和各个第...

【技术保护点】
1.一种知识图谱路径排序方法，其特征在于，包括如下步骤：/n获取输入文本，得到所述输入文本的实体集合，将所述实体集合作为第一数据流；/n基于所述实体集合进行路径查询，得到候选路径集合，将所述候选路径集合中的各个候选路径分别作为一第二数据流；/n将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型，得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度；/n根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值，对所述候选路径进行排序。/n

【技术特征摘要】
1.一种知识图谱路径排序方法，其特征在于，包括如下步骤：
获取输入文本，得到所述输入文本的实体集合，将所述实体集合作为第一数据流；
基于所述实体集合进行路径查询，得到候选路径集合，将所述候选路径集合中的各个候选路径分别作为一第二数据流；
将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型，得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度；
根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值，对所述候选路径进行排序。

2.根据权利要求1所述的知识图谱路径排序方法，其特征在于，所述双流深度学习模型包括文本自注意力模块、路径自注意力模块、交叉注意力模块和输出层；
将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型后，所述第一数据流输入所述文本自注意力模块，所述第二数据流输入所述路径自注意力模块，所述文本自注意力模块输出的第一文本特征和所述路径自注意力模块输出的第一路径特征共同输入所述交叉注意力模块，所述交叉注意力模块的输出特征输入所述输出层，所述输出层输出所述第一数据流和所述第二数据流的相似度。

3.根据权利要求2所述的知识图谱路径排序方法，其特征在于，所述文本自注意力模块包括多个依次串联的文本自注意力编码器，每个所述文本自注意力编码器包括一文本自注意力层和一文本前向传播层；
所述路径自注意力模块包括多个依次串联的路径自注意力编码器，每个所述路径自注意力编码器包括一路径自注意力层和一路径前向传播层。

4.根据权利要求2所述的知识图谱路径排序方法，其特征在于，所述交叉注意力模块包括多个依次串联的交叉注意力编码器，每个所述交叉注意力编码器包括第一交叉注意力单元和第二交叉注意力单元，所述第一交叉注意力单元接收前一层输出的文本特征，并输出提供给下一层的文本特征，所述第二交叉注意力单元接收前一层输出的路径特征，并输出提供给下一层的路径特征，且所第一交叉注意力单元和所述第二交叉注意力单元之间进行交叉注意力计算；
所述第一交叉注意力单元输出的特征中第一维度为交叉特征，除第一维度外的特征为第二文本特征，所述第二交叉注意力单元输出的特征为第二路径特征。

5.根据权利要求4所述的知识图谱路径排序方法，其特征在于，所述第一交叉注意力单元包括依次串联的第一交叉注意力层、第一自注意...

【专利技术属性】
技术研发人员：李钊，赵凯，邓晓雨，刘岩，宋慧驹，
申请(专利权)人：泰康保险集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人