知识图谱路径排序方法、系统、设备及存储介质技术方案

技术编号:29401087 阅读:16 留言:0更新日期:2021-07-23 22:38
本发明专利技术提供了一种知识图谱路径排序方法、系统、设备及存储介质,该方法包括:获取输入文本,得到所述输入文本的实体集合,将所述实体集合作为第一数据流;基于所述实体集合进行路径查询,得到候选路径集合,将所述候选路径集合中的各个候选路径分别作为一第二数据流;将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型,得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度;根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值,对所述候选路径进行排序。本发明专利技术解决了知识图谱中路径的不确定性,提高了知识图谱路径排序的准确率。

【技术实现步骤摘要】
知识图谱路径排序方法、系统、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种知识图谱路径排序方法、系统、设备及存储介质。
技术介绍
开放域文本问答(OpenQA)在给定问题的同时,不提供单篇段落或者文档,而是需要在文档集合或者整个网页中寻找答案。由于开放域问答对话技术涉及的知识面十分广阔,且理论上可无限扩展,因此传统的FAQ技术不适用于开放域场景。在采用知识图谱作为问答的知识来源时,涉及到的技术有句法分析、实体识别、图数据库查询和图谱路径排序等。知识图谱问答技术的关键在于正确识别问句的实体及语义,并在图谱中找到正确的路径以确定答案。现有的常见方法为:通过命名实体识别实体,通过关键词或句子模板确定属性,利用“实体-属性”的关系对进入知识图谱查找答案。但由于自然语言的多样性,识别出的“实体-属性”关系对可能较为模糊,或识别出多个关系对,给图谱路径的确认带来了不确定性。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种知识图谱路径排序方法、系统、设备及存储介质,解决了知识图谱中路径的不确定性。本专利技术实施例提供一种知识图谱路径排序方法,包括如下步骤:获取输入文本,得到所述输入文本的实体集合,将所述实体集合作为第一数据流;基于所述实体集合进行路径查询,得到候选路径集合,将所述候选路径集合中的各个候选路径分别作为一第二数据流;将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型,得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度;根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值,对所述候选路径进行排序。在一些实施例中,所述双流深度学习模型包括文本自注意力模块、路径自注意力模块、交叉注意力模块和输出层;将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型后,所述第一数据流输入所述文本自注意力模块,所述第二数据流输入所述路径自注意力模块,所述文本自注意力模块输出的第一文本特征和所述路径自注意力模块输出的第一路径特征共同输入所述交叉注意力模块,所述交叉注意力模块的输出特征输入所述输出层,所述输出层输出所述第一数据流和所述第二数据流的相似度。在一些实施例中,所述文本自注意力模块包括多个依次串联的文本自注意力编码器,每个所述文本自注意力编码器包括一文本自注意力层和一文本前向传播层;所述路径自注意力模块包括多个依次串联的路径自注意力编码器,每个所述路径自注意力编码器包括一路径自注意力层和一路径前向传播层。在一些实施例中,所述交叉注意力模块包括多个依次串联的交叉注意力编码器,每个所述交叉注意力编码器包括第一交叉注意力单元和第二交叉注意力单元,所述第一交叉注意力单元接收前一层输出的文本特征,并输出提供给下一层的文本特征,所述第二交叉注意力单元接收前一层输出的路径特征,并输出提供给下一层的路径特征,且所第一交叉注意力单元和所述第二交叉注意力单元之间进行交叉注意力计算;所述第一交叉注意力单元输出的特征中第一维度为交叉特征,除第一维度外的特征为第二文本特征,所述第二交叉注意力单元输出的特征为第二路径特征。在一些实施例中,所述第一交叉注意力单元包括依次串联的第一交叉注意力层、第一自注意力层和第一前向传播层,所述第二交叉注意力单元包括依次串联的第二交叉注意力层、第二自注意力层和第二前向传播层,所述第一交叉注意力层和所述第二交叉注意力层之间进行交叉注意力计算。在一些实施例中,所述交叉注意力模块的输出特征输入所述输出层,所述输出层输出所述第一数据流和所述第二数据流的相似度,包括如下步骤:将所述交叉注意力模块输出的第二文本特征、交叉特征和第二路径特征组合后得到总特征,输入所述输出层,所述输出层输出所述第一数据流和所述第二数据流的相似度。在一些实施例中,所述交叉注意力模块的输出特征输入所述输出层,所述输出层输出所述第一数据流和所述第二数据流的相似度,包括如下步骤:将所述交叉注意力模块输出的第二文本特征和第二路径特征输入所述输出层,所述输出层计算所述第二文本特征和第二路径特征的相似度,作为所述第一数据流和所述第二数据流的相似度;或将所述交叉注意力模块输出的交叉特征输入所述输出层,所述输出层基于所述交叉特征进行分类,得到分类类别,根据所述分类类别的概率作为所述第一数据流和所述第二数据流的相似度。本专利技术实施例还提供一种知识图谱路径排序系统,用于实现所述的知识图谱路径排序方法,所述系统包括:实体集合获取模块,用于获取输入文本,得到所述输入文本的实体集合,将所述实体集合作为第一数据流;路径集合获取模块,用于基于所述实体集合进行路径查询,得到候选路径集合,将所述候选路径集合中的各个候选路径分别作为一第二数据流;相似度计算模块,用于将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型,得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度;候选路径排序模块,用于根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值,对所述候选路径进行排序。本专利技术实施例还提供一种知识图谱路径排序设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的知识图谱路径排序方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的知识图谱路径排序方法的步骤。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。本专利技术的知识图谱路径排序方法、系统、设备及存储介质具有如下有益效果:本专利技术首先分别获取实体集合和候选路径集合,然后将其作为第一数据流和第二数据流输入到双流深度学习模型中,并基于模型输出的相似度来对候选路径进行排序,解决了知识图谱中路径的不确定性,提升知识图谱路径排序的准确率,进而提升各上层应用(例如各类问答机器人)的用户体验。本专利技术的方案不仅可以应用于问答场景,也可以应用于其他涉及到知识图谱路径排序的人工智能、机器学习等场景。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。图1是本专利技术一实施例的知识图谱路径排序方法的流程图;图2是本专利技术一实施例的基于该知识图谱路径排序方法的开放域图谱问答实现的流程图;图3是本专利技术一实施例的双流深度学习模型的结构示意图;图4是本专利技术一实施例的自注意力模块的结构示意图;图5是本专利技术一实施例的自注意力编码器的结构示意图;图6是本专利技术一实施例的自注意力编码器的数据流的示意图;图7是本专利技术一实施例的交叉注意力模块的结构示意图;图8是本专利技术一实施例的交叉注意力编码器的结构示意图;图9是本专利技术一实施例的交叉注意力编码器的数据流的示意图;图10是本专利技术一实施本文档来自技高网...

【技术保护点】
1.一种知识图谱路径排序方法,其特征在于,包括如下步骤:/n获取输入文本,得到所述输入文本的实体集合,将所述实体集合作为第一数据流;/n基于所述实体集合进行路径查询,得到候选路径集合,将所述候选路径集合中的各个候选路径分别作为一第二数据流;/n将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型,得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度;/n根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值,对所述候选路径进行排序。/n

【技术特征摘要】
1.一种知识图谱路径排序方法,其特征在于,包括如下步骤:
获取输入文本,得到所述输入文本的实体集合,将所述实体集合作为第一数据流;
基于所述实体集合进行路径查询,得到候选路径集合,将所述候选路径集合中的各个候选路径分别作为一第二数据流;
将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型,得到所述双流深度学习模型输出的第一数据流和各个第二数据流的相似度;
根据所述双流深度学习模型输出的对应于各个所述候选路径的相似度值,对所述候选路径进行排序。


2.根据权利要求1所述的知识图谱路径排序方法,其特征在于,所述双流深度学习模型包括文本自注意力模块、路径自注意力模块、交叉注意力模块和输出层;
将所述第一数据流依次和各个所述第二数据流一起输入双流深度学习模型后,所述第一数据流输入所述文本自注意力模块,所述第二数据流输入所述路径自注意力模块,所述文本自注意力模块输出的第一文本特征和所述路径自注意力模块输出的第一路径特征共同输入所述交叉注意力模块,所述交叉注意力模块的输出特征输入所述输出层,所述输出层输出所述第一数据流和所述第二数据流的相似度。


3.根据权利要求2所述的知识图谱路径排序方法,其特征在于,所述文本自注意力模块包括多个依次串联的文本自注意力编码器,每个所述文本自注意力编码器包括一文本自注意力层和一文本前向传播层;
所述路径自注意力模块包括多个依次串联的路径自注意力编码器,每个所述路径自注意力编码器包括一路径自注意力层和一路径前向传播层。


4.根据权利要求2所述的知识图谱路径排序方法,其特征在于,所述交叉注意力模块包括多个依次串联的交叉注意力编码器,每个所述交叉注意力编码器包括第一交叉注意力单元和第二交叉注意力单元,所述第一交叉注意力单元接收前一层输出的文本特征,并输出提供给下一层的文本特征,所述第二交叉注意力单元接收前一层输出的路径特征,并输出提供给下一层的路径特征,且所第一交叉注意力单元和所述第二交叉注意力单元之间进行交叉注意力计算;
所述第一交叉注意力单元输出的特征中第一维度为交叉特征,除第一维度外的特征为第二文本特征,所述第二交叉注意力单元输出的特征为第二路径特征。


5.根据权利要求4所述的知识图谱路径排序方法,其特征在于,所述第一交叉注意力单元包括依次串联的第一交叉注意力层、第一自注意...

【专利技术属性】
技术研发人员:李钊赵凯邓晓雨刘岩宋慧驹
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1