问答匹配度计算方法、问答自动匹配方法及装置制造方法及图纸

技术编号:20425334 阅读:16 留言:0更新日期:2019-02-23 08:33
本申请提供了一种问答匹配度计算方法、问答自动匹配方法及装置,其中,该问答匹配度计算方法包括:基于所选定的问题和答案,得到对应于问题的第一特征向量矩阵以及对应于答案的第二特征向量矩阵;基于第一特征向量矩阵和第二特征向量矩阵构建注意力矩阵;使用注意力矩阵更新第一特征向量矩阵和第二特征向量矩阵;基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算问题与答案的匹配度。本申请通过构建的注意力矩阵得到对应于问题的第一特征向量矩阵和对应于答案的第二特征向量矩阵,以确定问题与答案的匹配度,能够切实挖掘应答与所提问题之间的关联度,以便后续进行针对性的检索问答,提升用户的使用体验。

【技术实现步骤摘要】
问答匹配度计算方法、问答自动匹配方法及装置
本申请涉及计算机应用
,具体而言,涉及一种问答匹配度计算方法、问答自动匹配方法及装置。
技术介绍
近年来,随着自然语言处理和深度学习的发展,人们逐渐可以使用机器处理非结构化的自然语言数据来完成复杂的任务,例如问答系统。问答系统主要是解决问句的真实意图分析、问句和答案之间的匹配关系,理解以自然语言形式描述的用户提问,并通过检索语料库或问答知识库返回匹配的正确答案。现有的问答系统主要分为基于检索的问答(Retrieval-basedQuestionAnswering,RQA)系统和基于知识库的问答(KnowledgeBaseQuestionAnswering,KBQA)系统,其中广泛应用的是基于检索的问答系统。上述基于检索的问答系统需要确定查询问题与应答内容的匹配度,然后根据匹配度返回最匹配的内容,而匹配算法是最为关键的部分。相关技术可以利用语义匹配模型来实现查询问题与应答内容的匹配,然而,该语义匹配模型作为一种统计学语言模型,其经过训练后,对未知对话给出的什么样的应答是一种概率事件,这样,在对用户提出的不同对话,经常会给出通用应答,不能够根据用户的对话内容控制应答的语义,导致应答与问题的关联性不足,影响用户的使用体验。
技术实现思路
有鉴于此,本申请的目的在于提供一种问答匹配度计算方法及装置、问答自动匹配方法及装置,以提高应答与所提问题之间的关联度,提升用户的使用体验。本申请实施例提供了一种问答匹配度计算方法,包括:基于所选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵;基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵;使用所述注意力矩阵更新所述第一特征向量矩阵和所述第二特征向量矩阵;基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度。可选的,所述基于选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵,包括:对所述问题进行分词处理,得到对应于所述问题的第一词向量集合;对于所述第一词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第一特征向量;以及组合上述第一特征向量,得到所述第一特征向量矩阵;和/或,对所述答案进行分词处理,得到对应于所述答案的第二词向量集合;对于所述第二词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第二特征向量;以及组合上述第二特征向量,得到所述第二特征向量矩阵。可选的,所述基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵,包括:基于所述第一特征向量矩阵和所述第二特征向量矩阵,使用双向注意力机制构建所述注意力矩阵。可选的,所述基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度,包括:基于所述更新后的第一特征向量矩阵,确定所述问题对应的第一整合特征向量;基于所述更新后的第二特征向量矩阵,确定所述答案对应的第二整合特征向量;以及,基于所述第一整合特征向量和第二整合特征向量计算所述问题与所述答案的匹配度。可选的,还包括:在确定所述第一整合特征向量之前,对所述更新后的第一特征向量矩阵进行再次更新:对于所述更新后的第一特征向量矩阵中的每一特征向量,基于该特征向量之前的前序特征向量和/或位于该特征向量之后的后序特征向量,对该特征向量进行更新;以及基于所述再次更新后的第一特征向量矩阵,确定所述第一整合特征向量;和/或,在确定所述第二整合特征向量之前,对所述更新后的第二特征向量矩阵进行再次更新:对于所述更新后的第二特征向量矩阵中的每一特征向量,基于该特征向量之前的前序特征向量和/或位于该特征向量之后的后序特征向量,对该特征向量进行更新;以及基于所述再次更新后的第二特征向量矩阵,确定所述第二整合特征向量。本申请实施例还提供了一种问答自动匹配方法,包括:响应于目标问题,搜索得到至少一个候选答案;基于所述目标问题以及所述至少一个候选答案,使用问答匹配度计算方法,计算所述目标问题与所述每个候选应答的匹配度;选取匹配度最高的候选应答,作为与所述目标问题匹配的答案。本申请实施例还提供了一种问答匹配度计算装置,包括:向量矩阵生成模块,用于基于所选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵;注意力矩阵构建模块,用于基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵;向量矩阵更新模块,用于使用所述注意力矩阵更新所述第一特征向量矩阵和所述第二特征向量矩阵;匹配度计算模块,用于基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度。可选的,所述向量矩阵生成模块具体用于:对所述问题进行分词处理,得到对应于所述问题的第一词向量集合;对于所述第一词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第一特征向量;以及组合上述第一特征向量,得到所述第一特征向量矩阵;和/或,对所述答案进行分词处理,得到对应于所述答案的第二词向量集合;对于所述第二词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第二特征向量;以及组合上述第二特征向量,得到所述第二特征向量矩阵。可选的,所述注意力矩阵构建模块具体用于:基于所述第一特征向量矩阵和所述第二特征向量矩阵,使用双向注意力机制构建所述注意力矩阵。本申请实施例还提供了一种问答自动匹配装置,包括:搜索模块,用于响应于目标问题,搜索得到至少一个候选答案;匹配度计算模块,用于基于所述目标问题以及所述至少一个候选答案,使用问答匹配度计算装置,计算所述目标问题与所述每个候选应答的匹配度;问答匹配模块,用于选取匹配度最高的候选应答,作为与所述目标问题匹配的答案。本申请实施例提供的问答匹配度计算方法及装置、问答自动匹配方法及装置,解决了现有利用统计学语言模型进行问答匹配所带来的应答与问题的关联性不足,影响用户的使用体验的问题。本申请实施例提供的问答匹配度计算方法,其首先基于所选定的问题和答案,得到对应于问题的第一特征向量矩阵以及对应于答案的第二特征向量矩阵;然后基于第一特征向量矩阵和第二特征向量矩阵构建注意力矩阵,并使用注意力矩阵更新第一特征向量矩阵和第二特征向量矩阵;最后基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算问题与答案的匹配度,其通过构建的注意力矩阵得到对应于问题的第一特征向量矩阵和对应于答案的第二特征向量矩阵,以确定问题与答案的匹配度,能够切实挖掘应答与所提问题之间的关联度,以便后续进行针对性的检索问答,提升用户的使用体验。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普本文档来自技高网...

【技术保护点】
1.一种问答匹配度计算方法,其特征在于,包括:基于所选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵;基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵;使用所述注意力矩阵更新所述第一特征向量矩阵和所述第二特征向量矩阵;基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度。

【技术特征摘要】
1.一种问答匹配度计算方法,其特征在于,包括:基于所选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵;基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵;使用所述注意力矩阵更新所述第一特征向量矩阵和所述第二特征向量矩阵;基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度。2.根据权利要求1所述的方法,其特征在于,所述基于选定的问题和答案,得到对应于所述问题的第一特征向量矩阵以及对应于所述答案的第二特征向量矩阵,包括:对所述问题进行分词处理,得到对应于所述问题的第一词向量集合;对于所述第一词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第一特征向量;以及组合上述第一特征向量,得到所述第一特征向量矩阵;和/或,对所述答案进行分词处理,得到对应于所述答案的第二词向量集合;对于所述第二词向量集合中的每一词向量,基于该词向量以及位于该词向量之前的前序词向量和/或位于该词向量之后的后序词向量,得到该词向量所对应的第二特征向量;以及组合上述第二特征向量,得到所述第二特征向量矩阵。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量矩阵和所述第二特征向量矩阵构建注意力矩阵,包括:基于所述第一特征向量矩阵和所述第二特征向量矩阵,使用双向注意力机制构建所述注意力矩阵。4.根据权利要求1所述的方法,其特征在于,所述基于更新后的第一特征向量矩阵和第二特征向量矩阵,计算所述问题与所述答案的匹配度,包括:基于所述更新后的第一特征向量矩阵,确定所述问题对应的第一整合特征向量;基于所述更新后的第二特征向量矩阵,确定所述答案对应的第二整合特征向量;以及,基于所述第一整合特征向量和第二整合特征向量计算所述问题与所述答案的匹配度。5.根据权利要求4所述的方法,其特征在于,还包括:在确定所述第一整合特征向量之前,对所述更新后的第一特征向量矩阵进行再次更新:对于所述更新后的第一特征向量矩阵中的每一特征向量,基于该特征向量之前的前序特征向量和/或位于该特征向量之后的后序特征向量,对该特征向量进行更新;以及基于所述再次更新后的第一特征向量矩阵,确定所述第一整合特征向量;和/或,在确定所述第二整合特征向量之前,对所述更新后的第二特征向量矩阵进行再次更新:对于所述...

【专利技术属性】
技术研发人员:蔡世清郑凯段立新江建军
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1