答案选择方法、装置、设备及存储介质制造方法及图纸

技术编号:33462609 阅读:13 留言:0更新日期:2022-05-19 00:42
本申请公开了一种答案选择方法、装置、设备及存储介质,对于每个候选答案,本申请提供的方案能够基于该候选答案与其他各个候选答案的相似度,得到候选答案的中间语义向量,并将该中间语义向与初始语义向量进行拼接,得到候选答案的更新语义向量。由于该更新语义向量不仅包含了候选答案本身的信息,还包含了其他候选答案对其的支持性证据信息,因此可以确保基于多个候选答案的更新语义向量,从该多个候选答案中确定出的目标答案的准确性较高。选答案中确定出的目标答案的准确性较高。选答案中确定出的目标答案的准确性较高。

【技术实现步骤摘要】
答案选择方法、装置、设备及存储介质


[0001]本申请涉及自然语言处理(Natural Language Processing,NLP)领域,特别涉及一种答案选择方法、装置、设备及存储介质。

技术介绍

[0002]近年来,基于文本的问答(Question Answering,QA)系统被广泛应用生活中的各个领域(例如医疗领域)。对于用户给出的文本形式的问题,该基于文本的问答系统能够通过检索语料库、知识图谱或问答知识库返回简洁且准确的匹配答案。
[0003]相关技术中,基于文本的问答系统确定匹配答案的过程一般包括检索、抽取和答案选择三个阶段。其中,在检索阶段,问答系统能够获取多个包含有答案的文档。在抽取阶段,问答系统可以从获取到的多个文档中确定出能够回答问题的多个候选答案。之后,在答案选择阶段中,问答系统能够基于每个候选答案与问题在语法或者语义上的匹配程度,确定每个候选答案的正确性,并从该多个候选答案中选择出正确性最高的一个候选答案作为最佳答案。
[0004]然而,仅基于候选答案与问题的匹配程度并不能准确地确定出的候选答案的正确性,上述答案选择方法所确定出的最佳答案的准确性较低。

技术实现思路

[0005]本申请提供了一种答案选择方法、装置、设备及存储介质,能够有效提高答案选择方法所确定出的最佳答案的准确性。所述技术方案如下:
[0006]一方面,提供了一种答案选择方法,所述方法包括:
[0007]对目标问题的多个候选答案中的每个候选答案进行编码,得到每个候选答案的初始语义向量;
[0008]对于所述多个候选答案中的每个候选答案,基于所述候选答案与其他各个候选答案的相似度,对其他各个候选答案的初始语义向量进行加权处理,得到所述候选答案的中间语义向量;
[0009]对于所述多个候选答案中的每个候选答案,将所述候选答案的初始语义向量与中间语义向量进行拼接,得到所述候选答案的更新语义向量;
[0010]基于所述多个候选答案的更新语义向量,从所述多个候选答案中确定出目标答案。
[0011]另一方面,提供了一种答案选择模型的训练方法,所述方法包括:
[0012]获取问题样本的多个答案样本,以及每个所述答案样本的标签,所述标签用于指示所述答案样本是否为所述问题样本的正确答案;
[0013]对所述多个答案样本中的每个答案样本进行编码,得到每个答案样本的初始语义向量;
[0014]对于所述多个答案样本中的每个答案样本,基于所述答案样本与其他各个答案样
本的相似度,对其他各个答案样本的初始语义向量进行加权处理,得到所述答案样本的中间语义向量;
[0015]对于所述多个答案样本中的每个答案样本,将所述答案样本的初始语义向量和所述答案样本的中间语义向量进行拼接,得到所述答案样本的更新语义向量;
[0016]基于所述多个答案样本的更新语义向量以及所述多个答案样本的标签,训练答案选择模型。
[0017]又一方面,提供了一种答案选择装置,所述装置包括:
[0018]编码模块,用于对目标问题的多个候选答案中的每个候选答案进行编码,得到每个候选答案的初始语义向量;
[0019]加权模块,用于对于所述多个候选答案中的每个候选答案,基于所述候选答案与其他各个候选答案的相似度,对其他各个候选答案的初始语义向量进行加权处理,得到所述候选答案的中间语义向量;
[0020]拼接模块,用于对于所述多个候选答案中的每个候选答案,将所述候选答案的初始语义向量与中间语义向量进行拼接,得到所述候选答案的更新语义向量;
[0021]确定模块,用于基于所述多个候选答案的更新语义向量,从所述多个候选答案中确定出目标答案。
[0022]再一方面,提供了一种答案选择模型的训练装置,所述装置包括:
[0023]获取模块,用于获取问题样本的多个答案样本,以及每个所述答案样本的标签,所述标签用于指示所述答案样本是否为所述问题样本的正确答案;
[0024]编码模块,用于对于所述多个答案样本中的每个答案样本进行编码,得到每个答案样本的初始语义向量;
[0025]加权模块,用于对于所述多个答案样本中的每个答案样本,基于所述答案样本与其他各个答案样本的相似度,对其他各个答案样本的初始语义向量进行加权处理,得到所述答案样本的中间语义向量;
[0026]拼接模块,用于对于所述多个候选答案中的每个候选答案,将所述答案样本的初始语义向量和中间语义向量进行拼接,得到所述答案样本的更新语义向量;
[0027]训练模块,用于基于所述多个答案样本的更新语义向量以及所述多个答案样本的标签,训练答案选择模型。
[0028]再一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所提供的答案选择方法,或如上述方面所提供的答案选择模型的训练方法。
[0029]再一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所提供的答案选择方法,或如上述方面所提供的答案选择模型的训练方法。
[0030]再一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设
备执行上述方面所提供的答案选择方法,或上述方面提供的答案选择模型的训练方法。
[0031]本申请提供的技术方案带来的有益效果至少包括:
[0032]本申请提供了一种答案选择方法、装置、设备及存储介质。对于每个候选答案,本申请提供的方案能够基于该候选答案与其他各个候选答案的相似度,得到候选答案的中间语义向量,并将该中间语义向与初始语义向量进行拼接,得到候选答案的更新语义向量。由于该更新语义向量不仅包含了候选答案本身的信息,还包含了其他候选答案对其的支持性证据信息,因此可以确保基于多个候选答案的更新语义向量,从该多个候选答案中确定出的目标答案的准确性较高。
附图说明
[0033]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是本申请实施例提供的一种问答系统的结构示意图;
[0035]图2是本申请实施例提供的一种答案选择方法的流程图;
[0036]图3是本申请实施例提供的另一种答案选择方法的流程图;
[0037]图4是本申请实施例提供的一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案选择方法,其特征在于,所述方法包括:对目标问题的多个候选答案中的每个候选答案进行编码,得到每个候选答案的初始语义向量;对于所述多个候选答案中的每个候选答案,基于所述候选答案与其他各个候选答案的相似度,对其他各个候选答案的初始语义向量进行加权处理,得到所述候选答案的中间语义向量;对于所述多个候选答案中的每个候选答案,将所述候选答案的初始语义向量与中间语义向量进行拼接,得到所述候选答案的更新语义向量;基于所述多个候选答案的更新语义向量,从所述多个候选答案中确定出目标答案。2.根据权利要求1所述的方法,其特征在于,所述对于所述多个候选答案中的每个候选答案,将所述候选答案的初始语义向量与中间语义向量进行拼接,得到所述候选答案的更新语义向量,包括:对于所述多个候选答案中的每个候选答案,将所述候选答案的初始语义向量、所述候选答案的中间语义向量和所述候选答案的乘积向量进行拼接,得到所述候选答案的更新语义向量;其中,所述乘积向量为所述候选答案的初始语义向量与所述候选答案的中间语义向量的向量积。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对于所述多个候选答案中的每个候选答案,基于所述候选答案的初始语义向量与其他各个候选答案的初始语义向量的点乘,确定所述候选答案与其他各个候选答案的相似度。4.根据权利要求1至3任一所述的方法,其特征在于,所述对目标问题的多个候选答案中的每个候选答案进行编码,得到每个候选答案的初始语义向量,包括:对于所述目标问题的多个候选答案中的每个候选答案,将所述目标问题与所述候选答案进行拼接,得到拼接文本;对所述拼接文本进行编码,得到所述候选答案的初始语义向量。5.根据权利要求1至3任一所述的方法,其特征在于,在对目标问题的多个候选答案中的每个候选答案进行编码之前,所述方法还包括:基于所述目标问题,获取与所述目标问题关联的多个文档;针对所述多个文档中的每个文档,获取所述目标问题的一个候选答案,得到多个候选答案。6.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述多个候选答案的更新语义向量,从所述多个候选答案中确定出目标...

【专利技术属性】
技术研发人员:谢润泉张恒邵纪春
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1