问题解答方法及装置制造方法及图纸

技术编号:36646645 阅读:13 留言:0更新日期:2023-02-18 13:06
本说明书提供问题解答方法及装置,其中所述问题解答方法包括:获取待解答问题,所述待解答问题包括至少两个空缺位置;将所述待解答问题输入问题解答模型的编码器,获得所述待解答问题对应的语义向量;通过所述问题解答模型的解码器,对所述语义向量进行解码,获得所述待解答问题的至少两个空缺位置对应的答案。如此,利用问题解答模型更好的理解问题的上下文语义,一次性获得问题中所有子问题的答案,实现了高精度的自动解题,大大提高了问题的解答效率和正确率。效率和正确率。效率和正确率。

【技术实现步骤摘要】
问题解答方法及装置


[0001]本说明书涉及人工智能
,特别涉及问题解答方法及装置。

技术介绍

[0002]随着计算机和人工智能技术的不断发展,越来越多的工作和学习任务可以自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术自动解析问题的答案,从而大大节省人力资源。
[0003]现有技术中,往往是预先基于大量的问题,抽象规则,建立不同知识点、不同类型的公式模板,在需要解答某个问题的时候,可以将该问题的题目自动匹配至概率最大的公式模板,然后使用该公式模板确定出相应的答案。
[0004]然而,上述的问题解答方法,需要基于大量的问题数据,预先创建大规模的公式模板,以保证待解答的问题可以匹配到对应的公式模板,操作繁琐、耗时长、效率低,且维护成本极高,需要定期对存储的公式模板进行优化,极大影响了问题的解答效率和正确率。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了一种问题解答方法。本说明书同时涉及一种问题解答装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的问题的解答效率和正确率较低的问题。
[0006]根据本说明书实施例的第一方面,提供了一种问题解答方法,包括:
[0007]获取待解答问题,待解答问题包括至少两个空缺位置;
[0008]将待解答问题输入问题解答模型的编码器,获得待解答问题对应的语义向量;
[0009]通过问题解答模型的解码器,对语义向量进行解码,获得待解答问题的至少两个空缺位置对应的答案。
[0010]根据本说明书实施例的第二方面,提供了另一种问题解答方法,包括:
[0011]将待解答问题的编码信息输入问题解答模型的编码器,获得编码信息对应的语义向量,待解答问题包括至少一个空缺位置;
[0012]通过问题解答模型的解码器,对语义向量进行解码,获得待解答问题的第i个答案字符;
[0013]将第i个答案字符拼接在编码信息之后,得到更新后的编码信息,令i自增1,并返回执行将编码信息输入问题解答模型的编码器的操作步骤,直至获得待解答问题的最后一个答案字符,得到待解答问题的至少一个空缺位置对应的答案。
[0014]根据本说明书实施例的第三方面,提供了一种问题解答装置,包括:
[0015]第一获取模块,被配置为获取待解答问题,待解答问题包括至少两个空缺位置;
[0016]第一获得模块,被配置为将待解答问题输入问题解答模型的编码器,获得待解答问题对应的语义向量;
[0017]第二获得模块,被配置为通过问题解答模型的解码器,对语义向量进行解码,获得
待解答问题的至少两个空缺位置对应的答案。
[0018]根据本说明书实施例的第四方面,提供了另一种问题解答装置,包括:
[0019]第三获得模块,被配置为将待解答问题的编码信息输入问题解答模型的编码器,获得编码信息对应的语义向量,待解答问题包括至少一个空缺位置;
[0020]第四获得模块,被配置为通过问题解答模型的解码器,对语义向量进行解码,获得待解答问题的第i个答案字符;
[0021]执行模块,被配置为将第i个答案字符拼接在编码信息之后,得到更新后的编码信息,令i自增1,并返回执行将编码信息输入问题解答模型的编码器的操作步骤,直至获得待解答问题的最后一个答案字符,得到待解答问题的至少一个空缺位置对应的答案。
[0022]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0023]存储器和处理器;
[0024]存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,以实现上述任一项的问题解答方法的操作步骤。
[0025]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述任一项的问题解答方法的操作步骤。
[0026]本说明书提供的问题解答方法,可以获取待解答问题,然后再将该待解答问题输入问题解答模型的编码器,获得待解答问题对应的语义向量,并通过问题解答模型的解码器,对语义向量进行解码,获得待解答问题的至少两个空缺位置对应的答案。这种情况下,可以将待解答问题输入问题解答模型中,该问题解答模型可以输出待解答问题中的至少两个空缺位置对应的答案,利用问题解答模型更好的理解问题的上下文语义,一次性获得问题中所有子问题的答案,如此可以基于预先训练好的问题解答模型自动、高效、准确地分析出问题的各个正确答案,将深度学习方法应用于问题解题过程中,实现了高精度的自动解题,大大提高了问题的解答效率和正确率。
附图说明
[0027]图1是本说明书一实施例提供的一种问题解答方法的流程图;
[0028]图2是本说明书实施例提供的一种问题解答模型的模型架构图;
[0029]图3是本说明书一实施例提供的一种问题的自动解答处理示意图;
[0030]图4是本说明书一实施例提供的另一种问题解答方法的流程图;
[0031]图5是本说明书实施例提供的另一种问题解答模型的模型架构图;
[0032]图6是本说明书一实施例提供的一种问题解答装置的结构示意图;
[0033]图7是本说明书一实施例提供的另一种问题解答装置的结构示意图;
[0034]图8是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
[0035]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0036]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,
而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、
“”
和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0037]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0038]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0039]Transformer模型:其本质上是一个Encoder

Decoder的结构,编码器由6个编码block组成(encoder每个block由self

a本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题解答方法,其特征在于,包括:获取待解答问题,所述待解答问题包括至少两个空缺位置;将所述待解答问题输入问题解答模型的编码器,获得所述待解答问题对应的语义向量;通过所述问题解答模型的解码器,对所述语义向量进行解码,获得所述待解答问题的至少两个空缺位置对应的答案。2.根据权利要求1所述的问题解答方法,其特征在于,所述获取待解答问题之后,还包括:提取所述待解答问题中包括的各个数值;根据预设映射规则,为所述各个数值设置对应的第一预设字符,构建所述待解答问题的数值映射列表。3.根据权利要求2所述的问题解答方法,其特征在于,所述预设映射规则为从左至右依次编号;所述根据预设映射规则,为所述各个数值设置对应的第一预设字符,构建所述待解答问题的数值映射列表,包括:将所述各个数值按照在所述待解答问题中的先后顺序从左至右依次排列;依次为所述各个数值中的每个数值设置对应的第一预设字符;将所述各个数值以及对应的第一预设字符进行对应存储,构建得到所述待解答问题的数值映射列表。4.根据权利要求2所述的问题解答方法,其特征在于,所述将所述待解答问题输入问题解答模型的编码器,获得所述待解答问题对应的语义向量,包括:将所述待解答问题中的数值替换为对应的第一预设字符;将替换后的待解答问题输入问题解答模型的编码器,获得所述待解答问题对应的语义向量。5.根据权利要求2所述的问题解答方法,其特征在于,所述获得所述待解答问题的至少两个空缺位置对应的答案之后,还包括:确定所述至少两个空缺位置对应的答案中是否存在包括所述第一预设字符的目标答案;若存在所述目标答案,则根据所述数值映射列表,确定所述第一预设字符对应的目标数值;将所述目标数值带入所述目标答案的第一预设字符处,解析得到所述待解答问题的正确答案。6.根据权利要求1

5任一项所述的问题解答方法,其特征在于,所述编码器包括嵌入层和语义信息分析层;所述将所述待解答问题输入问题解答模型的编码器,获得所述待解答问题对应的语义向量,包括:将所述待解答问题拆分为词单元,并在第一个词单元之前添加起始位置标识词单元,在最后一个词单元之后添加结束位置标识词单元;将各个所述词单元输入所述嵌入层进行嵌入化处理,获得所述各个词单元对应的编码
矩阵;将所述编码矩阵输入所述语义信息分析层,获得所述各个词单元对应的语义向量。7.根据权利要求6所述的问题解答方法,其特征在于,所述获得所述各个词单元对应的语义向量之后,还包括:确定所述各个词单元对应的语义向量中起始位置标识词单元对应的目标语义向量;根据所述目标语义向量,对所述解码器的状态参数进行初始化。8.根据权利要求1

5任一项所述的问题解答方法,其特征在于,所述解码器中包括解码词库;所述通过所述问题解答模型的解码器,对所述语义向量进行解码,获得所述待解答问题的至少两个空缺位置对应的答案,包括:将所述语义向量输入所述解码器;通过所述解码词库,解码所述待解答问题的第一个空缺位置处的输出答案;在未解码到结束符号的情况下,在所述输出答案后生成预设间隔符,并继续解码所述待解答问题的下一个空缺位置处的输出答案,直至解码到结束符号,获得所述待解答问题的至少两个空缺位置对应的答案。9.根据权利要求1

5任一项所述的问题解答方法,其特征在于,所述获取待解答问题之后,还包括:确定所述待解答问题中的至少两个空缺位置;将所述至少两个空缺位置替换为第二预设字符。10.根据权利要求1

5任一项所述的问题解答方法,其特征在于,所述问题解答模型通过如下方法训练得到:获取第一训练样本,并根据预设映射规则,将所述第一训练样本中的数值替换为对应的第一预设字符,得到第二训练样本,所述第一训练样本携带样本标签;将所述第二训练样本输入问题解答模型,得到预测答案;根据所述预测答案和样本标签,计算所述问题解答模型的损失值,基于所述损失值对所述问题解答模型进行训练,并返回执行所述获取第一训练样本的操作步骤,直至达到训练停止条件。11.根据权利要求10所述的问题解答方法,其特征在于,所述获取第一训练样本,包括:获取第一训练样本和所述第一训练样本对应的至少两个答案;在所述至少两个答案的每两个相邻答案之间设置预设间隔符,构造得到所述第一训练样本的样本标签。12.一种问题解答方法,其特征在于,包括:将待解答问题的编码信息输入问题解答模型的编码器,获得所述编码信息对应的语义向量,所述待解答问题包括至少一个空缺位置;通过所述问题解答模型的解码器,对所述语义向量进行解码,获得所述待解答问题的第i个答案字符;将所述第i个答案字符拼接在所述编码信息之后,得到更新后的编码信息,令i自增1,并返...

【专利技术属性】
技术研发人员:张天宇王亮柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1