问题解答方法及装置制造方法及图纸

技术编号:36367975 阅读:16 留言:0更新日期:2023-01-18 09:25
本说明书提供问题解答方法及装置,其中所述问题解答方法包括:获取待解答问题;将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量;将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。如此,可以通过问题解答模型的预训练语言层对输入的问题进行语义分析,获得问题的上下文语义,即语义向量,然后通过分类层对获得的语义向量进行分析,得到对应的答案类别,实现基于预先训练好的问题解答模型自动、高效、准确地分析出问题的正确答案,大大提高了问题的解答效率和正确率。问题的解答效率和正确率。问题的解答效率和正确率。

【技术实现步骤摘要】
问题解答方法及装置


[0001]本说明书涉及人工智能
,特别涉及问题解答方法及装置。

技术介绍

[0002]随着计算机和人工智能技术的不断发展,越来越多的工作和学习任务可以自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术自动解析某些问题的答案,从而大大节省人力资源。
[0003]现有技术中,往往是预先基于大量的问题,建立不同知识点、不同类型的模板,在需要解答某个问题的时候,可以将该问题的内容自动匹配至对应的模板,然后根据该模板确定出相应的答案。然而,上述的问题解答方法,需要基于大量的问题数据,预先创建大规模的模板,以保证待解答问题有对应模板,操作繁琐、耗时长、效率低,且维护成本极高,需要定期对存储的模板进行优化,极大影响了问题的解答效率和正确率。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种问题解答方法。本说明书同时涉及一种问题解答装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的问题的解答效率和正确率较低的问题。
[0005]根据本说明书实施例的第一方面,提供了一种问题解答方法,包括:
[0006]获取待解答问题;
[0007]将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量;
[0008]将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。
[0009]根据本说明书实施例的第二方面,提供了一种问题解答装置,包括:
[0010]获取模块,被配置为获取待解答问题;
[0011]获得模块,被配置为将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量;
[0012]确定模块,被配置为将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。
[0013]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0014]存储器和处理器;
[0015]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现下述方法:
[0016]获取待解答问题;
[0017]将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量;
[0018]将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。
[0019]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述问题解答方法的步骤。
[0020]本说明书提供的问题解答方法,可以获取待解答问题,然后将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量,再将所述语义向量输入所述问题解答模型的分类层,并根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。这种情况下,可以通过问题解答模型的预训练语言层对输入的问题进行语义分析,获得问题的上下文语义,即语义向量,然后通过分类层对获得的语义向量进行分析,得到对应的答案类别,也即可以基于预先训练好的问题解答模型自动、高效、准确地分析出问题的正确答案,将深度学习方法应用于问题解答过程中,实现了高精度的自动解答,大大提高了问题的解答效率和正确率。
附图说明
[0021]图1是本说明书一实施例提供的一种问题解答方法的流程图;
[0022]图2是本申请一实施例提供的一种问题自动解答的处理流程示意图;
[0023]图3是本说明书一实施例提供的一种问题解答装置的结构示意图;
[0024]图4是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
[0025]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0026]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0027]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0028]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0029]OCR(光学字符识别,Optical Character Recognition):是指对文本资料进行扫描后,对图像文件进行分析处理,获取文字及版面信息的过程,衡量OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性、产品的稳定性、易用性及可行性等。
[0030]Transformer模型:其本质上是一个Encoder

Decoder的结构,编码器由6个编码
block组成(encoder每个block由self

attention,FFNN组成),同样解码器是6个解码block组成(decoder每个block由self

attention,encoder

decoder attention以及FFNN组成),与所有的生成模型相同的是,编码器的输出会作为解码器的输入。
[0031]BERT模型:一种双向注意力神经网络模型。BERT模型可以通过左、右两侧上下文来预测当前词和通过当前句子预测下一个句子。BERT模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的文本的语义表示,然后将文本的语义表示在特定NLP任务中作微调,最终应用于该NLP任务。
[0032]词单元(token):对输入文本做任何实际处理前,都需要将其分割成诸如词、标点符号、数字或纯字母数字等语言单元,这些单元被称为词单元。对于英文文本,词单元可以是一个单词、一个标点符号、一个数字等,对于中文文本,最小的词单元可以是一个字、一个标点符号、一个数字等。
[0033]词嵌入:是指把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。
[0034]归一化指数函本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题解答方法,其特征在于,包括:获取待解答问题;将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量;将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案。2.根据权利要求1所述的问题解答方法,其特征在于,所述获取待解答问题之后,还包括:确定所述待解答问题中是否存在目标预设字符;在所述待解答问题中存在所述目标预设字符的情况下,根据预设归一化规则,确定所述目标预设字符对应的归一化表示;将所述待解答问题中的目标预设字符替换为所述归一化表示。3.根据权利要求2所述的问题解答方法,其特征在于,所述目标预设字符为预设特殊字符;所述根据预设归一化规则,确定所述目标预设字符对应的归一化表示,包括:根据预先存储的多级特殊字符和归一化表示的对应关系,确定所述目标预设字符对应的归一化表示。4.根据权利要求2所述的问题解答方法,其特征在于,所述目标预设字符为预设异常字符;所述根据预设归一化规则,确定所述目标预设字符对应的归一化表示,包括:确定所述目标预设字符在所述待解答问题中的排列方式是否符合预设排列规则;若符合预设排列规则,则根据预先存储的异常字符和归一化表示的对应关系,确定所述目标预设字符对应的归一化表示。5.根据权利要求1

4任一项所述的问题解答方法,其特征在于,所述预训练语言层包括编码层、神经网络层和注意力层;所述将所述待解答问题输入问题解答模型的预训练语言层,获得所述待解答问题的语义向量,包括:将所述待解答问题拆分为词单元;将拆分得到的各个词单元输入所述预训练语言层包括的编码层,生成各个词单元对应的词向量;将所述各个词单元对应的词向量输入所述预训练语言层包括的神经网络层,生成所述待解答问题的编码向量;将所述待解答问题的编码向量输入注意力层,生成所述待解答问题的语义向量。6.根据权利要求1

4任一项所述的问题解答方法,其特征在于,所述将所述语义向量输入所述问题解答模型的分类层,根据所述分类层输出的分类结果,确定所述待解答问题的正确答案,包括:将所述语义向量输入所述问题解答模型的分类层,得到所述分类层输出的答案为正确类别的概率和答案为错误类别的概率;将概率最大的类别确定为所述待解答问题的正确答案。
7.根据权利要求1

4任一项所述的问题解答方法,其特征在于,所述获取待解答问题之后,还包括:获取所述待解答问题的解答信息;相应地,所述确定所述待解答问题的正确...

【专利技术属性】
技术研发人员:王乐王伟泽王亮赵薇柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1