一种基于特征分类的问答方法及系统技术方案

技术编号:38008557 阅读:13 留言:0更新日期:2023-06-30 10:26
本发明专利技术涉及一种基于特征分类的问答方法及系统,属于自然语言处理技术领域;解决现有技术中的问答模型推断速度慢,且答案预测不够准确的问题。本发明专利技术的问答方法包括以下步骤:获取待处理问题,得到待处理问题对应的类别;在文本语料库中搜索与待处理问题相同类别且相关度最高的原始文本数据;文本语料库包括多个不同类别的原始文本数据;将待处理问题和对应的相关度最大的原始文本数据分别与对应的类别标签融合得到对应的两个带有类别标签信息的特征向量,将两个特征向量输入预先训练的智能问答模型的答案预测模块,基于待处理问题对应的特征向量,在原始文本对应的特征向量中预测得到待处理问题对应的答案。预测得到待处理问题对应的答案。预测得到待处理问题对应的答案。

【技术实现步骤摘要】
一种基于特征分类的问答方法及系统


[0001]本专利技术涉及自然语言处理
,特别涉及一种基于特征分类的问答方法及系统。

技术介绍

[0002]近年来,端到端的问答模型的研究取得了显著的进步,也得到了广泛的应用,目前的问答模型通常会利用两个关键的组成部分:处理序列化输入的循环模型和处理长期交互的注意力组件。
[0003]而现有模型的循环性质导致训练和推断都十分缓慢,特别是对于长文本来说,高昂的训练开销不仅导致了很长的实验周期,限制了研究者进行迅速的迭代,还妨碍了模型被用于大型数据集。且缓慢的推断阻碍了机器阅读理解系统在实时应用中的部署。
[0004]因此,如何使得问答模型更加迅速地获取并理解大问答对与文本的注意关系,并更加快速且准确地预测出问题对应的答案信息,成为目前急需解决的问题。

技术实现思路

[0005]鉴于上述的分析,本专利技术旨在提供一种基于特征分类的问答方法及系统;解决现有技术中的问答模型推断速度慢,且答案预测不够准确的问题。
[0006]本专利技术的目的主要是通过以下技术方案实现的:一方面,本专利技术提供了一种基于特征分类的问答方法,包括以下步骤:获取待处理问题,得到所述待处理问题对应的类别;在文本语料库中搜索与所述待处理问题相同类别且相关度最高的原始文本数据;所述文本语料库包括多个不同类别的原始文本数据;将所述待处理问题和对应的相关度最大的原始文本数据分别与对应的类别标签融合得到对应的两个带有类别标签信息的特征向量,将两个特征向量输入预先训练的智能问答模型的答案预测模块,基于所述待处理问题对应的特征向量,在原始文本对应的特征向量中预测得到所述待处理问题对应的答案。
[0007]进一步的,通过智能问答模型的特征分类模块得到所述待处理问题对应的类别,包括:所述特征分类模块为基于Bert

LSTM的分类模块;将获取的所述待处理问题输入所述特征分类模块的Bert层,进行特征提取和向量表示,得到具有文本语义信息的特征向量;将得到的所述特征向量输入LSTM层,经过时间序列特征提取并进行分类,得到所述待处理问题的类别。
[0008]进一步的,所述答案预测模块包括输入嵌入层、嵌入编码层、查询问题注意层、模型编码器层和输出层;所述输入嵌入层用于对输入的带有类别标签信息的特征向量进行词嵌入和字符
嵌入,得到输入嵌入层隐向量;所述嵌入编码层用于基于所述输入嵌入层隐向量进行特征提取及注意力计算,得到具有全文语义信息的编码表示;所述查询问题注意层用于基于所述编码表示计算得到问题到原始文本的第一关注度和原始文本到问题的第二关注度;
[0009]所述模型编码器层用于基于原始文本的编码表示及所述第一关注度和第二关注度提取得到全局信息的特征、以及预测答案在原始文本数据中的开始位置特征和结束位置特征;所述输出层用于基于全局信息的特征、开始位置特征和结束位置特征预测原始文本数据中每个位置的单词作为答案开始或结束的概率,并输出所述待处理问题对应的答案。
[0010]进一步的,所述智能问答模型的训练包括:基于所述文本语料库中的原始文本数据构建标准问答对,基于所述标准问答对、原始文本和类别标签构建得到训练样本集;所述标准问答对中包括标准问题和标准答案;基于所述训练样本集中的标准问题、标准答案和原始文本数据以及类别标签,利用损失函数对所述特征分类模块进行迭代训练,得到收敛的所述智能问答模型的特征分类模块;将所述特征分类模块中Bert层输出的所述标准问题、标准答案及原始文本数据的特征向量分别与对应的类别标签的特征向量进行融合,得到对应的带有类别信息的特征向量;将带有类别信息的各个特征向量分别输入所述答案预测模块,基于标准问题和标准答案对应的特征向量,在原始文本特征向量中预测答案,经过损失函数迭代更新,得到收敛的所述智能问答模型的答案预测模块。
[0011]进一步的,所述查询问题注意层用于基于所述编码表示计算得到问题到原始文本的关注度和原始文本到问题的关注度,包括:基于所述嵌入编码层输出的所述问题与原始文本的编码表示,计算得到相似矩阵;对相似性矩阵的每一行求softmax,得到问题到原始文本的关注度矩阵,表示为:;对相似性矩阵的每一列求softmax,得到原始文本到问题的关注度矩阵,表示为:;其中,表示原始文本数据中第i个词,表示输入的问题中第j个词,Q和C分别为问题和原始文本的编码矩阵,为可训练的标量函数,实现对两个输入向量之间的相似性进行编码。
[0012]进一步的,所述相似矩阵表示为:;
为可训练参数,q、c分别为标准问题和原始文本的编码表示,表示元素相乘。
[0013]进一步的,所述输出层通过下述公式计算得到答案的起始位置和结束位置的概率:;;其中,和分别是单词作为答案开始和结束的概率;和是可训练的参数,为模型提取的原始文本的全局信息的特征,为模型提取预测答案开始位置的特征,为模型提取预测答案结束位置的特征。
[0014]进一步的,所述答案预测模型训练的损失函数的公式为:;其中,和分别表示模型处理第i个样本时预测的答案的起始和结束位置概率,和为第i个样本对应的标准答案在原始文本中的开始位置和结束位置,N表示样本个数。
[0015]另一方面,还提供一种基于特征分类的问答系统,包括数据输入模块、特征分类模块、相似文本检索模块和答案预测模块;所述数据输入模块用于获取用户输入的待处理问题;所述特征分类模块用于基于预设的类别对所述待处理问题进行特征提取和分类,得到所述问题对应的特征向量和类别;所述相似文本检索模块用于在预设的文本语料库中进行检索,得到与所述待处理问题相同类别且相似度最大的原始文本,并将所述待处理问题和原始文本分别于对应的类别标签进行融合;所述答案预测模块用于基于融合了类别信息的待处理问题,在对应的原始文本中进行答案预测,输出待处理问题对应的答案。
[0016]进一步的,所述答案预测模块包括输入嵌入层、嵌入编码层、查询问题注意层、模型编码器层和输出层;所述输入嵌入层用于对输入的带有类别标签信息的特征向量进行词嵌入和字符嵌入,得到输入嵌入层隐向量;所述嵌入编码层用于基于所述输入嵌入层隐向量进行特征提取及注意力计算,得到具有全文语义信息的编码表示;所述查询问题注意层用于基于所述编码表示计算得到问题到原始文本的第一关注度和原始文本到问题的第二关注度;所述模型编码器层用于基于原始文本的编码表示及所述第一关注度和第二关注度提取得到全局信息的特征、以及预测答案在原始文本数据中的开始位置特征和结束位置特征;所述输出层用于基于全局信息的特征、开始位置特征和结束位置特征
预测原始文本数据中每个位置的单词作为答案开始或结束的概率,并输出所述待处理问题对应的答案。
[0017]本技术方案的有益效果:1、本专利技术通过设置特征分类层,对输入的问题获取自定义的分类标签信息,通过在问题及原始文本中融入分类信息,能够准确定位问题的类别以及领域信息,基于融入了类别和领域信息特征数据进行预测,显著提高了问答模型答案预测的准确性。
[0018]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征分类的问答方法,其特征在于,包括以下步骤:获取待处理问题,得到所述待处理问题对应的类别;在文本语料库中搜索与所述待处理问题相同类别且相关度最高的原始文本数据;所述文本语料库包括多个不同类别的原始文本数据;将所述待处理问题和对应的相关度最大的原始文本数据分别与对应的类别标签融合得到对应的两个带有类别标签信息的特征向量,将两个特征向量输入预先训练的智能问答模型的答案预测模块,基于所述待处理问题对应的特征向量,在原始文本对应的特征向量中预测得到所述待处理问题对应的答案。2.根据权利要求1所述的基于特征分类的问答方法,其特征在于,通过智能问答模型的特征分类模块得到所述待处理问题对应的类别,包括:所述特征分类模块为基于Bert

LSTM的分类模块;将获取的所述待处理问题输入所述特征分类模块的Bert层,进行特征提取和向量表示,得到具有文本语义信息的特征向量;将得到的所述特征向量输入LSTM层,经过时间序列特征提取并进行分类,得到所述待处理问题的类别。3.根据权利要求2所述的基于特征分类的问答方法,其特征在于,所述答案预测模块包括输入嵌入层、嵌入编码层、查询问题注意层、模型编码器层和输出层;所述输入嵌入层用于对输入的带有类别标签信息的特征向量进行词嵌入和字符嵌入,得到输入嵌入层隐向量;所述嵌入编码层用于基于所述输入嵌入层隐向量进行特征提取及注意力计算,得到具有全文语义信息的编码表示;所述查询问题注意层用于基于所述编码表示计算得到问题到原始文本的第一关注度和原始文本到问题的第二关注度;所述模型编码器层用于基于原始文本的编码表示及所述第一关注度和第二关注度提取得到全局信息的特征、以及预测答案在原始文本数据中的开始位置特征和结束位置特征;所述输出层用于基于全局信息的特征、开始位置特征和结束位置特征预测原始文本数据中每个位置的单词作为答案开始或结束的概率,并输出所述待处理问题对应的答案。4.根据权利要求3所述的基于特征分类的问答方法,其特征在于,所述智能问答模型的训练包括:基于所述文本语料库中的原始文本数据构建标准问答对,基于所述标准问答对、原始文本和类别标签构建得到训练样本集;所述标准问答对中包括标准问题和标准答案;基于所述训练样本集中的标准问题、标准答案和原始文本数据以及类别标签,利用损失函数对所述特征分类模块进行迭代训练,得到收敛的所述智能问答模型的特征分类模块;将所述特征分类模块中Bert层输出的所述标准问题、标准答案及原始文本数据的特征向量分别与对应的类别标签的特征向量进行融合,得到对应的带有类别信息的特征向量;
将带有类别信息的各个特征向量分别输入所述答案预测模块,基于标准问题和标准答案对应的特征向量,在原始文本特征向量中预测答案,经过损失函数迭代更新,得到收敛的所述智能问答模型的答案预测模块。5.根据权利要求3所述的基于特征分类的问答方法,其特征在于,所...

【专利技术属性】
技术研发人员:孟英谦彭龙李胜昌任智颖邵鹏志谢志豪张世超李泽宇宋彪高圣楠魏中锐胡明哲姜伟张子烁邬书豪葛祥雨
申请(专利权)人:中国兵器工业计算机应用技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1