【技术实现步骤摘要】
一种智能问答模型构建方法及设备
[0001]本专利技术涉及自然语言处理
,特别涉及一种智能问答模型构建方法及设备。
技术介绍
[0002]随着人工智能和大数据技术的发展,人机交互系统在企业生产和日常生活中发挥着越来越重要的作用。自然语言作为人机交互的一种方式,伴随着发展起来的自然语言处理技术主要包括语音识别、语义理解两大部分。问答模型的应用也越来越广泛。
[0003]但现有模型存在的一个普遍问题是训练和推断都十分缓慢,特别是对于长文本来说,高昂的训练开销不仅导致了很长的实验周期,限制了研究者进行迅速的迭代,还妨碍了模型被用于大型数据集。且缓慢的推断阻碍了机器阅读理解系统在实时应用中的部署。
[0004]因此,如何使得问答模型更加迅速地获取并理解大问答对与文本的注意关系,并更加快速且准确地预测出问题对应的答案信息,成为目前急需解决的问题。
技术实现思路
[0005]鉴于上述的分析,本专利技术旨在提供一种智能问答模型构建方法及设备;解决现有技术中的问答模型构建方法得到的问答模型推断速度慢,且 ...
【技术保护点】
【技术特征摘要】
1.一种智能问答模型构建方法,其特征在于,包括:获取问答相关领域的多个原始文本数据,构建训练样本集;所述训练样本集中包括原始文本数据,以及基于所述原始文本数据得到的标准问题、标准答案和类别标签;构建初始智能问答模型,所述智能问答模型包括特征分类模块和答案预测模块;所述特征分类模块用于对输入的问题进行分类;所述答案预测模块用于基于融合了类别信息的问题进行答案预测;基于所述训练样本集对所述初始智能问答模型进行训练,经过损失函数迭代更新,得到所述智能问答模型。2.根据权利要求1所述的智能问答模型构建方法,其特征在于,通过下述方法构建训练样本集:基于互联网爬虫技术,获取问答相关领域新闻网站的新闻数据;基于预先设置的类别对所述新闻数据进行分类;解析各类别的新闻数据,得到各类别的新闻标题、新闻文本、新闻图片、新闻视频和新闻链接;基于所述新闻标题和新闻文本得到所述原始文本;对所述原始文本以句为单位进行拆解,构造标准问题和标准答案,形成标准问答对;基于所述原始文本、标准问答对和对应的类别,得到所述训练样本集。3.根据权利要求1所述的智能问答模型构建方法,其特征在于,所述基于所述训练样本集对所述智能问答模型进行训练,包括:将所述训练样本集中的数据以及对应的类别标签输入所述特征分类模块进行特征提取,并基于所述类别标签对标准问题、标准答案和原始文本数据进行类别预测,经过损失函数迭代更新,得到收敛的所述特征分类模块;将所述特征分类模块中提取得到的所述标准问题、标准答案及原始文本数据的特征向量分别与对应的类别标签的特征向量进行融合,得到对应的带有类别信息的特征向量;将带有类别信息的各个特征向量分别输入所述答案预测模块,基于标准问题和标准答案对应的特征向量,在原始文本特征向量中预测答案,经过损失函数迭代更新,得到收敛的所述答案预测模块。4.根据权利要求1所述的智能问答模型构建方法,其特征在于,所述特征分类模块为基于Bert
‑
LSTM的模型,包括Bert层和LSTM层;所述Bert层用于对输入的文本进行特征提取和向量表示,得到融合文本各个位置的字向量、文本向量和位置向量的具有文本语义信息的特征向量;所述LSTM层用于对所述Bert层输出的特征向量进行时间序列特征提取并进行分类,得到输入文本对应的类别。5.根据权利要求1所述的智能问答模型构建方法,其特征在于,所述答案预测模块包括输入嵌入层、嵌入编码层、查询问题注意层、模型编码器层和输出层;所述输入嵌入层用于对输入的带有类别标签信息的特征向量进行词嵌入和字符嵌入,得到输入嵌入层隐向量;所述嵌入编码层用于基于所述输入嵌入层隐向量进行特征提取及注意力计算,得到具有全文语义信息的编码表示;所述查询问题注意层用于基于所述编码表示计算得到问题到原始文本的第一关注度
和原始文本到问题的第二关注度;...
【专利技术属性】
技术研发人员:彭龙,孟英谦,李胜昌,张世超,谢志豪,邵鹏志,任智颖,宋彪,魏中锐,胡明哲,李泽宇,高圣楠,姜伟,张子烁,葛祥雨,邬书豪,
申请(专利权)人:中国兵器工业计算机应用技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。