问答模型的训练方法及装置制造方法及图纸

技术编号：29313647 阅读：19 留言：0更新日期：2021-07-17 02:30

本申请提供问答模型的训练方法及装置，其中所述问答模型的训练方法包括：构建样本语料对应的初始文本意群，并基于所述初始文本意群生成所述样本语料对应的场景定向词表空间；获取训练样本，并确定所述训练样本对应的样本词组；基于所述样本词组查询所述场景定向词表空间，根据查询结果确定所述训练样本对应的目标文本意群；利用所述目标文本意群和所述训练样本对初始问答模型进行训练，直至获得满足训练停止条件的目标问答模型。停止条件的目标问答模型。停止条件的目标问答模型。

全部详细技术资料下载

【技术实现步骤摘要】
问答模型的训练方法及装置

[0001]本申请涉及人工智能
，特别涉及一种问答模型的训练方法及装置。

技术介绍

[0002]随着人工智能产业的发展，问答模型在实际应用中所占的比例也逐渐增高，用户对问答模型的回复准确性和回复效率的要求也越来越高。现有技术中，问答模型一般通过理解用户发出的问题，并根据用户的问题生成针对性的答案进行回复。但是目前的问答模型对用户的回复内容准确性不高，回复速度也有待提升。因此，如何解决上述问题，为问答模型提升回复的准确性和回复速度，成为了本领域技术人员亟需解决的问题。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种问答模型的训练方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种问答模型的训练装置，一种文本处理方法，一种文本处理装置，一种计算设备，以及一种计算机可读存储介质。
[0004]根据本申请实施例的第一方面，提供了一种问答模型的训练方法，包括：构建样本语料对应的初始文本意群，并基于所述初始文本意群生成所述样本语料对应的场景定向词表空间；获取训练样本，并确定所述训练样本对应的样本词组；基于所述样本词组查询所述场景定向词表空间，根据查询结果确定所述训练样本对应的目标文本意群；利用所述目标文本意群和所述训练样本对初始问答模型进行训练，直至获得满足训练停止条件的目标问答模型。
[0005]可选地，所述基于所述初始文本意群生成所述样本语料对应的场景定向词表空间，包括：为所述样本语料添加语境标签，以及提取所述初始文本意群中的初始词组；建...

【技术保护点】

【技术特征摘要】
1.一种问答模型的训练方法，其特征在于，包括：构建样本语料对应的初始文本意群，并基于所述初始文本意群生成所述样本语料对应的场景定向词表空间；获取训练样本，并确定所述训练样本对应的样本词组；基于所述样本词组查询所述场景定向词表空间，根据查询结果确定所述训练样本对应的目标文本意群；利用所述目标文本意群和所述训练样本对初始问答模型进行训练，直至获得满足训练停止条件的目标问答模型。2.根据权利要求1所述的问答模型的训练方法，其特征在于，所述基于所述初始文本意群生成所述样本语料对应的场景定向词表空间，包括：为所述样本语料添加语境标签，以及提取所述初始文本意群中的初始词组；建立所述语境标签与所述初始文本意群的对应关系，并根据所述对应关系和初始词组构建所述样本语料对应的所述场景定向词表空间。3.根据权利要求2所述的问答模型的训练方法，其特征在于，所述为所述样本语料添加语境标签，包括：提取所述样本语料的多个初始特征，并对所述多个初始特征进行预处理获得多个目标特征；计算各个目标特征与所述样本语料的语境相似度，根据语境相似度计算结果选择至少一个目标特征作为所述语境标签，并添加至所述样本语料。4.根据权利要求3所述的问答模型的训练方法，其特征在于，所述基于所述样本词组查询所述场景定向词表空间，根据查询结果确定所述训练样本对应的目标文本意群，包括：将所述样本词组映射到所述场景定向词表空间，计算所述样本词组与所述语境标签的词组相似度；根据词组相似度计算结果确定目标语境标签，并将所述目标语境标签对应的初始文本意群作为所述目标文本意群。5.根据权利要求1所述的问答模型的训练方法，其特征在于，所述确定所述训练样本对应的样本词组，包括：对所述训练样本进行解析，获得所述训练样本中的样本问题文本；提取所述样本问题文本中的第一词单元和第二词单元，基于所述第一词单元和所述第二词单元构建所述样本词组。6.根据权利要求5所述的问答模型的训练方法，其特征在于，所述利用所述目标文本意群和所述训练样本对初始问答模型进行训练，直至获得满足训练停止条件的目标问答模型，包括：将所述目标文本意群和所述训练样本中的所述样本问题文本输入至所述初始问答模型进行处理，获得预测答案文本；基于所述预测答案文本和所述训练样本中的样本答案文本对所述初始问答模型进行优化，直至获得满足训练停止条件的所述目标问答模型。7.根据权利要求6所述的问答模型的训练方法，其特征在于，所述将所述目标文本意群和所述训练样本中的所述样本问题文本输入至所述初始问答模型...

【专利技术属性】
技术研发人员：冯晓阳，李长亮，姬子明，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人