一种问答模型的训练方法及相关装置制造方法及图纸

技术编号:36092986 阅读:27 留言:0更新日期:2022-12-24 11:10
本申请提供了一种问答模型的训练方法及相关装置,该方法包括:先获取原始问题样本和对应的答案样本,答案样本为原始问题样本的正确答案;再对原始问题样本进行文本增强处理,得到对应的多个扩充问题样本,文本增强处理为改变原始问题样本的文本内容且不改变原始问题样本的文本语义;然后对多个扩充问题样本分别进行意图识别处理,确定多个扩充问题样本对应的问题领域;将多个扩充问题样本、多个扩充问题样本对应的问题领域和答案样本关联存储至问答模型的数据库。上述方案中,通过文本增强方式能够给问答模型提供大量的训练样本,且通过意图识别方式能够提高问答模型的准确性,即能够得到一种能准确识别用户意图且能准确回答的问答模型。回答的问答模型。回答的问答模型。

【技术实现步骤摘要】
一种问答模型的训练方法及相关装置


[0001]本申请涉及模型训练领域,具体涉及一种问答模型的训练方法及相关装置。

技术介绍

[0002]随着互联网技术的飞速发展,互联网中的信息呈爆炸式的增长,人们需要通过问答工具从海量的信息中获取所需要的信息。
[0003]相关技术中的问答工具主要是根据用户提供的问题的关键词,先搜索匹配得到一定的结果,然后还需要人工来阅读才能确定最合适的问题答案,这一方面会导致问答效率较低,另一方面会导致问答结果可靠性较低,故如何提供一种能够准确识别用户意图且能够准确回答的问答工具是目前亟需解决的问题。

技术实现思路

[0004]本申请实施例提供了一种问答模型的训练方法及相关装置,能够得到一种能准确识别用户意图且能准确回答的问答工具。
[0005]有鉴于此,本申请实施例第一方面提供一种问答模型的训练方法,包括:
[0006]获取原始问题样本和对应的答案样本,所述答案样本为所述原始问题样本的正确答案;
[0007]对所述原始问题样本进行文本增强处理,得到对应的多个扩充问题样本,所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种问答模型的训练方法,其特征在于,包括:获取原始问题样本和对应的答案样本,所述答案样本为所述原始问题样本的正确答案;对所述原始问题样本进行文本增强处理,得到对应的多个扩充问题样本,所述文本增强处理为改变所述原始问题样本的文本内容且不改变所述原始问题样本的文本语义;对所述多个扩充问题样本分别进行意图识别处理,确定所述多个扩充问题样本对应的问题领域;将所述多个扩充问题样本、所述多个扩充问题样本对应的问题领域和所述答案样本关联存储至所述问答模型的数据库。2.根据权利要求1所述的方法,其特征在于,所述对所述原始问题样本进行文本增强处理,得到对应的多个扩充问题样本,包括:基于所述原始问题样本的文字内容,对所述原始问题样本进行文本增强处理,得到多个第一扩充问题样本;将所述原始问题样本转换为问题向量样本;基于所述问题向量样本的向量内容,对所述问题向量样本进行文本增强处理,得到多个扩充向量样本;将所述多个扩充向量样本转换为第二扩充问题样本。3.根据权利要求2所述的方法,其特征在于,所述基于所述原始问题样本的文字内容,对所述原始问题样本进行文本增强处理,得到多个第一扩充问题样本,包括:基于所述原始问题样本的文字内容,对所述原始问题样本进行多次反向翻译处理,得到多个第一扩充问题样本,所述反向翻译处理为将文字内容翻译为预设语种之后再翻译回原始语种。4.根据权利要求1所述的方法,其特征在于,所述对所述多个扩充问题样本分别进行意图识别处理,确定所述多个扩充问题样本对应的问题领域,包括:对所述扩充问题样本进行文本嵌入,得到嵌入扩充问题样本;对所述嵌入扩充问题样本进行编码处理,得到编码扩充问题样本;对所述编码扩充问题样本进行特征提取,得到所述扩充问题样本对应的特征;对所述特征进行全连接处理,得到所述扩充问题样本对应的全局特征;对所述全局特征进行意图识别处理,确定所述扩充问题样本对应的问题领域。5.根据权利要求1所述的方法,其特征在于,所述获取原始问题样本和对...

【专利技术属性】
技术研发人员:李学亮冯志强石中玉刘佳欣
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1