问题生成模型训练方法及装置制造方法及图纸

技术编号:37766017 阅读:12 留言:0更新日期:2023-06-06 13:26
本申请提供问题生成模型训练方法及装置,其中所述问题生成模型训练方法包括:获取目标知识库中的三元组;根据所述三元组创建初始问题模板,并对所述初始问题模板进行回译处理获得扩展问题模板;基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系;基于所述映射关系构建样本集,并通过所述样本集训练问题生成模型,直至获得满足训练停止条件的目标问题生成模型。型。型。

【技术实现步骤摘要】
问题生成模型训练方法及装置


[0001]本申请涉及人工智能
,特别涉及问题生成模型训练方法及装置。

技术介绍

[0002]随着互联网技术的发展,知识库问题系统在越来越多的领域得以应用;如果需要支持知识库问题系统运行,则需要预先建立与业务相关的大量问题;而在建立问题过程中,现有技术通常都是采用模板结合人工或者单纯地利用深度学习模型自动实现;无论是模板方式还是深度学习方法,在数据准备阶段都需要消耗大量的人力资源,并且由于人工介入无法有效保证后续生成问题的准确性,因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种问题生成模型训练方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种问题生成模型训练装置,一种问题生成方法,一种问题生成装置,一种计算设备,以及一种计算机可读存储介质。
[0004]根据本申请实施例的第一方面,提供了一种问题生成模型训练方法,包括:
[0005]获取目标知识库中的三元组;
[0006]根据所述三元组创建初始问题模板,并对所述初始问题模板进行回译处理获得扩展问题模板;
[0007]基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系;
[0008]基于所述映射关系构建样本集,并通过所述样本集训练问题生成模型,直至获得满足训练停止条件的目标问题生成模型。
[0009]可选地,所述根据所述三元组创建初始问题模板,包括:
[0010]对所述三元组进行解析,获得所述三元组中的初始实体和初始关系;
[0011]基于所述初始实体确定问题实体,以及基于所述初始关系确定问题关系;
[0012]对所述问题实体和所述问题关系进行拼接,根据拼接结果生成所述初始问题模板。
[0013]可选地,所述对所述初始问题模板进行回译处理获得扩展问题模板,包括:
[0014]确定所述初始问题模板对应的初始文本,并对属于第一语种的所述初始文本进行翻译处理获得属于第二语种的中间文本;
[0015]对属于所述第二语种的所述中间文本进行回译处理,获得属于所述第一语种的目标文本;
[0016]基于所述目标文本生成所述扩展问题模板。
[0017]可选地,所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系,包括:
[0018]对所述初始问题模板进行解析获得初始关系,以及对所述扩展问题模板进行解析
获得扩展关系;
[0019]提取所述三元组中包含的基准关系,并基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。
[0020]可选地,所述基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系,包括:
[0021]判断所述三元组的数量是否大于预设阈值;
[0022]若是,在所述初始关系和所述扩展关系中选择目标关系,并基于所述目标关系和所述基准关系的关联关系,确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系;
[0023]若否,在所述初始关系和所述扩展关系中选择至少两个目标关系,并基于所述至少两个目标关系和所述基准关系的关联关系,确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。
[0024]可选地,所述对所述初始问题模板进行回译处理获得扩展问题模板步骤执行之后,还包括:
[0025]判断所述初始问题模板和所述扩展问题模板的模板总数量是否小于预设数量阈值;
[0026]若是,对属于第一语种的所述初始文本进行翻译处理,获得属于至少一个第三语种的翻译文本;对属于所述至少一个第三语种的翻译文本进行回译处理,获得属于所述第一语种的至少一个回译文本;基于所述至少一个回译文本生成初始扩展问题模板,并作为所述扩展问题模板;
[0027]若否,执行所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系的步骤。
[0028]可选地,所述基于所述映射关系构建样本集,包括:
[0029]提取所述三元组中包含的目标实体;
[0030]基于所述映射关系将所述目标实体添加至所述初始问题模板和所述扩展问题模板,根据添加结果生成样本问题;
[0031]建立所述样本问题和所述三元组的对应关系,并根据建立结果生成所述样本集。
[0032]可选地,所述通过所述样本集训练问题生成模型,直至获得满足训练停止条件的目标问题生成模型,包括:
[0033]在所述样本集中选择样本三元组输入至所述问题生成模型进行处理,获得所述样本三元组对应的预测问题;
[0034]基于所述样本三元组对应的样本问题和所述预测问题计算损失值,并根据所述损失值对所述问题生成模型进行调参;
[0035]在调参后的问题生成模型满足所述训练停止条件的情况下,将调参后的问题生成模型作为所述目标问题生成模型;
[0036]其中,所述训练停止条件为问题生成模型的迭代训练次数大于等于次数阈值;或问题生成模型的损失值小于损失值阈值。
[0037]可选地,所述获取目标知识库中的三元组,包括:
[0038]选择与目标领域对应的所述目标知识库;
[0039]基于所述目标领域对应的实体和关系在所述目标知识库中提取所述三元组。
[0040]可选地,所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系,包括:
[0041]在所述三元组中提取基准关系;
[0042]计算所述基准关系与所述初始问题模块和所述扩展问题模板的匹配度;
[0043]根据匹配度计算结果建立所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。
[0044]根据本申请实施例的第二方面,提供了一种问题生成模型训练装置,包括:
[0045]获取模块,被配置为获取目标知识库中的三元组;
[0046]创建模块,被配置为根据所述三元组创建初始问题模板,并对所述初始问题模板进行回译处理获得扩展问题模板;
[0047]确定模块,被配置为基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系;
[0048]训练模块,被配置为基于所述映射关系构建样本集,并通过所述样本集训练问题生成模型,直至获得满足训练停止条件的目标问题生成模型。
[0049]根据本申请实施例的第三方面,提供了一种问题生成方法,包括:
[0050]获取用户输入的问题生成指令;
[0051]将所述问题生成指令中携带的目标三元组输入至上述方法中的目标问题模型进行处理,获得目标问题;
[0052]响应于所述问题生成指令向所述用户返回所述目标问题。
[0053]根据本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题生成模型训练方法,其特征在于,包括:获取目标知识库中的三元组;根据所述三元组创建初始问题模板,并对所述初始问题模板进行回译处理获得扩展问题模板;基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系;基于所述映射关系构建样本集,并通过所述样本集训练问题生成模型,直至获得满足训练停止条件的目标问题生成模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述三元组创建初始问题模板,包括:对所述三元组进行解析,获得所述三元组中的初始实体和初始关系;基于所述初始实体确定问题实体,以及基于所述初始关系确定问题关系;对所述问题实体和所述问题关系进行拼接,根据拼接结果生成所述初始问题模板。3.根据权利要求1所述的方法,其特征在于,所述对所述初始问题模板进行回译处理获得扩展问题模板,包括:确定所述初始问题模板对应的初始文本,并对属于第一语种的所述初始文本进行翻译处理获得属于第二语种的中间文本;对属于所述第二语种的所述中间文本进行回译处理,获得属于所述第一语种的目标文本;基于所述目标文本生成所述扩展问题模板。4.根据权利要求1所述的方法,其特征在于,所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系,包括:对所述初始问题模板进行解析获得初始关系,以及对所述扩展问题模板进行解析获得扩展关系;提取所述三元组中包含的基准关系,并基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。5.根据权利要求4所述的方法,其特征在于,所述基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系,包括:判断所述三元组的数量是否大于预设阈值;若是,在所述初始关系和所述扩展关系中选择目标关系,并基于所述目标关系和所述基准关系的关联关系,确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系;若否,在所述初始关系和所述扩展关系中选择至少两个目标关系,并基于所述至少两个目标关系和所述基准关系的关联关系,确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。6.根据权利要求3所述的方法,其特征在于,所述对所述初始问题模板进行回译处理获得扩展问题模板步骤执行之后,还包括:判断所述初始问题模板和所述扩展问题模板的模板总数量是否小于预设数量阈值;
若是,对属于第一语种的所述初始文本进行翻译处理,获得属于至少一个第三语种的翻译文本;对属于所述至少一个第三语种的翻译文本进行回译处理,获得属于所述第一语种的至少一个回译文本;基于所述至少一个回译文本生成初始扩展问题模板,并作为所述扩展问题模板;若否,执行所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系的步骤。7.根据权利要求1所述的方法,其特征在于,所述基于所述映射关系构建样本集,包括:提取所述三...

【专利技术属性】
技术研发人员:侯依宁李长亮毛璐
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1