问题生成模型训练方法及装置制造方法及图纸

技术编号：37766017 阅读：12 留言：0更新日期：2023-06-06 13:26

本申请提供问题生成模型训练方法及装置，其中所述问题生成模型训练方法包括：获取目标知识库中的三元组；根据所述三元组创建初始问题模板，并对所述初始问题模板进行回译处理获得扩展问题模板；基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系；基于所述映射关系构建样本集，并通过所述样本集训练问题生成模型，直至获得满足训练停止条件的目标问题生成模型。型。型。

全部详细技术资料下载

【技术实现步骤摘要】
问题生成模型训练方法及装置

[0001]本申请涉及人工智能
，特别涉及问题生成模型训练方法及装置。

技术介绍

[0002]随着互联网技术的发展，知识库问题系统在越来越多的领域得以应用；如果需要支持知识库问题系统运行，则需要预先建立与业务相关的大量问题；而在建立问题过程中，现有技术通常都是采用模板结合人工或者单纯地利用深度学习模型自动实现；无论是模板方式还是深度学习方法，在数据准备阶段都需要消耗大量的人力资源，并且由于人工介入无法有效保证后续生成问题的准确性，因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此，本申请实施例提供了一种问题生成模型训练方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种问题生成模型训练装置，一种问题生成方法，一种问题生成装置，一种计算设备，以及一种计算机可读存储介质。
[0004]根据本申请实施例的第一方面，提供了一种问题生成模型训练方法，包括：
[0005]获取目标知识库中的三元组；
[0006]根据所述三元组创建初始问题模板，并对所述初始问题模板进行回译处理获得扩展问题模板；
[0007]基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系；
[0008]基于所述映射关系构建样本集，并通过所述样本集训练问题生成模型，直至获得满足训练停止条件的目标问题生成模型。
[0009]可选地，所述根据所述三元组创建初始问题模板，包括：
[0010]对所...

【技术保护点】

【技术特征摘要】
1.一种问题生成模型训练方法，其特征在于，包括：获取目标知识库中的三元组；根据所述三元组创建初始问题模板，并对所述初始问题模板进行回译处理获得扩展问题模板；基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系；基于所述映射关系构建样本集，并通过所述样本集训练问题生成模型，直至获得满足训练停止条件的目标问题生成模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述三元组创建初始问题模板，包括：对所述三元组进行解析，获得所述三元组中的初始实体和初始关系；基于所述初始实体确定问题实体，以及基于所述初始关系确定问题关系；对所述问题实体和所述问题关系进行拼接，根据拼接结果生成所述初始问题模板。3.根据权利要求1所述的方法，其特征在于，所述对所述初始问题模板进行回译处理获得扩展问题模板，包括：确定所述初始问题模板对应的初始文本，并对属于第一语种的所述初始文本进行翻译处理获得属于第二语种的中间文本；对属于所述第二语种的所述中间文本进行回译处理，获得属于所述第一语种的目标文本；基于所述目标文本生成所述扩展问题模板。4.根据权利要求1所述的方法，其特征在于，所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系，包括：对所述初始问题模板进行解析获得初始关系，以及对所述扩展问题模板进行解析获得扩展关系；提取所述三元组中包含的基准关系，并基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。5.根据权利要求4所述的方法，其特征在于，所述基于所述基准关系、所述初始关系以及所述扩展关系确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系，包括：判断所述三元组的数量是否大于预设阈值；若是，在所述初始关系和所述扩展关系中选择目标关系，并基于所述目标关系和所述基准关系的关联关系，确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系；若否，在所述初始关系和所述扩展关系中选择至少两个目标关系，并基于所述至少两个目标关系和所述基准关系的关联关系，确定所述三元组与所述初始问题模板和所述扩展问题模板的所述映射关系。6.根据权利要求3所述的方法，其特征在于，所述对所述初始问题模板进行回译处理获得扩展问题模板步骤执行之后，还包括：判断所述初始问题模板和所述扩展问题模板的模板总数量是否小于预设数量阈值；
若是，对属于第一语种的所述初始文本进行翻译处理，获得属于至少一个第三语种的翻译文本；对属于所述至少一个第三语种的翻译文本进行回译处理，获得属于所述第一语种的至少一个回译文本；基于所述至少一个回译文本生成初始扩展问题模板，并作为所述扩展问题模板；若否，执行所述基于所述三元组中包含的关系确定所述三元组与所述初始问题模板和所述扩展问题模板的映射关系的步骤。7.根据权利要求1所述的方法，其特征在于，所述基于所述映射关系构建样本集，包括：提取所述三...

【专利技术属性】
技术研发人员：侯依宁，李长亮，毛璐，
申请(专利权)人：北京金山数字娱乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人