对话生成模型的训练方法、装置、存储介质及计算机设备制造方法及图纸

技术编号：38320232 阅读：9 留言：0更新日期：2023-07-29 09:02

本发明专利技术公开了一种对话生成模型的训练方法、装置、存储介质及计算机设备，涉及人工智能及智慧医疗技术领域。其中方法包括：获取对话生成模型的训练数据集，其中，训练数据集包括多个预设有场景标签的训练样本，场景标签用于标注训练样本适用的场景；基于场景标签将训练样本划分为多个批次组，其中，每个批次组包含属于同一场景的预设数量的训练样本；对多个批次组进行随机排序，生成用于训练对话生成模型的目标训练数据集；根据目标训练数据集，对预设的神经网络模型进行训练，得到对话生成模型。上述方法能够从历史的对话样本中，生成按照适用场景随机排序的批次组，并基于该训练数据集对对话生成模型进行训练，提升模型的性能。能。能。

全部详细技术资料下载

【技术实现步骤摘要】
对话生成模型的训练方法、装置、存储介质及计算机设备

[0001]本专利技术涉及人工智能及智慧医疗
，尤其是涉及一种对话生成模型的训练方法、装置、存储介质及计算机设备。

技术介绍

[0002]随着神经网络模型技术的发展，Transformer(编码解码模型)类预训练模型越来越受到各方的关注，其使得部署一个对话生成模型来应对多个不同的对话场景成为可能。特别是在医疗交互领域，对话生成模型可以接收来自不同医疗场景的对话信息，生成适用于不同医疗场景的回复信息。
[0003]当前，对话生成模型进行训练的方式多为随机的选取各场景的历史对话数据作为训练数据集中每个批次层面上的训练数据，但基于该种方式对模型进行训练的过程会因训练批次层面上的训练数据过于分散，导致对话生成模型收敛速度较慢。此外，将多个场景下的训练数据按照场景顺序对神经网络模型进行训练，会造成模型学习新知识后，几乎彻底遗忘掉之前学习的内容，导致在对模型的训练过程中会出现灾难性遗忘的情况，进而导致模型训练的效率大幅降低。

技术实现思路

[0004]有鉴于此，本申请提供了一种对话生成模型的训练方法、装置、存储介质及计算机设备，主要目的在于解决模型训练效率偏低的技术问题。
[0005]根据本专利技术的第一个方面，提供了一种对话生成模型的训练方法，该方法包括：
[0006]获取对话生成模型的训练数据集，其中，所述训练数据集包括多个预设有场景标签的训练样本，所述场景标签用于标注所述训练样本适用的场景；
[0007]基于所述场景标...

【技术保护点】

【技术特征摘要】
1.一种对话生成模型的训练方法，其特征在于，所述方法包括：获取对话生成模型的训练数据集，其中，所述训练数据集包括多个预设有场景标签的训练样本，所述场景标签用于标注所述训练样本适用的场景；基于所述场景标签将所述训练样本划分为多个批次组，其中，每个所述批次组包含属于同一场景的预设数量的训练样本；对多个所述批次组进行随机排序，生成用于训练所述对话生成模型的目标训练数据集；根据所述目标训练数据集，对预设的神经网络模型进行训练，得到所述对话生成模型。2.根据权利要求1所述的方法，其特征在于，所述基于所述场景标签将所述训练样本划分为多个批次组，包括：根据所述场景标签，将所述训练样本划分为多个场景组，其中，每个所述场景组包含属于同一场景的全部训练样本；将所述场景组内的多个所述训练样本划分为多个批次组，其中，每个所述批次组包括预设数量的所述训练样本。3.根据权利要求2所述的方法，其特征在于，所述对多个所述批次组进行随机排序，生成用于训练所述对话生成模型的目标训练数据集，包括：执行循环过程直至满足预设条件，其中，所述循环过程包括：从每个所述场景组内选出一个所述批次组，并将选出的多个所述批次组随机组合成综合组，其中，所述综合组内的训练样本适用的场景包含所述训练数据集中全部训练样本适用的场景；所述预设条件为：存在至少一个所述场景组中的全部所述批次组被组成所述综合组；将全部所述综合组与每个所述场景组内未被组成所述综合组的批次组进行随机排列，或对全部所述综合组进行随机排列，得到所述目标训练数据集。4.根据权利要求2所述的方法，其特征在于，所述将所述场景组内的多个所述训练样本划分为多个批次组，包括：将所述场景组内的训练样本排列成样本队列；以所述样本队列的一个端点为起始点，依次获取所述预设数量的训练样本组成一个批次组，得到多个批次组。5.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述根据所述目标训练数据集，对预设的神经网络模型进行训练，得到所述对话生成模型之前，所述方法还包括：获取每个所述批次组内的场景标签；判断同一个所述批次组内的场景标签是否对应同一个场景；若存在所述批次组内的场景标签未对应同一个场景，则发出报警提示信息。6.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述根据所述目标训练数据集...

【专利技术属性】
技术研发人员：刘佳瑞，王世朋，姚海申，孙行智，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人