文本生成模型的训练方法、装置、设备及存储介质制造方法及图纸

技术编号：39256920 阅读：18 留言：0更新日期：2023-10-30 12:08

本申请提供一种文本生成模型的训练方法、装置、设备及存储介质，该方法包括：获取第一文本及第二文本；基于文本生成模型的编码器，对第一文本和第二文本进行向量编码处理，得到第一文本对应的第一向量及第二文本对应的第二向量；基于预设的对比损失函数，根据第一向量和第二向量确定第一损失值；基于文本生成模型的向量处理网络，根据输入的目标条件向量及第一向量确定目标输出文本；基于预设的训练损失函数，根据目标输出文本及第一文本确定第二损失值；根据第一损失值及第二损失值对文本生成模型的参数进行调整，得到训练好的文本生成模型。能够提升对文本生成模型的训练效果，从而提升训练好的文本生成模型在进行文本生成时的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本生成模型的训练方法、装置、设备及存储介质

[0001]本申请涉及深度学习
，尤其涉及一种文本生成模型的训练方法、装置、设备及存储介质。

技术介绍

[0002]在现今的自然语言处理中，例如通过一些文本生成模型来生成符合用户使用需求的文本，例如通过条件变分自编码器来生成文本，在医疗问诊过程的场景中，医生可以通过输入一些较少的信息及数据至条件变分自编码器中，以得到病历文本或开药单，但当前大多对条件变分自编码器的训练方法中，并没有考虑训练样本之间的相关信息，从而导致在输入不同标签的时候，例如医生输入病灶及病因时，生成的文本可能会较为相似甚至相同，模型生成的文本的精确性不足。

技术实现思路

[0003]本申请的提供一种文本生成模型的训练方法、装置、设备及存储介质，旨在通过对文本生成模型进行训练，提高文本生成模型生成的文本的精确性。
[0004]第一方面，本申请提供一种文本生成模型的训练方法，所述文本生成模型的训练方法包括以下步骤：
[0005]获取第一文本及第二文本，所述第一文本与所述第二文本的文本相似度小于或等于预设的文本相似度阈值；
[0006]基于文本生成模型的编码器，对所述第一文本和所述第二文本进行向量编码处理，得到所述第一文本对应的第一向量及所述第二文本对应的第二向量；
[0007]基于预设的对比损失函数，根据所述第一向量和所述第二向量确定第一损失值；
[0008]基于所述文本生成模型的向量处理网络，根据输入的目标条件向量及所述第一向量确定目标输出文本...

【技术保护点】

【技术特征摘要】
1.一种文本生成模型的训练方法，其特征在于，包括：获取第一文本及第二文本，所述第一文本与所述第二文本的文本相似度小于或等于预设的文本相似度阈值；基于文本生成模型的编码器，对所述第一文本和所述第二文本进行向量编码处理，得到所述第一文本对应的第一向量及所述第二文本对应的第二向量；基于预设的对比损失函数，根据所述第一向量和所述第二向量确定第一损失值；基于所述文本生成模型的向量处理网络，根据输入的目标条件向量及所述第一向量确定目标输出文本；基于预设的训练损失函数，根据所述目标输出文本及所述第一文本确定第二损失值；根据所述第一损失值及所述第二损失值对所述文本生成模型的参数进行调整，得到训练好的文本生成模型。2.如权利要求1所述的文本生成模型的训练方法，其特征在于，所述基于所述文本生成模型的向量处理网络，根据预设的条件向量及所述第一向量确定目标输出文本，包括：基于所述向量处理网络的采样子网络，对所述目标条件向量及所述第一向量进行采样处理；基于所述向量处理网络的解码器，根据采样处理后的目标条件向量及采样处理后的第一向量进行解码处理，得到目标输出文本。3.如权利要求1或2所述的文本生成模型的训练方法，其特征在于，所述基于文本生成模型的编码器，对所述第一文本和所述第二文本进行向量编码处理，得到所述第一文本对应的第一向量及所述第二文本对应的第二向量，包括：基于所述文本生成模型的编码器中的第一编码网络，对所述第一文本进行向量编码处理，得到第一向量；基于所述文本生成模型的编码器中的第二编码网络，对所述第一文本进行向量编码处理，第一向量的关联向量；其中，所述第一编码网络与所述第二编码网络中的节点连接相似度大于或等于预设的连接相似度阈值；所述基于预设的对比损失函数，根据所述第一向量和所述第二向量确定第一损失值，包括：在所述关联向量与所述第一向量的第一向量关联度小于或等于第一向量关联度阈值时，基于所述对比损失函数，根据所述第一向量、所述第二向量及所述关联向量确定所述第一损失值。4.如权利要求3所述的文本生成模型的训练方法，其特征在于，所述方法还包括：在所述第一向量关联度大于所述第一向量关联度阈值时，调整所述第二编码网络中的节点连接；基于调整后的第二编码网络，对所述第一文本进行向量编码处理，得到所述关联向量。5.如权利要求3所述的文本生成模型的训练方法，其特征在于，所述方法还包括：获取第三文本，所述第三文本与所述第二文本的文本相似度大于或等于所述文本相似度阈值，且所述第三文本与所述第一文本的文本相似度小于预设相似度阈值；基于文本生成模型的编码器，对所述第三文本进行向量编码处理，得到所述第三文本对应...

【专利技术属性】
技术研发人员：王科强，李松岭，陈思玥，倪渊，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人