文本生成方法、装置、计算机设备及介质制造方法及图纸

技术编号：21361323 阅读：26 留言：0更新日期：2019-06-15 09:19

本发明专利技术属于模型构建领域，公开了一种文本生成方法、装置、设备及介质，该方法包括：从真实文本数据集中获取文本正样本，然后建立初始生成器模型，用文本正样本对初始生成器模型进行预训练得到生成器模型，用生成器模型生成文本负样本；接着建立初始判别器模型，用文本正样本和文本负样本进行预训练得到判别器模型；再让生成器模型与判别器模型不断对抗并更新模型的参数，当判别器模型收敛时，根据收敛时的生成器模型得到文本生成模型；获取待识别文本，并将待识别文本输入至文本生成模型中，基于文本生成模型生成目标文本。本发明专利技术的文本生成方法可以提高文本生成模型的构建效率和生成文本的精度。

Text Generation Method, Device, Computer Equipment and Media

The invention belongs to the field of model building, and discloses a text generation method, device, device and medium. The method includes: obtaining positive text samples from real text data sets, then establishing an initial generator model, pre-training the initial generator model with positive text samples, and generating negative text samples with generator model; and then establishing an initial judgement. The discriminator model is obtained by pre-training the positive and negative samples of the text. Then the generator model and the discriminator model are constantly confronted and updated. When the discriminator model converges, the text generation model is obtained according to the generator model when the discriminator model converges. The text to be recognized is acquired and input into the text generation model based on the text. Generate model to generate target text. The text generation method of the present invention can improve the construction efficiency of the text generation model and the accuracy of the text generation.

全部详细技术资料下载

【技术实现步骤摘要】
文本生成方法、装置、计算机设备及介质
本专利技术属于模型构建领域，更具体地说，是涉及一种文本生成方法、装置、计算机设备及介质。
技术介绍
随着科技的发展，我们希望计算机能够像人类一样会写作，能够撰写出高质量的自然语言文本，而文本自动生成技术就是实现这一目标的关键技术。目前，常用的方法是利用长短期记忆网络(LongShort-TermMemoryNetworks，简称LSTM)来进行文本生成，LSTM是递归神经网络(Recurrent/RecursiveNeuralNetwork，简称RNN)的一种。其中，训练RNN常用的方式是最大似然估计，即在给定前t-1个单词的情况下，通过最大化第t个单词的对数似然来给出下一个单词。但是，使用RNN的不足在于是会产生逐步递增的偏差，因为在生成一句话的时候，RNN是逐个单词依次生成的，下一单词是在前面单词给定的基础上生成的，这样就导致产生了一个偏差，而且随着序列的长度的增加，偏差也会越来越大。另外，RNN不能进行自我改进，对于RNN的某些应用，可以加入最小化损失函数来改进模型。但是对于文本生成模型，由于输入的数据为离散型数据，因此没有直接可用的损失函数，没有一种合适方式来指导文本生成模型进行自我改进以获得接近真实的输出。综上所述，目前用以生成文本的模型的效率较低，亟待找到一种文本生成模型可以较快速、较准确的生成文本。
技术实现思路
本专利技术实施例提供一种文本生成方法、装置、计算机设备及存储介质，以解决目前生成文本的效率较低的问题。一种文本生成方法，包括：获取真实文本数据集，从所述真实文本数据集中获取文本正样本；建立初始生成器...

【技术保护点】
1.一种文本生成方法，其特征在于，包括：获取真实文本数据集，从所述真实文本数据集中获取文本正样本；建立初始生成器模型，将所述文本正样本输入至所述初始生成器模型进行预训练，得到生成器模型，并根据所述生成器模型生成第一文本负样本；建立初始判别器模型，将所述文本正样本与所述第一文本负样本输入至所述初始判别模型中进行预训练，得到判别器模型；基于所述生成器模型生成测试文本，将所述测试文本输入至所述判别器模型中获取所述测试文本的奖励值，根据所述奖励值计算所述生成器模型的梯度，并根据所述梯度更新所述生成器模型；根据更新后的所述生成器模型生成第二文本负样本，将所述第二文本负样本与所述文本正样本输入至判别器模型中，根据最小化交叉熵更新所述判别器模型；交替更新所述生成器模型和所述判别器模型，若所述判别器模型的输出收敛，则根据收敛时的所述生成器模型得到文本生成模型；获取待识别文本，并将所述待识别文本输入至所述文本生成模型中，基于所述文本生成模型生成目标文本。

【技术特征摘要】
1.一种文本生成方法，其特征在于，包括：获取真实文本数据集，从所述真实文本数据集中获取文本正样本；建立初始生成器模型，将所述文本正样本输入至所述初始生成器模型进行预训练，得到生成器模型，并根据所述生成器模型生成第一文本负样本；建立初始判别器模型，将所述文本正样本与所述第一文本负样本输入至所述初始判别模型中进行预训练，得到判别器模型；基于所述生成器模型生成测试文本，将所述测试文本输入至所述判别器模型中获取所述测试文本的奖励值，根据所述奖励值计算所述生成器模型的梯度，并根据所述梯度更新所述生成器模型；根据更新后的所述生成器模型生成第二文本负样本，将所述第二文本负样本与所述文本正样本输入至判别器模型中，根据最小化交叉熵更新所述判别器模型；交替更新所述生成器模型和所述判别器模型，若所述判别器模型的输出收敛，则根据收敛时的所述生成器模型得到文本生成模型；获取待识别文本，并将所述待识别文本输入至所述文本生成模型中，基于所述文本生成模型生成目标文本。2.如权利要求1所述的文本生成方法，其特征在于，所述从所述真实文本数据集中获取文本正样本，包括：从所述真实文本数据集中选取N个文本数据，N为正整数；将N个所述文本数据用词向量模型转化为向量形式，将转化为向量形式的N个所述文本数据作为文本正样本。3.如权利要求1所述的文本生成方法，其特征在于，所述建立初始生成器模型，将所述文本正样本输入至所述初始生成器模型进行预训练，得到生成器模型，并根据所述生成器模型生成第一文本负样本，包括：将初始生成参数输入递归神经网络建立初始生成器模型；将所述文本正样本输入至所述初始生成器模型中进行预训练，并根据概率分布函数转化为概率输出，得到预训练后的参数；根据所述预训练后的参数更新所述初始生成器模型的参数，得到生成器模型。4.如权利要求1所述的文本生成方法，其特征在于，所述建立初始判别器模型，将所述文本正样本与所述第一文本负样本输入至所述初始判别模型中进行预训练，得到判别器模型，包括：将初始判别参数输入至卷积神经网络建立初始判别器模型；将所述文本正样本与所述第一文本负样本输入至所述初始判别器模型中进行预训练，根据概率分布函数转化为概率输出，并根据最小化交叉熵更新所述初始判别器的初始判别参数，得到预训练后的判别参数；根据所述预训练后的判别参数更新所述初始判别器模型的参数，得到判别器模型。5.如权利要求1所述的文本生成方法，其特征在于，所述基于所述生成器模型生成测试文本，将所述测试文本输入至所述判别器模型中获取所述测试文本的奖励值，根据所述奖励值计算所述生成器模型的梯度，并根据所述梯度更新所述生成器模型，包括：获取生成所述测试文本过程中的文本作为测试子文本；根据每一所述测试子文本采用蒙特卡洛搜索方式生成M个假设文本；将M个所述假设文本输入至所述判别器模型中，获取M个所述假设文本的奖励均值作为所述测试子文本的奖励值，并将所述测试文本输入至所述判别器模型中，获取所述测试文本的奖励值；根...

【专利技术属性】
技术研发人员：毕野，黄博，吴振宇，王建明，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人