一种基于文本生成的WGAN方法技术

技术编号:17049460 阅读:573 留言:0更新日期:2018-01-17 18:13
本发明专利技术公开了一种基于文本生成的WGAN方法,属于深度学习神经网络领域,该方法包括以下步骤:S1、构造沃瑟斯坦生成式对抗网络WGAN模型;S2、准备文本数据集进行训练;S3、利用编码器,对将文本数据进行编码;S4、构造随机噪声,获取生成器的输出文本;S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。本方法根据生成对抗网络模型的特点,创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,首次公开了生成文本的对抗网络训练方式,突破了以往的生成对抗网络模型都是完成生成图像的功能。

A WGAN method based on text generation

The invention discloses a method for text generation based on WGAN, which belongs to the depth of field of neural network learning, the method comprises the following steps: S1 structure, Wasserstein generative network against WGAN model; S2, prepare text data sets for training; S3, use of the text data encoder, encoding S4, random structure; the noise output text acquisition generator; S5, the output text generator and data set after encoding text input arbiter, training network. According to the characteristics of this method against network model generation, creatively put forward the way to construct the convolutional neural network combined with WGAN, for the first time disclosed training against the network generated text, break through the previous generation against the network model is the image function.

【技术实现步骤摘要】
一种基于文本生成的WGAN方法
本专利技术涉及深度学习神经网络
,具体涉及一种基于文本生成的WGAN方法。
技术介绍
生成式对抗网络(GenerativeAdversarialNetwork,简称GAN)是由Goodfellow在2014年提出的框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。判别器每完成一次判断,将结果误差返回给生成器。然而,在传统的GAN模型中,多数是让生成对抗网络模型完成生成图像的功能,并未任何涉及生成文本的对抗网络训练方式。
技术实现思路
本专利技术的目的是为了解决现有技术中的上述缺陷,公开了一种基于文本生成的WGAN方法,该方法创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,实现了生成文本的对抗网络训练方式。本专利技术的目的可以通过采取如下技术方案达到:一种基于文本生成的WGAN方法,所述的方法包括下列步骤:S1、构造沃瑟斯坦生成式对抗网络WGAN模型,模型包含生成器和判别器;S2、准备文本数据集进行训练;S3、利用编码器,对将文本数据进行编码;S4、构造随机噪声,获取生成器的输出文本;S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。进一步地,所述的步骤S2中的文本数据集要求是属于同一类型的内容,例如均描写景物或故事等。进一步地,所述的步骤S4中构造随机噪声,获取生成器的输出文本,具体过程如下:S41、将随机噪声输入至生成器中;S42、生成器对输入的随机噪声进行深度学习,从而生成文本。进一步地,所述的步骤S5中,将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。具体说明如下:数据集应该是具有同一类型或相似特征文本的集合;并且,数据集的规模应尽可能大;在训练的过程中,判别器接收数据集经编码之后的文本和生成器的输出文本,并作出判断。本专利技术相对于现有技术具有如下的优点及效果:本专利技术根据Wasserstein距离的概念构造了WGAN中判别器损失函数的形式,打破了以往只能通过对抗网络进行图像生成的操作,创造性地提出了深度卷积神经网络与WGAN相结合的构造方式,实现了生成文本的对抗网络训练方式。附图说明图1是基于WGAN网络生成文本的整体流程示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例本实施例公开了一种基于文本生成的WGAN方法,具体包括下列步骤:步骤S1、构造沃瑟斯坦生成式对抗网络WGAN模型,模型包含生成器和判别器。其中,生成器的卷积网络层数与判别器的卷积网络层数相同,并且生成器的卷积核是判别器的卷积核的转置。步骤S2、准备文本数据集进行训练;文本的数据集要求是属于同一类型的内容,例如均描写景物或故事等。步骤S3、利用编码器,对将文本数据进行编码。步骤S4、构造随机噪声,获取生成器的输出文本。具体方法如下:S41、将随机噪声输入至生成器中;S42、生成器对输入的随机噪声进行深度学习,从而生成文本。步骤S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。具体说明如下:数据集应该是具有同一类型或相似特征文本的集合;并且,数据集的规模应尽可能大;在训练的过程中,判别器接收数据集经编码之后的文本和生成器的输出文本,并作出判断。在WGAN中,判别器的损失函数为:其中,D(x)表示判别器对文本的判别,pr表示数据集文本的分布,pg表示生成文本的分布,λ为超参数,为梯度。综上所述,本实施例公开了一种基于文本生成的WGAN方法,该模型算法在传统WGAN模型的基础上,打破了在传统方法中,只用对抗网络处理图像的方式。另外,判别器的损失函数也能够指导网络训练的方向。该方法利用准备好的文本数据集,同时构造编码器对文本进行编码,通过生成器与判别器之间的对抗训练,最终达到生成器生成新颖且符合实际内容的文本。上述实施例为本专利技术较佳的实施方式,但本专利技术的实施方式并不受上述实施例的限制,其他的任何未背离本专利技术的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本专利技术的保护范围之内。本文档来自技高网...
一种基于文本生成的WGAN方法

【技术保护点】
一种基于文本生成的WGAN方法,其特征在于,所述的方法包括下列步骤:S1、构造沃瑟斯坦生成式对抗网络WGAN模型,该模型包含生成器和判别器;S2、准备文本数据集进行训练;S3、利用编码器,对文本数据进行编码;S4、构造随机噪声,获取生成器的输出文本;S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。

【技术特征摘要】
1.一种基于文本生成的WGAN方法,其特征在于,所述的方法包括下列步骤:S1、构造沃瑟斯坦生成式对抗网络WGAN模型,该模型包含生成器和判别器;S2、准备文本数据集进行训练;S3、利用编码器,对文本数据进行编码;S4、构造随机噪声,获取生成器的输出文本;S5、将生成器的输出文本与数据集编码之后的文本输入判别器,进行网络训练。2.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的生成器的卷积网络层数与所述的判别器的卷积网络层数相同,并且生成器的卷积核是判别器的卷积核的转置。3.根据权利要求1所述的一种基于文本生成的WGAN方法,其特征在于,所述的文本数据集是属于同一类型的内...

【专利技术属性】
技术研发人员:周智恒李立军
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1