一种深度生成网络随机训练算法及装置制造方法及图纸

技术编号：14491056 阅读：98 留言：0更新日期：2017-01-29 13:51

本发明专利技术公开一种深度生成网络随机训练算法及装置。所述方法包括：输入包括条件变量以及生成数据本身的数据集合；将所述数据集合随机分割成包括一定数量样本的若干批次；对各批次的样本数据通过梯度后向传播进行参数更新并输出所述参数；其中，所述对各批次的样本数据通过梯度后向传播进行参数更新包括使用条件极大矩匹配准则。所述装置用于实现所述方法。本发明专利技术提出的深度生成网络随机训练算法可扩展基于矩匹配的深度生成模型的应用范围。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习领域，具体涉及一种深度生成网络随机训练算法及装置。
技术介绍
深度生成网络用多层的结构去刻画数据的分布，其每一层都经过一些非线性的转换。在众多的需要随机性以及概率推理的任务中，例如图像生成、数据补全等，深度生成网络取得了广泛的应用。随着一些判别性的特征加入，深度生成网络在分类、预测等问题上存在的性能不足也得到了明显的改善。在众多深度生成模型的例子中，Goodfellow等人在2015年提出了generativeadversarialnetwork(GAN)，其模拟了一个博弈游戏用来生成数据。然而其优化目标为一个最大-最小问题，通常而言其难以训练。在同期，Li等人提出了GenerativeMomentMatchingNetwork(GMMN)，其从一个简单地分布中采样，例如均匀分布，之后通过网络传播获得一个样本。与GAN不同的是，GMMN是将目标概率嵌入到某个再生核希尔伯特空间中，其优化目标可以归结为使得在此空间中的两个元素之间的差异最小(在范数意义下)，此准则被称为MaximumMeanDiscrepancy(MMD)。通过核技巧，此优化目标具有简单的形式，进而通过梯度随机下降结合后向传播即可完成训练。虽然GMMN在非监督的数据生成上取得了成功，但是其只能应用在此。对于更加广泛的问题，例如分类、预测问题，以及根据不同的条件变量生成数据等问题，由于GMMN训练目标中不包含条件变量，所以其不能应用在此。与之相对的GAN可以很容易地扩展成基于条件变量的版本，因此GMMN的相对狭小的应用范围限制了其影响力。然而，对于概率在希尔伯特空间中的嵌...
一种深度生成网络随机训练算法及装置

【技术保护点】
一种深度生成网络随机训练算法，其特征在于，包括：输入包括条件变量以及生成数据本身的数据集合；将所述数据集合随机分割成包括一定数量样本的若干批次；对各批次的样本数据通过梯度后向传播进行参数更新并输出所述参数；其中，所述对各批次的样本数据通过梯度后向传播进行参数更新包括使用条件极大矩匹配准则。

【技术特征摘要】
1.一种深度生成网络随机训练算法，其特征在于，包括：输入包括条件变量以及生成数据本身的数据集合；将所述数据集合随机分割成包括一定数量样本的若干批次；对各批次的样本数据通过梯度后向传播进行参数更新并输出所述参数；其中，所述对各批次的样本数据通过梯度后向传播进行参数更新包括使用条件极大矩匹配准则。2.根据权利要求1所述的算法，其特征在于，所述条件极大矩匹配准则包括：比较两个再生核希尔伯特空间之间算子的差异，以判断两个条件概率之间的差距。3.根据权利要求1所述的算法，其特征在于，所述对各批次的样本数据通过梯度后向传播进行参数更新并输出所述参数包括：获取与任一批次的样本数据对应的生成数据集合；根据所述批次的样本数据与所述对应的生成数据集合计算条件极大矩匹配准则；获取所述条件极大矩匹配准则关于所述参数的导数，并以所述条件极大矩匹配准则关于所述参数的导数作为输出层的梯度。根据链式求导法则获取各中间层的梯度；对所述参数通过梯度下降算法进行更新并输出所述参数；重复上述步骤直至所述参数满足收敛条件后，输出所述参数。4.根据权利要求1所述的算法，其特征在于，所述将所述数据集合随机分割成包括一定数量样本的若干批次包括：根据所述数据集合的结构选...

【专利技术属性】
技术研发人员：朱军，任勇，李佳莲，罗宇岑，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人