前馈生成式神经网络制造技术

技术编号：22758154 阅读：15 留言：0更新日期：2019-12-07 05:17

公开了一种前馈生成式神经网络，该前馈生成式神经网络生成在单个神经网络推理中包括特殊类型的多个输出示例的输出示例。可选地，生成可以以上下文输入为条件。例如，前馈生成式神经网络可以生成语音波形，语音波形是以文本片段的语言特征为条件的输入文本片段的语言化。

Feedforward generated neural network

A feed-forward generative neural network is disclosed. The feed-forward generative neural network generates output examples including special types of multiple output examples in a single neural network reasoning. Alternatively, the generation can be conditional on the following inputs. For example, the feedforward generated neural network can generate speech waveform, which is the input text segment's linguistic feature.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】前馈生成式神经网络
技术介绍
本说明书涉及生成式神经网络。神经网络是采用一层或多层非线性单元来预测所接收的输入的输出的机器学习模型。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的下一层(即下一个隐藏层或输出层)的输入。网络的每一层根据相应的一组参数的当前值从所接收的输入中生成输出。
技术实现思路
总的来说，本说明书描述了前馈生成式神经网络。前馈生成式神经网络是在单个神经网络推理中生成包括多个特殊类型的输出样本的输出示例的神经网络。可选地，生成可以以上下文输入为条件。例如，前馈生成式神经网络可以生成语音波形，语音波形是以文本片段的语言特征为条件的输入文本片段的语言化。因此，在一个实施方案中，本说明书描述了一种训练前馈生成式神经网络的方法，该前馈生成式神经网络具有多个前馈参数，并且被配置为生成以第二类型的上下文输入为条件的第一类型的输出示例。每个输出示例包括在多个生成时间步骤的每一个处的相应的输出样本。前馈生成式神经网络被配置为接收包括上下文输入的前馈输入，并被配置为处理前馈输入以生成前馈输出，对于生成时间步骤中的每一个，该前馈输出定义在该生成时间步骤处的输出样本的可能值的相应的似然性分布。该训练包括获得训练上下文输入；根据前馈参数的当前值，使用前馈生成式神经网络处理包括该训练上下文输入的训练前馈输入，以生成训练前馈输出；以及使用经训练的自回归生成式神经网络处理训练上下文输入。对于多个生成时间步骤中的每一个，经训练的自回归生成式神经网络已被训练为自回归地生成自回归输出，该自回归输出...

【技术保护点】
1.一种训练前馈生成式神经网络的方法，所述前馈生成式神经网络具有多个前馈参数，并且被配置为生成以第二类型的上下文输入为条件的第一类型的输出示例，/n其中，每个输出示例包括在多个生成时间步骤中的每一个生成时间步骤处的相应的输出样本，/n其中，所述前馈生成式神经网络被配置为接收包括上下文输入的前馈输入，并被配置为处理所述前馈输入以生成前馈输出，对于所述生成时间步骤中的每一个生成时间步骤，所述前馈输出定义在所述生成时间步骤处的输出样本的可能值的相应的似然性分布。/n其中，所述训练包括：/n获得训练上下文输入；/n根据所述前馈参数的当前值，使用所述前馈生成式神经网络处理包括所述训练上下文输入的训练的前馈输入，以生成训练的前馈输出。/n使用经训练的自回归生成式神经网络处理所述训练的上下文输入，/n其中，对于所述多个生成时间步骤中的每一个生成时间步骤，所述经训练的自回归生成式神经网络已被训练为自回归地生成自回归输出，所述自回归输出定义在所述生成时间步骤处的以前一生成时间步骤处的输出样本为条件的输出样本的可能值的似然性分布；/n确定相对于所述前馈参数的第一梯度以使散度损耗最小化，对于所述生成时间步骤...

【技术特征摘要】
【国外来华专利技术】20170520 US 62/509,0531.一种训练前馈生成式神经网络的方法，所述前馈生成式神经网络具有多个前馈参数，并且被配置为生成以第二类型的上下文输入为条件的第一类型的输出示例，
其中，每个输出示例包括在多个生成时间步骤中的每一个生成时间步骤处的相应的输出样本，
其中，所述前馈生成式神经网络被配置为接收包括上下文输入的前馈输入，并被配置为处理所述前馈输入以生成前馈输出，对于所述生成时间步骤中的每一个生成时间步骤，所述前馈输出定义在所述生成时间步骤处的输出样本的可能值的相应的似然性分布。
其中，所述训练包括：
获得训练上下文输入；
根据所述前馈参数的当前值，使用所述前馈生成式神经网络处理包括所述训练上下文输入的训练的前馈输入，以生成训练的前馈输出。
使用经训练的自回归生成式神经网络处理所述训练的上下文输入，
其中，对于所述多个生成时间步骤中的每一个生成时间步骤，所述经训练的自回归生成式神经网络已被训练为自回归地生成自回归输出，所述自回归输出定义在所述生成时间步骤处的以前一生成时间步骤处的输出样本为条件的输出样本的可能值的似然性分布；
确定相对于所述前馈参数的第一梯度以使散度损耗最小化，对于所述生成时间步骤中的每一个生成时间步骤，所述散度损耗取决于来自由所述自回归输出定义的、所述生成时间步骤的似然性分布和由所述训练的前馈输出定义的、所述生成时间步骤的似然性分布的第一散度；以及
至少部分地基于所述第一梯度确定对所述前馈参数的当前值的更新。

2.根据权利要求1所述的方法，其中，所述前馈输入还包括在所述生成时间步骤中的每一个生成时间步骤处的相应的噪声输入。

3.根据权利要求1或2中任一项所述的方法，其中，所述训练还包括：
获得所述训练的上下文输入的真值输出示例；以及
通过从所述概率分布采样来根据所述训练的前馈输出生成预测的输出示例。

4.根据权利要求3所述的方法，其中，所述真值输出示例和所述预测的输出示例是语音波形，其中，所述训练还包括：
生成所述真值输出示例的第一幅度谱；
生成所述预测的输出示例的第二幅度谱；
确定相对于所述前馈参数的第二梯度，以使取决于所述第一幅度谱和所述第二幅度谱之间的差异的幅度损耗最小化，并且其中，确定对所述前馈参数的当前值的更新包括至少部分地基于所述第二梯度确定更新。

5.根据权利要求3至4中任一项所述的方法，其中，所述训练还包括：
使用经训练的特征生成神经网络处理所述真值输出示例，以获得所述真值输出示例的特征，其中，所述经训练的特征生成神经网络是以波形为输入的经预先训练的神经网络；
使用所述经训练的特征生成神经网络处理所述预测的输出示例，以获得所述预测的输出示例的特征，
确定相对于所述前馈参数的第三梯度，以使取决于所述真值输出示例的特征和所述预测的输出示例的特征之间的差异的度量的感知损耗最小化，并且其中，确定对所述前馈参数的当前值的更新包括至少部分地基于所述第三梯度确定更新。

6.根据权利要求5所述的方法，其中，所述特征生成神经网络是语音识别神经网络。

7.根据权利要求5或6中任一项所述的方法，其中，所述特征是所述特征生成网络中的中间层的输出。

8.根据权利要求5至7中任一项所述的方法，其中，所述特征生成神经网络是经训练的自回归生成式神经网络。

9.根据权利要求1至8中任一项所述的方法，其中，所述训练...

【专利技术属性】
技术研发人员：AGA范登奥德，K西蒙扬，O文雅尔斯，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：英国;GB

全部详细技术资料下载我是这个专利的主人