用于数据项生成的循环神经网络制造技术

技术编号：31017689 阅读：39 留言：0更新日期：2021-11-30 03:01

本公开涉及用于数据项生成的循环神经网络。一种方法，包括：使用前一时间步的解码器的解码器隐藏状态向量，从所述数据项读取一瞥；作为编码器的输入，提供所述一瞥和所述前一时间步的所述解码器隐藏状态向量以用于处理；作为所述编码器的输出，接收该时间步的所生成的编码器隐藏状态向量；从所述所生成的编码器隐藏状态向量生成解码器输入；将所述解码器输入提供给所述解码器以用于处理；作为所述解码器的输出，接收该时间步的所生成的解码器隐藏状态向量；从该时间步的所述解码器隐藏状态向量生成神经网络输出更新；以及将所述神经网络输出更新与当前神经网络输出相结合，以生成更新的神经网络输出。的神经网络输出。的神经网络输出。

全部详细技术资料下载

【技术实现步骤摘要】
用于数据项生成的循环神经网络
[0001]分案说明
[0002]本申请属于申请日为2016年2月6日的中国专利技术专利申请201610139237.7的分案申请。

[0003]本说明书涉及通过循环神经网络的层处理输入以产生输出。

技术介绍

[0004]神经网络是机器学习模型，其采用非线性单元的一个或多个层来预测对于所接收输入的输出。除了输出层之外，一些神经网络包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的下一层即下一隐藏层或输出层的输入。网络的每一层根据各自的参数集合的当前值从所接收的输入生成输出。
[0005]一些神经网络是循环神经网络。循环神经网络是一种接收输入序列并从输入序列生成输出序列的神经网络。尤其是，循环神经网络可将来自前一时间步的网络的一些或全部内部状态用在计算当前时间步的输出中。循环神经网络的示例是长短期记忆(LSTM)神经网络，其包括一个或多个LSTM记忆块。每个LSTM记忆块可以包括一个或多个单元，每个单元包括输入门、遗忘门、和输出门，其允许该单元存储该单元的先前状态，例如用于生成当前激活或被提供给LSTM神经网络的其它组件。

技术实现思路

[0006]一般来说，本说明书中描述的主题的一个创新方面可在系统中实现，所述系统包括：编码器神经网络，其中，该编码器神经网络是循环神经网络，其被配置成，对于由该编码器神经网络处理的每个输入数据项和在多个步中的每个时间步处：接收通过从所述输入数据项读取而捕获的一瞥(glimpse)；接收前一时间步的解码器神经网络的解...

【技术保护点】

【技术特征摘要】
1.一种用于生成最终输出图像的计算机实现的方法，包括：在多个时间步中的每一个处重复更新神经网络输出以生成最终神经网络输出，所述更新包括，针对所述时间步中的每一个时间步：生成该时间步的解码器神经网络的解码器输入，其中，所述解码器神经网络是循环神经网络，所述循环神经网络被配置成针对所述时间步中的每一个时间步接收该时间步的所述解码器输入，并且处理前一时间步的解码器隐藏状态向量和所述解码器输入，以生成该时间步的解码器隐藏状态向量；使用所述解码器神经网络处理该时间步的所述解码器输入，以生成该时间步的所述解码器隐藏状态向量；从该时间步的所述解码器隐藏状态向量生成该时间步的神经网络输出更新；以及将该时间步的所述神经网络输出更新与当前神经网络输出相结合，以生成更新的神经网络输出；以及从所述最终神经网络输出生成所述最终输出图像。2.根据权利要求1所述的方法，其中，生成所述解码器神经网络的所述解码器输入包括从先前分布中选择潜在变量样本。3.根据权利要求1所述的方法，其中，所述更新的神经网络输出是图像，并且其中，所述多个时间步中的最近时间步的所述更新的神经网络输出是新图像。4.根据权利要求1所述的方法，其中，所述解码器神经网络是长短期记忆神经网络。5.根据权利要求1所述的方法，其中，所述更新的神经网络输出定义图像的分布，并且其中，所述多个时间步中的最近时间步的所述更新的神经网络输出定义用于参数化所述最终输出图像的分布模型的分布。6.根据权利要求1所述的方法，其中，从所述时间步的所述解码器隐藏状态向量生成所述时间步的所述神经网络输出更新包括：对所述时间步的所述解码器隐藏状态向量应用写操作，以生成所述时间步的所述神经网络输出更新。7.根据权利要求6所述的方法，其中，应用所述写操作包括：从所述时间步的所述解码器隐藏状态向量生成所述时间步的注意力参数集合；以及将所述注意力参数集合应用于所述时间步的所述解码器隐藏状态向量，以生成所述时间步的所述神经网络输出更新。8.根据权利要求1所述的方法，其中，所述神经网络输出更新是写入图像分块。9.一种系统，所述系统包括一个或多个计算机和一个或多个存储指令的存储设备，所述指令在由所述一个或多个计算机执行时使所述一个或多个计算机执行操作，所述操作包括：在多个时间步中的每一个处重复更新神经网络输出以生成最终神经网络输出，所述更新包括，针对所述时间步中的每一个时间步：生成该时间步的解码器神经网络的解码器输入，其中，所述解码器神经网络是循环神经网络，所述循环神经网络被配置成针对所述时间步中的每一个时间步接收该时间步的所述解码器输入，并且处理前一时间步的解码器隐藏状态向量和所述解码器输入，以生成该时间步的解码器隐藏状态向量；
使用所述解码器神经网络处理该时间步的所述解码器输入，以生成该时间步的所述解码器隐藏状态向量；从该时间步的所述解码器隐藏状...

【专利技术属性】
技术研发人员：卡罗尔，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人