关联长短期记忆神经网络层制造技术

技术编号：19397118 阅读：26 留言：0更新日期：2018-11-10 05:07

与关联长短期记忆(LSTM)神经网络层有关的系统、方法和设备，包括在计算机存储介质上编码的计算机程序，所述关联LSTM神经网络层被配置成为所述关联LSTM层维护内部状态的N个副本，N是大于一的整数。在一个方面中，一种系统包括：递归神经网络，所述递归神经网络包括关联LSTM层，其中，所述关联LSTM层被配置成，针对每个时间步，接收层输入，使用所述时间步的所述层输入和由所述关联LSTM层针对前一个时间步而生成的层输出来更新所述内部状态的N个副本中的每一个，并且使用所述内部状态的N个更新的副本来生成所述时间步的层输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】关联长短期记忆神经网络层
本说明书涉及递归神经网络架构。
技术介绍
神经网络是采用非线性单元的一个或多个层来针对接收到的输入预测输出的机器学习模型。一些神经网络除了包括输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的下一个层(即，下一个隐藏层或输出层)的输入。网络的每个层根据相应的参数集合的当前值从接收到的输入生成输出。一些强化学习系统根据神经网络的输出来选择要由代理响应于给定观察结果而执行的动作。一些神经网络是递归神经网络。递归神经网络是接收输入序列并且从该输入序列生成输出序列的神经网络。特别地，递归神经网络可在在当前时间步计算输出时使用来自前一个时间步的网络的内部状态中的一些或全部。
技术实现思路
一般而言，本说明书中描述的主题的一个创新方面可被具体实现在包括由一个或多个计算机实现的递归神经网络的系统中，其中，递归神经网络被配置成在多个时间步中的每一个接收相应的神经网络输入并且在多个时间步中的每一个生成相应的神经网络输出，其中，递归神经网络包括关联长短期记忆(LSTM)层，其中，关联LSTM层被配置成为关联LSTM层维护内部状态的N个副本，N是大于一的整数，并且其中，关联LSTM层还被配置成在多个时间步中的每一个接收时间步的层输入，使用时间步的层输入和由关联LSTM层针对前一个时间步而生成的层输出来更新内部状态的N个副本中的每一个，并且使用内部状态的N个更新的副本来生成时间步的层输出。此方面的其它实施例包括执行关联LSTM层被配置成执行的操作的方法。此方面的其它实施例包括记录在一个或多个计算机存储装置上的对应的计算机系统、设备和计算机程序，...

【技术保护点】
1.一种系统，包括：由一个或多个计算机实现的递归神经网络，其中，所述递归神经网络被配置成在多个时间步中的每一个接收相应的神经网络输入并且在所述多个时间步中的每一个生成相应的神经网络输出，其中，所述递归神经网络包括关联长短期记忆(LSTM)层，其中，所述关联LSTM层被配置成维护所述关联LSTM层的内部状态的N个副本，N是大于一的整数，并且其中，所述关联LSTM层还被配置成在所述多个时间步中的每一个：接收所述时间步的层输入，使用所述时间步的所述层输入和由所述关联LSTM层针对前一个时间步生成的层输出来更新所述内部状态的所述N个副本中的每一个，并且使用所述内部状态的N个更新的副本来生成所述时间步的层输出。

【技术特征摘要】
【国外来华专利技术】2016.02.04 US 62/291,4671.一种系统，包括：由一个或多个计算机实现的递归神经网络，其中，所述递归神经网络被配置成在多个时间步中的每一个接收相应的神经网络输入并且在所述多个时间步中的每一个生成相应的神经网络输出，其中，所述递归神经网络包括关联长短期记忆(LSTM)层，其中，所述关联LSTM层被配置成维护所述关联LSTM层的内部状态的N个副本，N是大于一的整数，并且其中，所述关联LSTM层还被配置成在所述多个时间步中的每一个：接收所述时间步的层输入，使用所述时间步的所述层输入和由所述关联LSTM层针对前一个时间步生成的层输出来更新所述内部状态的所述N个副本中的每一个，并且使用所述内部状态的N个更新的副本来生成所述时间步的层输出。2.根据权利要求1所述的系统，其中，更新所述内部状态的所述N个副本中的每一个包括：根据在所述时间步的所述层输入和可选地所述前一个时间步的所述层输出来确定所述时间步的cell状态更新；针对所述内部状态的所述N个副本中的每一个，根据在所述时间步的所述层输入和所述前一个时间步的所述层输出来确定对应的变换的输入键；以及针对所述内部状态的所述N个副本中的每一个，根据所述内部状态的副本、所述cell状态更新和所述对应的变换的输入键来确定所述内部状态的更新的副本。3.根据权利要求2所述的系统，其中，针对所述内部状态的所述N个副本中的每一个根据在所述时间步的所述层输入和所述前一个时间步的所述层输出来确定对应的变换的输入键包括：根据在所述时间步的所述层输入和所述前一个时间步的所述层输出来确定输入键；以及针对所述内部状态的所述N个副本中的每一个，通过利用特定于所述副本的相应的置换矩阵置换所述输入键来确定用于所述副本的所述对应的变换的输入键。4.根据权利要求2或3所述的系统，其中，更新所述内部状态的所述N个副本中的每一个还包括：根据在所述时间步的所述层输入和所述前一个时间步的所述层输出来确定输入门，以及根据在所述时间步的所述层输入和所述前一个时间步的所述层输出来确定遗忘门。5.根据权利要求4所述的系统，其中，根据所述内部状态的副本、...

【专利技术属性】
技术研发人员：伊沃·达尼赫尔卡，纳尔·埃默里赫·卡尔赫布伦纳，格雷戈里·邓肯·韦恩，贝尼尼奥·乌里亚马丁尼兹，亚历山大·本杰明·格拉韦斯，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：英国,GB

全部详细技术资料下载我是这个专利的主人