Methods, systems and devices for augmenting neural networks with external memory using reinforcement learning, including computer programs coded on computer storage media. One method includes providing the output from the system output part of the neural network output as a system output in the system output sequence; selecting the memory access process for accessing external memory from the predetermined set of memory access processes according to the enhanced learning part of the neural network output; and using the distinguishable part of the neural network output according to the selected memory. The storage access process writes data to and reads data from the location in the external memory, and combines the data read from the external memory with the next system input in the system input sequence to generate the next neural network input in the neural network input sequence.
【技术实现步骤摘要】
【国外来华专利技术】使用强化学习利用外部存储器增强神经网络相关申请的交叉引用本申请根据35U.S.C.§119(e)要求于2016年05月04日提交的题为“使用强化学习利用外部存储器增强神经网络(AUGMENTINGNEURALNETWORKSWITHEXTERNALMEMORYUSINGREINFORCEMENTLEARNING)”的美国专利申请No.62/331,904的权益。上述申请的公开内容出于所有目的而通过引用全文结合于此。
技术介绍
该说明书涉及神经网络系统架构。神经网络是采用非线性单元的一个或多个分层来针对所接收输入预测输出的机器学习模型。除了输出层之外,一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中下一层的输入,所述下一层即下一个隐藏层或输出层。该网络的每一层依据相应参数集合的当前数值从所接收输入生成输出。一些神经网络是递归神经网络。递归神经网络是接收输入序列并且从该输入序列生成输出序列的神经网络。特别地,递归神经网络在计算当前输出时能够使用来自处理先前输入的一些或全部内部网络状态。递归神经网络的一种示例是长短期记忆(LSTM)神经网络,其包括一个或多个LSTM存储器块。每个LSTM存储器块可以包括一个或多个单元,每个单元均包括允许单元存储该单元的先前状态的输入门、遗忘门和输出门,所述先前状态例如用于在生成当前激励时使用或者被提供至LSTM神经网络的其它组件。
技术实现思路
该说明书描述了涉及增强神经网络系统的技术。总体上,增强神经网络系统包括被配置为接收神经网络输入并生成神经网络输出的神经网络,存储从该神经网络输出的部分取得的数值的外部存储器,和被配 ...
【技术保护点】
1.一种用于处理系统输入的序列以生成系统输出的序列的增强神经网络系统,所述增强神经网络系统包括:神经网络,其中所述神经网络被配置为接收神经网络输入的序列并且处理每个神经网络输入以从所述神经网络输入生成神经网络输出,所述神经网络输出包括:系统输出部分,强化学习部分,和可区分部分;外部存储器;以及存储器接口子系统,其中所述存储器接口子系统被配置为执行操作,所述操作包括针对每个神经网络输出:提供从所述神经网络输出的所述系统输出部分取得的输出作为所述系统输出的序列中的一个系统输出;根据所述神经网络输出的所述强化学习部分从存储器访问过程的预定集合中选择用于访问所述外部存储器的存储器访问过程;使用所述神经网络输出的所述可区分部分依据所选择的存储器访问过程向所述外部存储器中的位置写入数据以及从所述位置读取数据;以及将从所述外部存储器读取的数据与所述系统输入的序列中的下一个系统输入进行组合以生成所述神经网络输入的序列中的下一个神经网络输入。
【技术特征摘要】
【国外来华专利技术】2016.05.04 US 62/331,9041.一种用于处理系统输入的序列以生成系统输出的序列的增强神经网络系统,所述增强神经网络系统包括:神经网络,其中所述神经网络被配置为接收神经网络输入的序列并且处理每个神经网络输入以从所述神经网络输入生成神经网络输出,所述神经网络输出包括:系统输出部分,强化学习部分,和可区分部分;外部存储器;以及存储器接口子系统,其中所述存储器接口子系统被配置为执行操作,所述操作包括针对每个神经网络输出:提供从所述神经网络输出的所述系统输出部分取得的输出作为所述系统输出的序列中的一个系统输出;根据所述神经网络输出的所述强化学习部分从存储器访问过程的预定集合中选择用于访问所述外部存储器的存储器访问过程;使用所述神经网络输出的所述可区分部分依据所选择的存储器访问过程向所述外部存储器中的位置写入数据以及从所述位置读取数据;以及将从所述外部存储器读取的数据与所述系统输入的序列中的下一个系统输入进行组合以生成所述神经网络输入的序列中的下一个神经网络输入。2.根据权利要求1所述的增强神经网络系统,所述操作进一步包括针对每个所述神经网络输出:使用所述神经网络输出的所述可区分部分依据所选择的存储器访问过程从所述外部存储器中的位置擦除数据。3.根据权利要求1或2中的任一项所述的增强神经网络系统,其中所述外部存储器被划分为多个分区,并且其中选择所述存储器访问过程包括选择将要访问的所述外部存储器的分区。4.根据权利要求3所述的增强神经网络系统,其中使用所述神经网络输出的所述可区分部分依据所选择的存储器访问过程向所述外部存储器中的位置写入数据以及从所述位置读取数据包括:使用所述神经网络输出的所述可区分部分仅向所述外部存储器的所选择的分区中的位置写入数据以及仅从所述位置读取数据。5.根据权利要求4所述的增强神经网络系统,其中使用所述神经网络输出的所述可区分部分仅向所述外部存储器的所选择的分区中的位置写入数据以及仅从所述位置读取数据包括:根据所述神经网络输出的所述可区分部分针对所述外部存储器的所选择的分区中的每个位置确定相应的写入权重;依据所述写入权重向所述外存储器的所选择的分区中的多个位置中的每一个写入由所述神经网络输出的所述可区分部分所定义的数据;根据所述神经网络输出的所述可区分部分针对所述外部存储器的所选择的分区中的每个位置确定相应的读取权重;依据所述读取权重从所述外部存储器的所选择的分区中...
【专利技术属性】
技术研发人员:伊利亚·苏特思科韦尔,伊沃·达尼赫尔卡,亚历山大·本杰明·格拉韦斯,格雷戈里·邓肯·韦恩,沃伊切赫·扎连芭,
申请(专利权)人:渊慧科技有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。