经压缩的递归神经网络模型制造技术

技术编号：15983323 阅读：51 留言：0更新日期：2017-08-12 05:49

本申请涉及经压缩的递归神经网络模型。用于实现经压缩递归神经网络(RNN)的方法、系统和装置，所述装置包括在计算机存储介质上编码的计算机程序。系统中的一种包括经压缩RNN，经压缩RNN包括多个递归层，其中每个递归层具有相应的递归权重矩阵和相应的层间权重矩阵，并且其中至少一个递归层被压缩使得经压缩层的相应递归权重矩阵由第一经压缩权重矩阵和投影矩阵定义，并且经压缩层的相应层间权重矩阵由第二经压缩权重矩阵和投影矩阵定义。压缩可以提供许多技术优点，包括更有效地处理数据并且使用更少的数据存储的能力。

全部详细技术资料下载

【技术实现步骤摘要】
经压缩的递归神经网络模型
本说明书涉及神经网络架构和压缩神经网络。
技术介绍
神经网络是采用一个或多个非线性单元层来预测所接收的输入的输出的机器学习模型。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作所述网络中下一层的输入，即下一隐藏层或输出层的输入。网络的每层根据相应参数集的当前值从所接收的输入生成输出。例如被设计用于时间序列问题或序列到序列学习的那些神经网络(递归(recurrent)神经网络(RNN))的一些神经网络包括许可其以隐藏状态变量的形式的记忆持久存在于数据输入之间的层内的递归环路。RNN的变体，长的短期记忆(LSTM)神经网络包括每层内用于控制数据输入之间的数据的持久性的多个门。例如被设计用于时间序列问题或序列到序列学习的那些神经网络的一些神经网络包括许可以隐藏状态变量的形式的记忆持久在数据输入之间的层内的递归环路。
技术实现思路
本说明书描述了涉及递归神经网络架构的技术。一般来说，递归神经网络包括至少一个被压缩的递归神经网络层。具体地，使用共享投影矩阵来联合压缩用于经压缩递归层的递归权重矩阵和层间权重矩阵。对于要被配置为执行特定操作或动作的一个或多个计算机的系统而言，意味着系统已经在其上安装了操作中的软件、固件、硬件或它们的组合，其在操作中使得系统执行操作或动作。对于要被配置为执行特定操作或动作的一个或多个计算机程序而言，意味着一个或多个程序包括当由数据处理装置执行时使得所述装置执行操作或动作的指令。在本说明书中描述的主题可以在特定实施例中实现，以便实现以下优点中的一个或多个。通过在递归神经网络中压缩一个或多个递归层...
经压缩的递归神经网络模型

【技术保护点】
一种系统，包括：由一个或多个计算机实现的经压缩递归神经网络(RNN)，所述经压缩RNN包括多个递归层，其中，所述RNN的所述多个递归层中的每一个递归层被配置为：针对多个时间步长中的每一个时间步长，接收针对该时间步长的相应层输入，并且处理针对该时间步长的所述层输入，以生成针对该时间步长的相应层输出，其中，所述多个递归层中的每一个递归层具有相应的递归权重矩阵Wh和相应的层间权重矩阵Wx，以及其中所述多个递归层中的至少一个递归层被压缩，使得所述经压缩层的相应的递归权重矩阵

【技术特征摘要】
2016.02.03 US 62/290,6241.一种系统，包括：由一个或多个计算机实现的经压缩递归神经网络(RNN)，所述经压缩RNN包括多个递归层，其中，所述RNN的所述多个递归层中的每一个递归层被配置为：针对多个时间步长中的每一个时间步长，接收针对该时间步长的相应层输入，并且处理针对该时间步长的所述层输入，以生成针对该时间步长的相应层输出，其中，所述多个递归层中的每一个递归层具有相应的递归权重矩阵Wh和相应的层间权重矩阵Wx，以及其中所述多个递归层中的至少一个递归层被压缩，使得所述经压缩层的相应的递归权重矩阵由第一经压缩权重矩阵和投影矩阵P1定义，并且所述经压缩层的相应层间权重矩阵由第二经压缩权重矩阵和投影矩阵P1定义。2.根据权利要求1所述的系统，其中所述多个递归层中的每一个递归层被配置为，针对每个时间步长：通过将用于先前层的层间权重矩阵应用于对该层的当前输入以及将用于该层的递归权重矩阵应用于对该层的递归输入，来生成针对该时间步长的所述相应层输出。3.根据任何在前权利要求所述的系统，其中所述多个递归层中的被压缩的所述至少一个递归层被配置为，针对每个时间步长：部分地通过将所述第一经压缩权重矩阵和所述投影矩阵应用于针对该层的相应递归输入，来生成针对该时间步长的所述相应层输出。4.根据任何在前权利要求所述的系统，其中，所述相应的递归权重矩阵由所述第一经压缩权重矩阵和所述投影矩阵的乘积定义，并且其中，所述相应的层间权重矩阵由所述第二经压缩矩阵和所述投影矩阵的乘积定义。5.根据任何在前权利要求所述的系统，其中所述RNN是声学模型。6.根据权利要求1-4中任一项所述的系统，其中所述RNN是语音识别模型。7.根据任何在前权利要求所述的系统，其中所述RNN是所述RNN的未经压缩版本的至少68％的压缩。8.根据权利要求7所述的系统，其中，所述RNN的字错误率在所述RNN的未经压缩版本的字错误率的5％以内。9.一种用于对递归神经网络(RNN)进行压缩的方法，其中，所述RNN由一个或多个计算机实现并且包括多个递归层，其中，所述RNN的所述多个递归层中的每一个递归层被配置为针对多个时间步长中的每一个时间步长，接收针对该时间步长的相应的层输入，并处理所述层输入以生成针对该时间步长的相应的层输出，以及其中每个递归层具有相应的递归权重矩阵Wh和相应的层间权重矩阵Wx，针对所述多个递归层中的一个递归层，所述方法包括：生成第一经压缩权重矩阵和投影矩阵P1，其中所述...

【专利技术属性】
技术研发人员：奥艾斯·阿尔沙里夫，罗希特·普拉卡什·普拉巴瓦尔卡尔，伊恩·C·麦格劳，安托万·让·布吕盖，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人