A learning method that provides efficient learning for recurrent neural network (RNN) based on time series data. Learning methods include: step (220), initialize RNN, and learn steps (226), specify a vector as the starting position, optimize each parameter, so that the error function is minimized, thereby learning RNN. Learning steps (226) include: update step (250), using vector designated as the beginning of the continuous N (N = 3) by the end of the vector, the vector reference value to parameters of positive solutions of Truncated tag BPTT to update RNN; and repeat step first until the end of 240. The conditions are set up, repeat the following treatment, namely, the new update step at the end of a specified vector N vector in a given vector satisfy reltionships to perform processing steps with respect to learning. A vector that is in a position that satisfies a given relationship is at least 2 after the specified vector.
【技术实现步骤摘要】
【国外来华专利技术】循环神经网络的学习方法及用于该学习方法的计算机程序、和声音识别装置
本专利技术涉及循环神经网络(RNN)的学习方法,特别涉及能提高学习的效率且能提高学习后的RNN的精度的RNN的学习方法以及用于该学习方法的计算机程序。
技术介绍
近年来,提出有使用RNN作为用于声音识别的声学模型的技术。所谓RNN,是在神经网络中嵌入时间序列的信息而成的构成。图1示意性示出通常的神经网络的原理。神经网络30包含:接受输入矢量46的输入层40;为了接受输入层40的输出而与输入层40结合的隐含层42;和为了接受隐含层42的输出而被结合且输出输出矢量48的输出层44。在图1中,为了使图简明而示出了隐含层为1层的情况,但隐含层的数目并不限定于1。在这样的神经网络中,数据从输入层40向隐含层42并从隐含层42向输出层44这样地在一个方向上流动。因此,将该类型的神经网络称作前馈神经网络(FFNN)。对从某节点向另外节点的结合赋予权重,有时还进一步赋予偏置,这些权重以及偏置的值通过学习来确定。在学习时,将学习数据作为输入矢量46提供给隐含层42,从输出层44得到输出矢量48。将该输出矢量48与正解数据的误差从输出层44侧提供给隐含层42、输入层40的各节点,将各权重以及偏置的值最佳化,以使得作为神经网络30的误差成为最小。另一方面,RNN不是如FFNN那样向一个方向去的节点的结合,还包括反向的节点的结合、同一层内的节点间的结合、同一节点的自环等。图2示意性示出RNN的隐含层的1例的与各节点的结合相关的构成。在图2中,该隐含层70作为示例而包含3个节点。这3个节点各自除了具有用于从更下层( ...
【技术保护点】
一种循环神经网络RNN的学习方法,是使用预先准备的学习数据由计算机进行的RNN的学习方法,所述学习数据包含各自由学习对象数据的特征量和参考值构成的矢量的序列,所述学习方法包含:将所述RNN初始化的步骤;第1指定步骤,将所述矢量的序列内的某矢量指定为学习开始位置;和学习步骤,将所述RNN的各参数最佳化,以使得针对所述学习数据计算的给定的误差函数最小化,由此进行所述RNN的学习,所述学习步骤包含:更新步骤,使用所述矢量的序列当中的以被指定的矢量为开头的连续的N个矢量,通过将该连续的N个矢量的末尾的矢量的参考值设为正解标签的Truncated BPTT来进行所述RNN的参数的更新,其中,N是3以上的整数,第1重复步骤,直到预先确定的结束条件成立为止,都重复以下处理,即,新指定相对于所述更新步骤中使用的所述N个矢量的末尾的矢量处于满足给定的关系的位置的矢量来执行所述学习步骤的处理,处于满足所述给定的关系的位置的矢量是从所述进行选择的步骤中的所述被指定的矢量起至少2个以上后的矢量。
【技术特征摘要】
【国外来华专利技术】2015.05.11 JP 2015-0961501.一种循环神经网络RNN的学习方法,是使用预先准备的学习数据由计算机进行的RNN的学习方法,所述学习数据包含各自由学习对象数据的特征量和参考值构成的矢量的序列,所述学习方法包含:将所述RNN初始化的步骤;第1指定步骤,将所述矢量的序列内的某矢量指定为学习开始位置;和学习步骤,将所述RNN的各参数最佳化,以使得针对所述学习数据计算的给定的误差函数最小化,由此进行所述RNN的学习,所述学习步骤包含:更新步骤,使用所述矢量的序列当中的以被指定的矢量为开头的连续的N个矢量,通过将该连续的N个矢量的末尾的矢量的参考值设为正解标签的TruncatedBPTT来进行所述RNN的参数的更新,其中,N是3以上的整数,第1重复步骤,直到预先确定的结束条件成立为止,都重复以下处理,即,新指定相对于所述更新步骤中使用的所述N个矢量的末尾的矢量处于满足给定的关系的位置的矢量来执行所述学习步骤的处理,处于满足所述给定的关系的位置的矢量是从所述进行选择的步骤中的所述被指定的矢量起至少2个以上后的矢量。2.根据权利要求1所述的RNN的学习方法,其中,处于满足所述给定的关系的位置的矢量是所述N个矢量的末尾的矢量。3.根据权利要求1或2所述的RNN的学习方法,其中,所述RNN的学...
【专利技术属性】
技术研发人员:神田直之,
申请(专利权)人:国立研究开发法人情报通信研究机构,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。