神经网络模型训练装置和方法制造方法及图纸

技术编号：14117367 阅读：404 留言：0更新日期：2016-12-08 00:37

本公开涉及神经网络模型训练装置和方法。所述装置包括：迭代计算单元，用于对神经网络模型中的路径的权重进行迭代计算；以及判断与输出单元，用于当满足停止迭代的条件时，停止迭代，并输出本次迭代的路径的权重作为最终权重，其中，迭代计算单元包括：权重计算单元，用于计算本次迭代的路径的权重；相关函数计算单元，用于从用于训练所述神经网络模型的样本集合中随机选取一个样本，并根据本次迭代的路径的权重来计算所选样本的相关函数，并且保持样本集合中除所选样本之外的其它样本的相关函数不变，样本的相关函数是与样本的损失函数相关联的函数；以及总相关函数计算单元，用于根据所选样本和其它样本的相关函数来计算本次迭代的总相关函数。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及神经网络的
，具体地涉及神经网络模型训练装置和方法。
技术介绍
这个部分提供了与本公开有关的背景信息，这不一定是现有技术。在用于训练神经网络的技术方案中，最近研究者提出的若干近增量梯度法，包括MISO(Minimization by Incremental Surrogate Optimization，采用增量替代优化最小化)，Prox-SDCA(Proximal Stochastic Dual Coordinated Ascent，近随机双坐标上升)，Prox-SVRG(Proximal Stochastic Variance Reduced Gradient，近随机方差缩减梯度)和SAG(Stochastic Average Gradient，随机平均梯度)，都达到了线性收敛速度。然而，当实际应用于训练神经网络时，特别是训练大型的神经网络时，这些方法的收敛速度仍然无法令人满意。
技术实现思路
这个部分提供了本公开的一般概要，而不是其全部范围或其全部特征的全面披露。本公开的目的在于提供一种神经网络模型训练装置和方法，其能够采用二阶信息来获得更快的收敛效果，从而不仅在函数目标值方面，而且在求解方面都实现了线性收敛速度。根据本公开的一方面，提供了一种神经网络模型训练装置，该装置包括：迭代计算单元，用于对神经网络模型中的路径的权重进行迭代计算；以及判断与输出单元，用于当满足停止迭代的条件时，停止迭代，并输出本次迭代的路径的权重作为所述神经网络模型中的路径的最终权重，其中，所述迭代计算单元包括：权重计算单元，用于计算本次迭代的路径的权重；相关函数计...
神经网络模型训练装置和方法

【技术保护点】
一种神经网络模型训练装置，包括：迭代计算单元，用于对神经网络模型中的路径的权重进行迭代计算；以及判断与输出单元，用于当满足停止迭代的条件时，停止迭代，并输出本次迭代的路径的权重作为所述神经网络模型中的路径的最终权重，其中，所述迭代计算单元包括：权重计算单元，用于计算本次迭代的路径的权重；相关函数计算单元，用于从用于训练所述神经网络模型的样本集合中随机选取一个样本，并根据本次迭代的路径的权重来计算所选样本的相关函数，并且保持所述样本集合中除所选样本之外的其它样本的相关函数不变，其中样本的相关函数是与所述样本的损失函数相关联的函数；以及总相关函数计算单元，用于根据所选样本的相关函数和所述其它样本的相关函数来计算本次迭代的总相关函数。

【技术特征摘要】
1.一种神经网络模型训练装置，包括：迭代计算单元，用于对神经网络模型中的路径的权重进行迭代计算；以及判断与输出单元，用于当满足停止迭代的条件时，停止迭代，并输出本次迭代的路径的权重作为所述神经网络模型中的路径的最终权重，其中，所述迭代计算单元包括：权重计算单元，用于计算本次迭代的路径的权重；相关函数计算单元，用于从用于训练所述神经网络模型的样本集合中随机选取一个样本，并根据本次迭代的路径的权重来计算所选样本的相关函数，并且保持所述样本集合中除所选样本之外的其它样本的相关函数不变，其中样本的相关函数是与所述样本的损失函数相关联的函数；以及总相关函数计算单元，用于根据所选样本的相关函数和所述其它样本的相关函数来计算本次迭代的总相关函数。2.根据权利要求1所述的装置，其中，所述相关函数为损失函数，所述总相关函数为总损失函数，并且所述总损失函数是对每个样本的损失函数求平均得到的。3.根据权利要求2所述的装置，其中，所述相关函数计算单元根据权重变量与本次迭代的路径的权重的差值的二阶信息来计算所选样本的损失函数。4.根据权利要求2所述的装置，其中，所述权重计算单元根据本次迭代之前的路径的权重和总损失函数来计算本次迭代的路径的权重。5.根据权利要求4所述的装置，其中，所述权重计算单元使得以所述本次迭代之前的路径的权重的范数和所述总损失函数为变量的函数取得最小值时的路径的权重作为...

【专利技术属性】
技术研发人员：石自强，刘汝杰，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人