一种反向传播神经网络DNN的训练系统技术方案

技术编号：8801393 阅读：240 留言：0更新日期：2013-06-13 06:00

本发明专利技术提供了一种反向传播神经网络DNN的训练系统，包括：第一图形处理器组，用于进行DNN前向计算和权重更新计算；第二图形处理器组，用于进行DNN前向计算和DNN反向计算；控制器组，用于控制第一图形处理器组和第二图形处理器组分别根据各自的输入数据进行第N层DNN前向计算，直至前向计算完成之后，控制第一图形处理器组进行权重更新计算，并控制第二图形处理器组进行DNN反向计算，其中，N为正整数。本发明专利技术的训练系统具有训练速度快，数据传输开销低的优点，从而提升了反向传播神经网络DNN的训练速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及反向传播神经网络
，特别涉及一种反向传播神经网络DNN的训练系统。
技术介绍
反向传播神经网络(即DNN)被广泛应用在很多重要的互联网应用，如语音识别，图像识别，自然语言处理等。它能大幅度提高语音识别的精度，因此被广泛用在很多公司的语首识别广品中。DNN训练计算有两个特点:计算复杂度高和不能大规模并行。DNN训练的计算主要是浮点类型的矩阵的乘法，计算复杂度是O (N3)，属于典型的计算密集型。DNN训练计算由于算法的限制不能大规模并行，因此不能采用传统的多服务器的方法提高计算速度。采用GPU加速DNN训练是一直常用的加速方法，本专利技术提出一直采用4GPU进行加速的方案，该方案能比单GPU加速3.3倍。如图1所示，示出了一种目前的DNN的结构。包括输入层，数个中间层和输出层。各层的节点数一般是几百到几万不等，层以层之间是全连接的网络。DNN的训练计算是一层算完再期待下一层，层与层之间不能并行，所以该算法不适合大规模集群并行加速。一般一次DNN训练可以用以下几个阶段表示:前向计算O、反向误差计算E，最后是根据前向计算和反向误差计算的结果更新每层的权重W。前向计算过程是从输入层向后一直算到输出层，计算是串行的，例如第一次算完才能开始第二层的计算。反向计算过程是从输出层向前一直算到第一层，计算也是串行的，例如最后一层算完才能开始算倒数第一层。更新权值计算依赖前向计算和误差计算的结果，更新权值的计算没有层与层的依赖关系。每次输入只是一小段的训练数据，称为一个batch，一个batch完成一次训练，也就是说得到一个新的权值后，会用这个权值及新输...

【技术保护点】
一种反向传播神经网络DNN的训练系统，其特征在于，包括：第一图形处理器组，所述第一图形处理器组用于进行DNN前向计算和权重更新计算；第二图形处理器组，所述第二图形处理器组用于进行DNN前向计算和DNN反向计算；以及控制器组，所述控制器组与所述第一图形处理器组和第二图形处理器组相连，所述控制器组用于控制所述第一图形处理器组和第二图形处理器组分别根据各自的输入数据进行第N层DNN前向计算，直至前向计算完成之后，所述控制器组控制所述第一图形处理器组进行权重更新计算，并控制所述第二图形处理器组进行DNN反向计算，其中，N为正整数。

【技术特征摘要】
1.一种反向传播神经网络DNN的训练系统，其特征在于，包括: 第一图形处理器组，所述第一图形处理器组用于进行DNN前向计算和权重更新计算；第二图形处理器组，所述第二图形处理器组用于进行DNN前向计算和DNN反向计算；以及控制器组，所述控制器组与所述第一图形处理器组和第二图形处理器组相连，所述控制器组用于控制所述第一图形处理器组和第二图形处理器组分别根据各自的输入数据进行第N层DNN前向计算，直至前向计算完成之后，所述控制器组控制所述第一图形处理器组进行权重更新计算，并控制所述第二图形处理器组进行DNN反向计算，其中，N为正整数。2.如权利要求1所述的反向传播神经网络DNN的训练系统，其特征在于，还包括: 第一输入输出路由器，所述第一输入输出路由器与所述控制器组相连，且所述第一输入输出路由器与所述第一图形处理器组和第二图形处理器组中的一部分图形处理器相连；第二输入输出路由器，所述第二输入输出路由器与所述控制器组相连，且所述第二输入输出路由器与所述第一图形处理器组和第二图形处理器组中的另一部分图形处理器相连。3.如权利要求1或2所述的反向传播神经网络DN...

【专利技术属性】
技术研发人员：欧阳剑，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人