深度神经网络学习方法、处理器和深度神经网络学习系统技术方案

技术编号：12027851 阅读：63 留言：0更新日期：2015-09-10 12:49

本发明专利技术的实施方式提供了一种深度神经网络学习方法。该方法包括：多个处理器并行地对分配至自身的数据从首层到末层逐层进行正向处理、并在正向处理结束时获得误差信息；多个处理器对误差信息从末层到首层逐层进行反向处理，其中，多个处理器中的每个处理器在其深度神经网络模型的当前层的反向处理产生参数修正量后，随即向其他处理器传递参数修正量。通过本发明专利技术上述实施方式的方法，减少了参数修正量传递所占用的时间，有效提高了深度神经网络模型训练的效率，尤其对于训练数据比较多、深度神经网络模型层数比较多的情况，这种方式可以大幅减少用时，有效节省模型训练的时间。此外，本发明专利技术的实施方式提供了一种处理器和深度神经网络学习系统。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施方式涉及神经网络领域，更具体地，本专利技术的实施方式涉及一种深度神经网络学习方法、处理器和深度神经网络学习系统。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。深度神经网络学习作为机器学习研宄中的一个新的领域，它通过模仿人脑的机制来解释数据，是一种通过建立和模拟人脑进行分析学习的智能模型。如图1所示为深度神经网络模型示意图，一般训练数据会被依次送入该模型进行训练。然而，当待训练数据较多时，如果采用单一的处理器进行训练则需要很长的训练时间，因此一般会将待训练数据分成两份或两份以上，采用两个或者两个以上处理器并行训练的方式以提高训练的效率。在具体实现的过程中，在反向处理时，为了实现模型参数的更新，每个处理器都需要获取一份完整的训练数据所对应的参数修正量(即，不仅需要自身得到的参数修正量，还需要获取其他并行处理的处理器得到的参数修正量)，才能实现对模型参数的更新。为此，现有的处理方式是在反向处理完成后，增加一个参数修正量的传输过程，从而使得每个处理器都可以获得一份完整的训练数据所对应的参数修正量以实现模型参数的更新。然而，因为这个参数修正量的传输过程的加入使得模型训练的时间被延长，训练效率也相应降低，这显然与最初并行处理以提高训练效率的目的是相悖的。
技术实现思路
由于在并行进行深度神经网络学习的过程中，需要增加参数修正量的传递过程，占用了一定的时间，从而无法有效提高深度神经网络学习的效率，在现有技术中，也无法很好地缩短参数修正量传递所占用的时间，这事非常令...

【技术保护点】
一种深度神经网络学习方法，包括：多个处理器并行地对分配至自身的数据，在深度神经网络模型的多个层上从首层到末层逐层进行正向处理、并在正向处理结束时获得误差信息；所述多个处理器对所述误差信息从所述末层到所述首层逐层进行反向处理，其中，所述多个处理器中的每个处理器在其深度神经网络模型的当前层的反向处理产生参数修正量后，随即向其他处理器传递所述参数修正量。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈海波，吴伟，李晓燕，
申请(专利权)人：杭州朗和科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人