神经网络的训练方法及装置、计算设备制造方法及图纸

技术编号：17796977 阅读：56 留言：0更新日期：2018-04-25 20:29

本发明专利技术公开了一种神经网络的训练方法及装置、计算设备，其方法包括：将输入数据输入至经训练得到的第一神经网络中，获得第一神经网络的至少一层第一中间层的输出数据；将输入数据输入至待训练的第二神经网络中，获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据，至少一层第二中间层与至少一层第一中间层具有对应关系；利用至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失，以及最终输出数据与预标注的输出数据之间的损失，对第二神经网络进行训练。本发明专利技术在保持第二神经网络在其计算量不变的情况下，可以大大提升第二神经网络的性能。

Training methods, devices and computing devices of neural networks

The invention discloses a training method and a device and a computing device for a neural network. The method includes input data into the trained first neural network to obtain the output data of at least one layer of first middle layer of the first neural network, and input the input data into the second neural network to be trained and obtain the input data. The output data and the final output data of at least one layer of the second middle layer of the second neural network are corresponding to at least one layer of the intermediate layer and at least one layer of first intermediate layer; the loss between the output data of the at least one layer of the second middle layer and the outgoing data of at least one layer of the first intermediate layer, and the final transmission. The loss of data and pre annotated output data is trained on the second neural network. The second neural network can greatly enhance the performance of the second neural network when its computation amount is constant.

全部详细技术资料下载

【技术实现步骤摘要】
神经网络的训练方法及装置、计算设备
本专利技术涉及深度学习领域，具体涉及一种神经网络的训练方法及装置、计算设备。
技术介绍
深度学习源于对人工神经网络的研究，通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习是机器学习中一种基于对数据进行表征学习的方法。基于建立、模拟人脑进行分析学习的神经网络，模仿人脑的机制来解释数据。深度学习可以用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习可以应用于如人脸检测、人脸识别、场景分析等多种应用中。随着深度学习的发展，深度学习的应用也越来越广泛。应用深度学习的网络的速度越快，其准确率越高，其性能越好。如使用深层网络(云端服务器等)进行深度学习时，其可以提供给深度学习较佳的环境支持，拟合能力较佳。但当使用浅层网络(如移动设备)进行深度学习时，受其本身环境的限制，计算能力有限、拟合能力较差，通常无法得到较好的性能。因此，需要一种神经网络的训练方法，以便提升使用浅层网络时深度学习的性能。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的神经网络的训练方法及装置、计算设备。根据本专利技术的一个方面，提供了一种神经网络的训练方法，其包括：将输入数据输入至经训练得到的第一神经网络中，获得第一神经网络的至少一层第一中间层的输出数据；将输入数据输入至待训练的第二神经网络中，获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据，至少一层第二中间层与至少一层第一中间层具有对应关系；利用至少一层第二中间层的输出数据与至少...
神经网络的训练方法及装置、计算设备

【技术保护点】
一种神经网络的训练方法，其包括：将所述输入数据输入至经训练得到的第一神经网络中，获得第一神经网络的至少一层第一中间层的输出数据；将所述输入数据输入至待训练的第二神经网络中，获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据，所述至少一层第二中间层与所述至少一层第一中间层具有对应关系；利用所述至少一层第二中间层的输出数据与所述至少一层第一中间层的输出数据之间的损失，以及所述最终输出数据与预标注的输出数据之间的损失，对第二神经网络进行训练。

【技术特征摘要】
1.一种神经网络的训练方法，其包括：将所述输入数据输入至经训练得到的第一神经网络中，获得第一神经网络的至少一层第一中间层的输出数据；将所述输入数据输入至待训练的第二神经网络中，获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据，所述至少一层第二中间层与所述至少一层第一中间层具有对应关系；利用所述至少一层第二中间层的输出数据与所述至少一层第一中间层的输出数据之间的损失，以及所述最终输出数据与预标注的输出数据之间的损失，对第二神经网络进行训练。2.根据权利要求1所述的方法，其中，所述第一神经网络的层数多于第二神经网络。3.根据权利要求1或2所述的方法，其中，所述至少一层第一中间层包含第一神经网络的瓶颈层；所述至少一层第二中间层包含第二神经网络的瓶颈层。4.根据权利要求1-3中任一项所述的方法，其中，所述利用所述至少一层第二中间层的输出数据与所述至少一层第一中间层的输出数据之间的损失，以及所述最终输出数据与预标注的输出数据之间的损失，对第二神经网络进行训练进一步包括：根据所述至少一层第二中间层的输出数据与所述至少一层第一中间层的输出数据之间的损失更新所述第二神经网络的权重参数，根据所述最终输出数据与预标注的输出数据之间的损失更新所述第二神经网络的权重参数，对第二神经网络进行训练。5.根据权利要求1-4中任一项所述的方法，其中，在所述将所述输入数据输入至待训练的第二神经网络中，获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据之前，所述方法还包括：将所述输入数据进行下采样处理，将处理后的数据作为第二神经网络的输入数据。6.根据权...

【专利技术属性】
技术研发人员：董健，韩玉刚，颜水成，
申请(专利权)人：北京奇虎科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人