神经网络模型的优化方法及装置、电子设备和存储介质制造方法及图纸

技术编号：20045974 阅读：30 留言：0更新日期：2019-01-09 04:30

本公开涉及一种神经网络模型的优化方法及装置、电子设备和存储介质。该方法包括：从学生模型的输出层之前的全连接层中选取部分神经元；将输入数据分别输入学生模型和老师模型，基于从学生模型的输出层之前的全连接层中选取的部分神经元，得到学生模型的输出；基于老师模型的输出层之前的全连接层中的全部神经元，得到老师模型的输出；基于学生模型的输出和老师模型的输出，优化学生模型。本公开实施例能够在不增加训练数据总量和无需重新训练的前提下，稳定提高神经网络模型的准确率，且能够增强神经网络模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的优化方法及装置、电子设备和存储介质
本公开涉及深度学习
，尤其涉及一种神经网络模型的优化方法及装置、电子设备和存储介质。
技术介绍
目前，神经网络模型被应用于计算机视觉和自然语言处理等各个方面(例如行人检索和人脸识别)，并取得了较好的效果。在神经网络模型训练完成之后，测试的准确率往往限制了神经网络模型的准确率的上限。相关技术中，通常通过增加训练数据的总量、改变神经网络模型的结构或者对模型进行细微调整和重训练，来提高神经网络模型的准确率。这些方法都对数据量提出了非常高的要求。增加训练数据的总量和细微调整不一定能提高神经网络模型的准确率，可能的原因是数据质量参差不齐导致神经网络模型的训练难度增加。改变神经网络模型的结构通常没有一个明确的标准，因此无法保证训练后神经网络模型的准确率。
技术实现思路
本公开提出了一种神经网络模型的优化技术方案。根据本公开的一方面，提供了一种神经网络模型的优化方法，包括：从学生模型的输出层之前的全连接层中选取部分神经元；将输入数据分别输入所述学生模型和老师模型，基于从所述学生模型的输出层之前的全连接层中选取的部分神经元，得到所述学生模型的输出；基于所述老师模型的输出层之前的全连接层中的全部神经元，得到所述老师模型的输出；基于所述学生模型的输出和所述老师模型的输出，优化所述学生模型。在一种可能的实现方式中，从学生模型的输出层之前的全连接层中选取部分神经元，包括：从学生模型的输出层之前的最后一个全连接层中选取部分神经元。在一种可能的实现方式中，从学生模型的输出层之前的全连接层中选取部分神经元，包括：针对第一全连接层中的每...

【技术保护点】
1.一种神经网络模型的优化方法，其特征在于，包括：从学生模型的输出层之前的全连接层中选取部分神经元；将输入数据分别输入所述学生模型和老师模型，基于从所述学生模型的输出层之前的全连接层中选取的部分神经元，得到所述学生模型的输出；基于所述老师模型的输出层之前的全连接层中的全部神经元，得到所述老师模型的输出；基于所述学生模型的输出和所述老师模型的输出，优化所述学生模型。

【技术特征摘要】
1.一种神经网络模型的优化方法，其特征在于，包括：从学生模型的输出层之前的全连接层中选取部分神经元；将输入数据分别输入所述学生模型和老师模型，基于从所述学生模型的输出层之前的全连接层中选取的部分神经元，得到所述学生模型的输出；基于所述老师模型的输出层之前的全连接层中的全部神经元，得到所述老师模型的输出；基于所述学生模型的输出和所述老师模型的输出，优化所述学生模型。2.根据权利要求1所述的方法，其特征在于，从学生模型的输出层之前的全连接层中选取部分神经元，包括：从学生模型的输出层之前的最后一个全连接层中选取部分神经元。3.根据权利要求1或2所述的方法，其特征在于，从学生模型的输出层之前的全连接层中选取部分神经元，包括：针对第一全连接层中的每个神经元，分别在第一区间中生成一个随机数，其中，所述第一全连接层表示所述学生模型的输出层之前进行神经元选取的全连接层；若所述第一全连接层中的第一神经元对应的随机数属于第二区间，则从所述第一全连接层中选取所述第一神经元，其中，所述第二区间为所述第一区间的子集，且所述第二区间不等于所述第一区间。4.根据权利要求1至3中任意一项所述的方法，其特征在于，所述输出为分对数层输出的分对数。5.一种神经网络模型的优化装置，其特征在于，包括：选取模块，用于从学生模型的输出层之前的全连接层中选取部分神经元；第一确定模块，用于将输入数据分别输入所...

【专利技术属性】
技术研发人员：罗棕太，张学森，伊帅，闫俊杰，王晓刚，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人