【技术实现步骤摘要】
一种神经网络压缩方法、装置、计算机设备及存储介质
本公开涉及神经网络
,具体而言,涉及一种神经网络压缩方法、装置、计算机设备及存储介质。
技术介绍
深度学习是一种计算密集型的算法,随着处理任务的多样性及复杂度越来越高,对算法准确性及实时性要求不断增高,因此神经网络的规模越来越大,从而需要更多的计算及存储资源的开销,从而给神经网络的部署带来了压力。相关技术中,在对神经网络进行压缩时,一般是在训练完成后,再对神经网络的权重参数进行压缩处理,这种方法虽然减少了神经网络的计算量,节省了一定的存储空间,但是压缩程度并不高,因此需要一种更优化的压缩方法。
技术实现思路
本公开实施例至少提供一种神经网络压缩方法、装置、计算机设备及存储介质。第一方面,本公开实施例提供了一种神经网络压缩方法,包括:从待压缩神经网络的多个中间层中,确定目标中间层;基于所述待压缩神经网络和训练数据,确定所述目标中间层的目标输入数据;基于所述目标中间层对所述目标输入数据进行处理后,基于处理结果的压缩 ...
【技术保护点】
1.一种神经网络压缩方法,其特征在于,包括:/n从待压缩神经网络的多个中间层中,确定目标中间层;/n基于所述待压缩神经网络和训练数据,确定所述目标中间层的目标输入数据;/n基于所述目标中间层对所述目标输入数据进行处理后,基于处理结果的压缩处理结果,确定所述待压缩神经网络的第一输出数据;/n基于所述第一输出数据对所述待压缩神经网络的网络参数进行调整,并返回执行确定目标中间层的步骤,直至所述待压缩神经网络的所述多个中间层的处理结果都被压缩处理。/n
【技术特征摘要】
1.一种神经网络压缩方法,其特征在于,包括:
从待压缩神经网络的多个中间层中,确定目标中间层;
基于所述待压缩神经网络和训练数据,确定所述目标中间层的目标输入数据;
基于所述目标中间层对所述目标输入数据进行处理后,基于处理结果的压缩处理结果,确定所述待压缩神经网络的第一输出数据;
基于所述第一输出数据对所述待压缩神经网络的网络参数进行调整,并返回执行确定目标中间层的步骤,直至所述待压缩神经网络的所述多个中间层的处理结果都被压缩处理。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标中间层对所述目标输入数据进行处理后,基于处理结果的压缩处理结果,确定所述待压缩神经网络的第一输出数据,包括:
基于所述目标中间层对所述目标输入数据进行处理后,对处理结果进行压缩处理,得到第一中间处理数据;
基于所述第一中间处理数据,确定所述待压缩神经网络的第一输出数据。
3.根据权利要求1所述的方法,其特征在于,所述从待压缩神经网络的多个中间层中,确定目标中间层,包括:
确定所述待压缩神经网络的多个中间层中未进行压缩处理的候选中间层;以及,基于预设的训练完成次数和所述待压缩神经网络的中间层的第一个数,确定所述目标中间层所包括的中间层的第二个数;
按照所述第二个数从所述候选中间层中确定待处理的目标中间层。
4.根据权利要求3所述的方法,其特征在于,所述按照所述第二个数从所述候选中间层中确定待处理的目标中间层,包括:
按照所述待压缩神经网络的多个中间层对应的压缩顺序和所述第二个数,从所述候选中间层中确定所述待处理的目标中间层。
5.根据权利要求2所述的方法,其特征在于,所述基于所述第一中间处理数据,确定所述待压缩神经网络的第一输出数据,包括:
将所述第一中间处理数据输入至所述目标中间层之后的其他处理层,确定所述待压缩神经网络的输出数据,所述其他处理层包括所述目标中间层之后的其他中间层以及输出层。
6.根据权利要求2所述的方法,其特征在于,所述目标中间层包括多个中间层;
所述基于所述目标中间层对所述目标输入数据进行处理后,对处理结果进行压缩处理,得到第一中间处理数据,包括:
基于所述目标中间层的第N个中间层对输入数据进行处理后,对处理结果进行压缩处理,得到第N个中间层对应的第二中间处理数据;
将所述第N个中间层对应的第二中间处理数据作为第N+1层中间层的输入数据,并基于第N+1个中间层对输入数据进行处理后,对处理结果进行压缩处理,得到第N+1个中间层对应的第二中间处理数据;
其中,所述目标中间层的最后一个中间层对应的第二中间处理数据为所述第一中间处...
【专利技术属性】
技术研发人员:沈煜,冯志芳,胡英俊,
申请(专利权)人:上海阵量智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。