【技术实现步骤摘要】
一种网络参数处理方法及装置
本公开涉及人工智能
,尤其涉及一种网络参数处理方法及装置。
技术介绍
目前,神经网络算法在图像处理、语音识别等多个
中具有广泛的应用。随着各个
所要解决问题的复杂化以及对神经网络性能要求的提高,神经网络的规模也越来越大。而神经网络的规模越大,对应的网络层数和网络参数也越多。这些网络参数的存储和传输也逐渐成为一个不能忽视的问题,尤其例如在边缘计算中,神经网络设置于终端中,因此,需要将网络参数存储于终端中。继而导致在相关技术中,网络参数的存储和读取所占用的总线带宽对终端处理器(如芯片或者其他硬件/软件形式)的计算成本和功耗影响较大。神经网络的参数量化是减小神经网络规模的重要方式之一,参数量化可以利用更少的数据位宽表示网络参数,其优势在于节省存储空间,并可以更快地访存和计算。但是,相关技术中的参数量化往往可能导致计算精度的损失。因此,相关技术中亟需一种能够在不损失计算精度的情况下对神经网络进行参数量化的方式。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种网络参数处理方法及装置。根据本公开实施例的第一方面,提供一种网络参数处理方法,所述方法包括:获取神经网络不同网络层的网络参数;分别对所述不同网络层的网络参数进行量化。本公开的实施例提供的技术方案可以包括以下有益效果:本公开提供的网络参数处理方法,通过对神经网络中不同网络层的网络参数分别量化,可以根据不同网络层对应的数据分布特征,确定与所述网络层相适配的量化位宽,这样 ...
【技术保护点】
1.一种网络参数处理方法,其特征在于,所述方法包括:/n获取神经网络不同网络层的网络参数;/n分别对所述不同网络层的网络参数进行量化。/n
【技术特征摘要】
1.一种网络参数处理方法,其特征在于,所述方法包括:
获取神经网络不同网络层的网络参数;
分别对所述不同网络层的网络参数进行量化。
2.根据权利要求1所述的网络参数处理方法,其特征在于,所述分别对所述不同网络层的网络参数进行量化包括:
遍历所述网络层,在确定所述网络层中具有多个卷积核的情况下,分别对所述多个卷积核进行量化。
3.根据权利要求1所述的网络参数处理方法,其特征在于,所述分别对所述不同网络层的网络参数进行量化包括:
在确定所述网络层中具有多个卷积核的情况下,分别确定所述多个卷积核的数据分布范围;
根据所述多个卷积核的数据分布范围,将所述多个卷积核划分成至少一个分组;
分别对所述至少一个分组内的卷积核进行统一量化。
4.根据权利要求3所述的网络参数处理方法,其特征在于,所述根据所述多个卷积核的数据分布范围,将所述多个卷积核划分成至少一个分组,包括:
确定所述多个卷积核的数据分布范围之间的相似度;
将相似度大于预设阈值的卷积核划分至同一分组。
5.根据权利要求1所述的网络参数处理方法,其特征在于,所述分别对所述不同网络层的网络参数进行量化包括:
确定所述网络层中网络参数的数据分布范围;
根据所述数据分布范围确定系数指数值,以二为底数、以所述系数指数值为指数的数值被设置为量化系数;
基于所述量化系数对所述网络层中的网络参数进行量化。
6.根据权利要求5所述的网络参数处理方法,其特征在于,所述基于所述量化系数对所述网络层中的网络参数进行量化,包括:
所述网络参数的量化公式包括:
FP_Tensor=2nscale_factor(N_Tensor+FP_bias)
其中,FP_Tensor为量化前的浮点网络参数,N_Tensor为量化之后的N比特的定点网络参数,n为系数指数值,scale_factor为比例因子,FP_bias为偏置。
7.根据权利要求5所述的网络参数处理方法,其特征在于,所述确定所述网络层中网络参数的数据分布范围包括:
确定所述网络层的网络层类型;
基于所述网络层类型对所述网络层中网络参数的分布进行校准,确定所述网络层中网络参数的数据分布阈值。
8.一种网络参数处理装置,其特征在于,所述装置包括:
参数获取模块,用于获取神经网络不同网络层的网络参数;
量化模块,用于分别对所述不同网络层的网络参数进行量化。
9.根据权...
【专利技术属性】
技术研发人员:徐兵,张楠赓,
申请(专利权)人:北京嘉楠捷思信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。