基于神经网络权重数据分布特点的量化方法技术

技术编号：27657709 阅读：23 留言：0更新日期：2021-03-12 14:21

一种基于神经网络权重数据分布特点的量化方法，通过将神经网络中的包含参数的任意一层的权重的分布情况进行统计后，根据统计结果设置码值分配数量，并根据该数量将不同范围下的参数分别分割为对应的子范围，每个子范围内的参数以代表值作为其量化值，最后将每个代表值编码后制表，计算时通过读入码值查表得到对应参与计算的量化值。本发明专利技术能够充分利用比特位数，使每个数据都能根据自身参与计算的频率来得到充分的计算，在保证网络性能的同时大幅度降低存储量实现减少参数存储量的目的，且无需训练。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经网络权重数据分布特点的量化方法
本专利技术涉及的是一种神经网络应用领域的技术，具体是一种基于神经网络权重数据分布特点的量化方法，可用于各种冗余性高的神经网络与便携设备相组合的场景如智能手机等。
技术介绍
现有的神经网络通过加深网络、扩大网络尺寸以追求更高的边缘精度，但同时网络参数变得越来越大，计算量也快速增大，这样网络的冗余性也非常大，提高精度后随之而来付出的代价就是进行一次网络的前向传播计算量巨大导致计算时间过长。现有的压缩技术之一为对网络参数进行均匀量化，其优点在于计算复杂度不高，容易进行处理操作，但在权值分布范围较大时候它对于小值的量化误差较大且将严重影响检测精度；另外还有现有技术通过2的幂次进行量化，但这种方案同样对于一些值的误差较大，影响性能。此外，虽然现有技术通过利用GPU的并行计算能力，使计算时长在一定程度上缩短，但GPU价格昂贵，功耗较大的同时便携性差也成为其无法忽视的缺点。随着智能便携设备的流行，急需一种能压缩网络在推理过程减少计算量和存储量而同时又能使检测达到一个令人满意的精度的方法。
技术实现思路
本专利技术针对现有技术权重分布范围广，最大最小值差距大导致小值量化后精度不高所产生的问题，提出一种基于神经网络权重数据分布特点的量化方法，能够充分利用比特位数，使每个数据都能根据自身参与计算的频率来得到充分的计算，在保证网络性能的同时大幅度降低存储量实现减少参数存储量的目的，且无需训练。本专利技术是通过以下技术方案实现的：本专利技术涉及一种基于神经网...

【技术保护点】
1.一种基于神经网络权重数据分布特点的量化方法，其特征在于，通过将神经网络中的包含参数的任意一层的权重的分布情况进行统计后，根据统计结果设置码值分配数量，并根据该数量将不同范围下的参数分别分割为对应的子范围，每个子范围内的参数以代表值作为其量化值，最后将每个代表值编码后制表，计算时通过读入码值查表得到对应参与计算的量化值。/n

【技术特征摘要】
1.一种基于神经网络权重数据分布特点的量化方法，其特征在于，通过将神经网络中的包含参数的任意一层的权重的分布情况进行统计后，根据统计结果设置码值分配数量，并根据该数量将不同范围下的参数分别分割为对应的子范围，每个子范围内的参数以代表值作为其量化值，最后将每个代表值编码后制表，计算时通过读入码值查表得到对应参与计算的量化值。

2.根据权利要求1所述的方法，其特征是，所述的统计结果，将小于2-11手动调整为0而不影响结果。

3.根据权利要求1所述的方法，其特征是，所述的码值分配数量是指：正负分配数量满足其中：设码值总数为M，由于权重正负值分布对称，则正负码值总数各为存储码值的位数设为N，则M＝2N，统计的范围[2-(n+1),2-n]范围内的权重数量为i[n]，权重总数量为I。

4.根据权利要求1所述的方法，其特征是，所述的码值分配数量，当计算得到大值的权重分配数量小于1时，则手动调整分配数量为2，大值的码值分配更多，相对应的减少小...

【专利技术属性】
技术研发人员：徐顺锋，曹姗，徐树公，张舜卿，
申请(专利权)人：上海大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人