一种自适应比特网络量化方法、系统及图像处理方法技术方案

技术编号:28791641 阅读:22 留言:0更新日期:2021-06-09 11:29
本发明专利技术公开了一种自适应比特网络量化方法、系统及图像处理方法,包括:获取全精度网络模型;获取所应用的分类任务下的测试数据集,并在测试数据集测试全精度网络模型的分类结果;使用量化函数对全精度网络模型的参数进行量化,并计算不同参数在待选比特位宽条件下量化前后的标准误差;估计不同参数的量化对网络性能的影响,获得当前参数的重要性;求解目标压缩率下具有最高准确度的比特位宽分配策略;将网络按照比特位宽分配策略进行量化,得到最终网络,用于图像分类和目标检测。本发明专利技术可以快速给出不同压缩率要求下网络参数的比特位宽和量化模型,同时保证较高的分类准确度,保证了量化方法的通用性。证了量化方法的通用性。证了量化方法的通用性。

【技术实现步骤摘要】
一种自适应比特网络量化方法、系统及图像处理方法


[0001]本专利技术涉及图像处理
,特别涉及一种自适应比特网络量化方法、系统及图像处理方法。

技术介绍

[0002]图像是人类获取和交换信息的主要媒介,图像处理技术的发展深刻影响着人们生产生活。尤其到了21世纪,随着人类活动范围的扩大和成像技术的进步,图像数据的数量和质量都取得极大的增长,于是,图像数据的智能化处理受到越来越多的重视。目前主要的图像处理任务包括分类,即对图片包含的主要目标进行判断;以及目标识别,即定位图片中特定类别物体所在的位置。传统的图像分类和目标识别方法,需要手工设计特征提取器从输入图像中提取特征,并基于特征进行分类或者回归,来判断图片包含的主要目标或者图片中特定类别物体的位置,不能充分根据目标图像联合优化特征提取和分类/回归等步骤。
[0003]近年来,计算能力的提升极大推动人工智能的发展,以深度神经网络为代表的技术广泛应用在图像处理领域,明显提升传统方法的性能。然而,深度神经网络对于计算量的巨大需求也阻碍这项技术在资源受限的环境下应用。随着移动媒体业务、智能监控和自动驾驶等领域图像处理的需求激增,如何在例如手机和可穿戴设备、图像采集设备以及车载设备等部署和应用深度神经网络成为亟待解决的问题。参数量化通过使用定点数运算代替浮点数运算,节省带宽和计算资源。同时,许多研究工作指出低精度的网络模型也能有不错的性能表现,这为模型量化提供了可能。
[0004]模型量化通常会带来信息损失,典型的,在图像分类任务中,低比特量化后的网络的分类准确率会出现明显下降。混合精度量化可在一定程度解决这个问题,混合精度量化为不同参数选择合适的比特位宽,对分类结果影响小而参数量大的网络权重被分配低比特,这样同时保证了压缩率和准确度。自适应比特位宽分配则根据设定的准则计算参数的重要性,从而自动地给出相应参数的比特位宽。现有自适应比特位宽分配方法包括基于网络结构搜索和基于性能估计两种,基于搜索的方法需要耗费大量时间和资源训练一个超网络,而现有基于性能估计的方法只能应用在线性量化函数而且性能欠佳。

技术实现思路

[0005]本专利技术针对上述现有技术中存在的问题,提出一种自适应比特网络量化方法、系统及图像处理方法,主要用于图像分类和目标检测等领域。
[0006]为解决上述技术问题,本专利技术是通过如下技术方案实现的:
[0007]本专利技术提供一种自适应比特网络量化方法,其包括:
[0008]S11:获取全精度网络模型;
[0009]S12:获取所应用的分类任务下的测试数据集,并在所述测试数据集测试所述S11所获取的全精度网络模型的分类结果;
[0010]S13:使用量化函数对所述全精度网络模型的参数进行量化,并计算不同参数在待
选比特位宽条件下量化前后的标准误差;
[0011]S14:估计不同参数的量化对网络性能的影响,对于任意一个参数,加入固定强度的标准高斯噪声,并保持其他参数不变,利用所述S12所获取的测试数据集进行测试得到分类结果,并与所述S12中的全精度网络模型的分类结果进行对比获得当前参数的重要性;
[0012]S15:计算各种比特位宽分配策略的分配准确度,求解目标压缩率下具有最高准确度的比特位宽分配策略;
[0013]S16:将网络按照所述S15所选择的比特位宽分配策略进行量化,得到最终网络。
[0014]较佳地,所述S14中当前参数的重要性的计算方式为:给定第i个网络参数W
i
、第j张图片,参数重要性T
ij
为W
i
加入标准噪声后的网络F
qi
与全精度网络F输出的分类结果的标准误差:
[0015]较佳地,所述S15中的计算各种比特位宽分配策略的分配准确度进一步包括:通过分析量化噪声以及网络参数重要性估计网络的性能指标;
[0016]所述量化噪声具体为:当前网络层参数进行量化后与全精度网络模型的参数之间的差值ε,所述量化噪声的强度为所述S13中的标准误差;
[0017]所述性能指标具体为:对于所述测试数据集中的每一张图片,量化后网络预测的类别与所述全精度网络相同的概率p,所述概率越大,表示量化网络越准确。
[0018]较佳地,所述S15进一步包括:
[0019]S151:将全部参数产生的量化噪声按照重要性的权重叠加起来,得到等效误差,对于第j张测试图片,等效误差为:
[0020][0021]S152:根据等效误差∈
j
、全精度网络输出值中最大概率值与次大概率值的概率差值δ
j
,通过概率误差函数G(∈
j

j
)来计算第j张测试图片的性能指标:p
j
=G(∈
j

j
)。
[0022]较佳地,所述S15中的计算各种比特位宽分配策略的分配准确度进一步包括:通过动态规划算法来分析量化噪声以及网络参数重要性估计网络的性能指标;
[0023]所述动态规划算法是依照网络参数序数进行的,其状态空间为不同压缩率下当前参数的最优比特位宽。
[0024]本专利技术还提供一种自适应比特网络量化系统,其包括:初始化单元、测试数据集获取单元、预处理单元、当前参数重要性获得单元、比特位宽计算单元以及网络量化单元;其中,
[0025]所述初始化单元用于获取全精度网络模型;
[0026]所述测试数据集获取单元用于获取所应用的分类任务下的测试数据集,并在所述测试数据集测试所述初始化单元所获取的全精度网络模型的分类结果;
[0027]所述预处理单元用于使用量化函数对所述全精度网络模型的参数进行量化,并计算不同参数在待选比特位宽条件下量化前后的标准误差;
[0028]所述当前参数重要性获得单元用于估计不同参数的量化对网络性能的影响,对于任意一个参数,加入固定强度的标准高斯噪声,并保持其他参数不变,利用所述测试数据集获取单元所获取的测试数据集进行测试得到分类结果,并与所述测试数据集获取单元中的
全精度网络模型的分类结果进行对比获得当前参数的重要性;
[0029]所述比特位宽计算单元用于计算各种比特位宽分配策略的分配准确度,求解目标压缩率下具有最高准确度的比特位宽分配策略;
[0030]所述网络量化单元用于将网络按照所述比特位宽计算单元所选择的比特位宽分配策略进行量化,得到最终网络。
[0031]较佳地,所述当前参数重要性获得单元中当前参数的重要性的计算方式为:给定第i个网络参数W
i
、第j张图片,参数重要性T
ij
为W
i
加入标准噪声后的网络F
qi
与全精度网络F输出的分类结果的标准误差:
[0032]较佳地,所述比特位宽计算单元进一步用于通过分析量化噪声以及网络参数重要性估计网络的性能指标;
[0033]所述量化噪声具体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应比特网络量化方法,其特征在于,包括:S11:获取全精度网络模型;S12:获取所应用的分类任务下的测试数据集,并在所述测试数据集测试所述S11所获取的全精度网络模型的分类结果;S13:使用量化函数对所述全精度网络模型的参数进行量化,并计算不同参数在待选比特位宽条件下量化前后的标准误差;S14:估计不同参数的量化对网络性能的影响,对于任意一个参数,加入固定强度的标准高斯噪声,并保持其他参数不变,利用所述S12所获取的测试数据集进行测试得到分类结果,并与所述S12中的全精度网络模型的分类结果进行对比获得当前参数的重要性;S15:计算各种比特位宽分配策略的分配准确度,求解目标压缩率下具有最高准确度的比特位宽分配策略;S16:将网络按照所述S15所选择的比特位宽分配策略进行量化,得到最终网络。2.根据权利要求1所述的自适应比特网络量化方法,其特征在于,所述S14中当前参数的重要性的计算方式为:给定第i个网络参数W
i
、第j张图片,参数重要性T
ij
为W
i
加入标准噪声后的网络F
qi
与全精度网络F输出的分类结果的标准误差:误差:3.根据权利要求1所述的自适应比特网络量化方法,其特征在于,所述S15中的计算各种比特位宽分配策略的分配准确度进一步包括:通过分析量化噪声以及网络参数重要性估计网络的性能指标;所述量化噪声具体为:当前网络层参数进行量化后与全精度网络模型的参数之间的差值ε,所述量化噪声的强度为所述S13中的标准误差;所述性能指标具体为:对于所述测试数据集中的每一张图片,量化后网络预测的类别与所述全精度网络相同的概率p,所述概率越大,表示量化网络越准确。4.根据权利要求3所述的自适应比特网络量化方法,其特征在于,所述S15进一步包括:S151:将全部参数产生的量化噪声按照重要性的权重叠加起来,得到等效误差,对于第j张测试图片,等效误差为:S152:根据等效误差∈
j
、全精度网络输出值中最大概率值与次大概率值的概率差值δ
j
,通过概率误差函数G(∈
j

j
)来计算第j张测试图片的性能指标:p
j
=G(∈
j

j
)。5.根据权利要求3所述的自适应比特网络量化方法,其特征在于,所述S15中的计算各种比特位宽分配策略的分配准确度进一步包括:通过动态规划算法来分析量化噪声以及网络参数重要性估计网络的性能指标;所述动态规划算法是依照网络参数序数进行的,其状态空间为不同压缩率下当前参数的最优比特位宽。6.一种自适应比特网络量化系统,其特征在于,包括:初始化单元、测试数据集获取单元、预处理单元、当前参数重要性获得单元、比特位宽计算单元以及网络量化单元;其中,所述初始化单元用于获取全精度网络模型;所述测试数据集获取单元用于获取所应用的分类任务下的测试数据集,并在所述测试
数据集测试所述初始化单元所获取的全精度网络模型的分类结果;所述预处理单元用于使用量化函数对所述全精度网络模型的参数进行量化,并计算不同参数在待选比特位宽条件下量化前后的标准误差;所述当前参数重要性获得单元用于估计不同参数的量化对网络性能的影响,对于任意一个参数,加入固定强度的标准高斯噪声,并保...

【专利技术属性】
技术研发人员:戴文睿费文李成林邹君妮熊红凯
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1