【技术实现步骤摘要】
本专利技术涉及人工智能,具体涉及一种量化目标检测网络中激活值的方法及计算设备。
技术介绍
1、近年来,随着深度学习技术的迅速发展,目标检测网络已在生产生活的各个领域中广泛应用。然而,较高的预测精度往往依赖于模型庞大的计算量与参数量,这使得这些模型在移动边缘设备上的部署面临着严峻的挑战。基于以上背景,针对神经网络结构的量化技术应运而生。量化技术根据量化阶段的不同可以分为量化感知训练(qat)方法和训练后量化(ptq)方法。对目标检测模型直接采用 ptq量化往往效果不佳。主要原因是这些模型的个别层中存在异常(绝对值明显大于其他激活值)的激活值,这些异常的激活值可能是噪声值,也可能是关键值,影响着量化的效果。
2、为此,需要一种技术方案,能够解决异常激活值对目标检测网络量化效果的影响,极大提高模型量化后的准确性。
技术实现思路
1、本专利技术旨在提供量化目标检测网络中激活值的方法及计算设备,能够解决异常激活值对目标检测网络量化效果的影响,极大提高模型量化后的准确性。
2、
...【技术保护点】
1.一种量化目标检测网络中激活值的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,对目标检测网络中每一层激活值的量化敏感性进行度量,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述量化敏感性,对每一层激活值采用相应的最值收集方式,包括:
4.根据权利要求3所述的方法,其特征在于,根据所述相应的量化参数对各层激活值进行模拟量化操作,包括:
5.根据权利要求3所述的方法,其特征在于,获取目标检测网络中的第一激活值的第一信息对和权重值的第二信息对,包括:
6.根据权利要求5所述的方法,
...【技术特征摘要】
1.一种量化目标检测网络中激活值的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,对目标检测网络中每一层激活值的量化敏感性进行度量,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述量化敏感性,对每一层激活值采用相应的最值收集方式,包括:
4.根据权利要求3所述的方法,其特征在于,根据所述相应的量化参数对各层激活值进行模拟量化操作,包括:
5.根据权利要求3所述的方法,其特征在于,获取目标检测网络中的第一激活值的第一信息对和权重值的第二信息对,包括:
6.根据权利要求5所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:马志伟,熊超,牛昕宇,
申请(专利权)人:深圳鲲云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。