System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及神经网络,特别是涉及一种模型量化方法、装置、计算机设备和可读存储介质。
技术介绍
1、模型量化是加速神经网络模型推理的有效手段之一,模型量化通过对神经网络模型的权重和数据进行低比特处理,让最终生成的神经网络模型更加轻量化,从而节省神经网络模型存储空间、降低传输时延、提高计算效率,达到性能提升与优化的目标。
2、传统技术中,通过设定深度神经网络的推理精度阈值和推理时间阈值,确定硬件能够支持的多个不同的量化精度,用每一种量化精度迭代所有层并记录每次迭代的实际推理精度和实际推理时间,针对每一层筛选出实际推理精度大于推理精度阈值且实际推理时间小于推理时间阈值的所有量化精度,将筛选出的量化精度的组合中的一个确定为最终的混合精度量化策略。
3、然而,传统技术中,得到的量化模型可能存在模型精度较低的问题。
技术实现思路
1、本申请实施例提供了一种模型量化方法、装置、计算机设备和可读存储介质,可以提高得到的量化模型的模型精度。
2、第一方面,本申请实施例提供了一种模型量化方法,包括:
3、基于初始神经网络模型的量化模型,获取所述初始神经网络模型各算子的性能参数和各所述算子的精度参数;所述量化模型为采用固定量化值对所述初始神经网络模型进行量化得到的;
4、根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的量化值;
5、根据各所述算子的量化值,对各所述算子进行量化,得到所述初始神经网络模型的混合量化模型。<
...【技术保护点】
1.一种模型量化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的量化值,包括:
3.根据权利要求2所述的方法,其特征在于,所述确定策略包括:
4.根据权利要求2或3所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的权重,包括:
5.根据权利要求2或3所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的权重,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于初始神经网络模型的量化模型,获取所述初始神经网络模型各算子的性能参数和各所述算子的精度参数,包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种模型量化装置,其特征在于,包括:
9.一种计算机设备,包括存储器及处理器,所述存储器中储存有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种模型量化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的量化值,包括:
3.根据权利要求2所述的方法,其特征在于,所述确定策略包括:
4.根据权利要求2或3所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的权重,包括:
5.根据权利要求2或3所述的方法,其特征在于,所述根据各所述算子的性能参数和各所述算子的精度参数,确定各所述算子的权重,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于初始神经网络模型的量化模型,获取所述初始神经网络模型各算子...
【专利技术属性】
技术研发人员:樊欢欢,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。