【技术实现步骤摘要】
模型量化方法、装置、计算设备、存储介质及产品
[0001]本申请涉及人工智能
,特别涉及一种模型量化方法、装置、计算设备、存储介质及产品。
技术介绍
[0002]随着深度学习的发展,模型变得越来越复杂,随之而来的模型参数也越来越多,对硬件设备要求也越来越高。在模型部署阶段,考虑到模型的性能,通常会对模型进行训练后量化。所谓训练后量化是指将已经训练好的模型的模型参数的存储格式由高比特转换为低比特,例如,由float32转换为uint8、int8、int16、float16等。
[0003]以将模型参数的存储格式由float32转换为float16为例,相关技术直接将模型中每个模型参数的存储格式由float32转换为float16。虽然float16表示的模型能够满足绝大多数场景下模型部署的要求,但是当任一模型参数采用float32表示的数值超过float16的非负表示范围,或者模型在推理过程中乘累加中间过程的动态范围比较大时,模型参数和中间结果的数值将溢出,需要对该数值进行截断,导致量化后的模型精度较低。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种模型量化方法,其特征在于,所述方法包括:获取已训练的模型,所述已训练的模型每层上的模型参数的参数值采用第一存储格式进行存储;对第二存储格式的原始非负表示范围进行压缩处理,得到第二存储格式的非负表示范围,所述第一存储格式占用的比特数比所述第二存储格式占用的比特数高;根据每层上每种模型参数在所述第一存储格式下的参数非负范围及所述第二存储格式的非负表示范围,确定每层上每种模型参数对应的第一缩放因子;根据每层上每种模型参数对应的第一缩放因子,对每层上每个模型参数的参数值进行缩放处理,得到每层上每个模型参数的缩放参数值,所述模型参数的缩放参数值在所述第二存储格式的表示范围内;将每层上每个模型参数的缩放参数值由所述第一存储格式转换为所述第二存储格式,得到每层上每个模型参数的量化参数值;将由每层上每个模型参数的量化参数值构成的模型,确定为量化后的模型。2.根据权利要求1所述的方法,其特征在于,所述对第二存储格式的原始非负表示范围进行压缩处理,得到第二存储格式的非负表示范围,包括:获取下界缩放因子和上界缩放因子,所述下界缩放因子大于1,所述上界缩放因子大于0小于1;将所述原始非负表示范围的下界数值乘以所述下界缩放因子,得到第一数值;将所述原始非负表示范围的上界数值乘以所述上界缩放因子,得到第二数值;将以所述第一数值为下界、以所述第二数值为上界的非负范围,作为所述非负表示范围。3.根据权利要求1所述的方法,其特征在于,所述根据每层上每种模型参数在所述第一存储格式下的参数非负范围及所述第二存储格式的非负表示范围,确定每层上每种模型参数对应的第一缩放因子,包括:将每层上每种模型参数在所述第一存储格式下的参数非负范围的上界分别与所述非负表示范围的上界和下界进行比较,并将每层上每种模型参数在所述第一存储格式下的参数非负范围的下界分别与所述非负表示范围的上界和下界进行比较;根据比较结果,确定每层上每种模型参数对应的第一缩放因子。4.根据权利要求3所述的方法,其特征在于,所述根据比较结果,确定每层上每种模型参数对应的第一缩放因子,包括:对于任一层上任一种模型参数,当所述模型参数的参数非负范围的下界和上界均小于所述非负表示范围的下界,将所述参数非负范围的下界与所述非负表示范围的下界的比值,确定为所述模型参数对应的第一缩放因子;当所述参数非负范围的下界小于所述非负表示范围的下界,所述参数非负范围的上界大于等于所述非负表示范围的下界且小于等于所述非负表示范围的上界,确定所述模型参数对应的第一缩放因子为1;当所述参数非负范围的下界小于所述非负表示范围的下界,所述参数非负范围的上界大于所述非负表示范围的上界,将所述参数非负范围的上界与所述非负表示范围的上界的比值,确定为所述模型参数对应的第一缩放因子;
当所述参数非负范围的下界大于等于所述非负表示范围的下界且小于等于所述非负表示范围的上界,所述参数非负范围的上界大于等于所述非负表示范围的下界且小于等于所述非负表示范围的上界,确定所述模型参数对应的第一缩放因子为1;当所述参数非负范围的下界大于等于所述非负表示范围的下界且小于等于所述非负表示范围的上界,所述参数非负范围的上界大于所述非负表示范围的上界,将所述参数非负范围的上界与所述非负表示范围的上界的比值,确定为所述模型参数对应的第一缩放因子;当所述参数非负范围的下界大于所述非负表示范围的上界,所述参数非负范围的上界大于所述非负表示范围的上界,将所述参数非负范围的上界与所述非负表示范围的上界的比值,确定为所述模型参数对应的第一缩放因子。5.根据权利要求1所述的方...
【专利技术属性】
技术研发人员:陈峰,张文蒙,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。