模型量化方法、装置及计算机可读存储介质制造方法及图纸

技术编号:40764814 阅读:13 留言:0更新日期:2024-03-25 20:15
本申请实施例提供一种模型量化方法、装置及计算机可读存储介质,涉及人工智能技术领域。在上述方法中,通过将第一量化参数在不同分支上进行合理的分配,可以得到重参数模块中各分支的第二量化参数,并引入补偿函数,基于第二量化参数及补偿函数对重参数模块进行整体量化,不仅可以确保简化结构和重参数模块的量化过程与反量化过程一致,还可以保证重参数网络模型量化后还能转换成推理模型,同时兼顾模型的效果、泛化能力和推理性能。

【技术实现步骤摘要】

本申请涉及人工智能,具体而言,涉及一种模型量化方法、装置及计算机可读存储介质


技术介绍

1、通常情况下,为了保证模型的效果和泛化能力,可以采用由结构复杂重参数模块堆叠而成的重参数网络模型进行训练,而在部署时,可以将重参数模块替换成等效的简化结构以保证模型的推理速度,推理模型有多个简化结构组成。

2、但在现有技术中,对重参数网络模型进行量化感知训练时,通常会对每个卷积层进行单独量化,而后再基于重参数方法将重参数模块融合成简化结构,将重参数网络模型转换成推理模型后,基于预训练的权重对推理模型进行量化感知训练,可能会导致基于推理模型训练得到的效果和泛化能力相对于重参数模型会有所降低。如果不将重参数模块融合成简化结构,直接基于重参数网络进行量化感知训练,可能会由于重参数网络在训练时和部署时的网络结构发生明显改变,导致量化后不满足重参数方法的应用条件而导致不能进行模型转换。


技术实现思路

1、为了至少克服现有技术中的上述不足,本申请的目的在于提供一种模型量化方法、装置及计算机可读存储介质。

2本文档来自技高网...

【技术保护点】

1.一种模型量化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的模型量化方法,其特征在于,所述基于所述重参数模块计算所述简化结构的第一量化参数,并基于所述第一量化参数得到所述重参数模块整体量化的第二量化参数的步骤,包括:

3.根据权利要求2所述的模型量化方法,其特征在于,所述基于所述简化结构的数值统计结果计算所述第一量化参数的步骤,包括:

4.根据权利要求3所述的模型量化方法,其特征在于,所述对所述第一权重值及所述第一偏置量进行数值统计,基于所述第一权重值的数值统计结果及预设的量化范围得到第一权重量化参数,并基于所述第一偏置量的数值统计结果及...

【技术特征摘要】

1.一种模型量化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的模型量化方法,其特征在于,所述基于所述重参数模块计算所述简化结构的第一量化参数,并基于所述第一量化参数得到所述重参数模块整体量化的第二量化参数的步骤,包括:

3.根据权利要求2所述的模型量化方法,其特征在于,所述基于所述简化结构的数值统计结果计算所述第一量化参数的步骤,包括:

4.根据权利要求3所述的模型量化方法,其特征在于,所述对所述第一权重值及所述第一偏置量进行数值统计,基于所述第一权重值的数值统计结果及预设的量化范围得到第一权重量化参数,并基于所述第一偏置量的数值统计结果及预设的量化范围得到第一偏置量化参数的步骤,包括:

5.根据权利要求4所述的模型量化方法,其特征在于,所述将所述第一权重量化参数分配到所述重参数模块的各分支中,得到第二权重量化参...

【专利技术属性】
技术研发人员:周凡
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1