一种离线量化工具的精度调优方法技术

技术编号:30073977 阅读:49 留言:0更新日期:2021-09-18 08:28
本发明专利技术提供一种离线量化工具的精度调优方法,涉及深度学习领域,包括:步骤S1,判断深度学习模型是否适合第一权重调优方案:若否,转向步骤S2;若是,根据第一权重调优方案对卷积层的权重和偏置进行调优,以重新赋值得到第一调优模型;步骤S2,用第二权重调优方案及第一训练数据对第一调优模型的各卷积层权重调优得到量化因子集;步骤S3,将第二训练数据输入第一调优模型,根据量化因子集计算得到权重最大值和权重最小值,对各卷积层的权重进行截断,并对第一调优模型中的权重赋值得到第二调优模型;步骤S4,用离线量化工具对第二调优模型量化得到量化模型。本技术方案联用多种权值调优方案对网络模型进行量化调优,提升了深度学习模型的精度。学习模型的精度。学习模型的精度。

【技术实现步骤摘要】
一种离线量化工具的精度调优方法


[0001]本专利技术涉及深度学习领域,尤其涉及一种离线量化工具的精度调优方法。

技术介绍

[0002]随着AI技术的不断发展,目前基于深度学习算法的模型已经在端侧部署端进行了大量的应用。为了考虑到受限于端侧设备的成本,功耗,性能等问题,越来越多的研发人员投入到如何在不损失原模型精度的情况下,进行模型的压缩,量化使其能高精度,高性能的在端侧设备运行,更好的符合落地场景的要求。
[0003]目前,现有的量化工具只支持一种或者两种量化调优算法来对模型进行精度调优提升,例如KLD,EasyQuant,DFQ以及MinMax等。并且在市场的端侧设备影响下,主要集中于从FP32模型到INT8模型的量化调优。若只使用单一量化算法,当遇到存有离散型权重分布较广的卷积层模型时,量化结果并不理想。
[0004]市场上的模型量化工具针对检测网络量化部分支持有限,无法做到普适性。因此,如何对现有的离线量化工具进行优化调优是需要解决的问题。
[0005]目前常见的模型量化调优策略一般分为三种:方法一,针对模型的输本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种离线量化工具的精度调优方法,其特征在于,应用于一深度学习模型,所述深度学习模型包括多个卷积层;所述精度调优方法包括:步骤S1,根据所述深度学习模型的网络结构判断所述深度学习模型是否适合预先配置的一第一权重调优方案:若否,则转向步骤S2;若是,则根据所述第一权重调优方案对各所述卷积层的权重和偏置进行权重调优,并根据权重调优结果对所述深度学习模型的所述权重和所述偏置进行重新赋值得到一第一调优模型,随后转向步骤S2;步骤S2,采用预先配置的一第二权重调优方案并根据预先获取的一第一训练数据对所述第一调优模型的各所述卷积层的所述权重进行调优得到所述权重的量化因子集;步骤S3,将预先获取的一第二训练数据输入所述第一调优模型,并在进行推理之前,根据所述量化因子集计算得到各所述卷积层对应的一权重最大值和一权重最小值,以根据所述权重最大值和所述权重最小值对各所述卷积层的所述权重进行截断,并根据截断得到的所述权重对所述第一调优模型中的所述权重进行重新赋值得到一第二调优模型;步骤S4,将预先获取的一第三训练数据输入所述第二调优模型,并采用预先配置的一离线量化工具对所述第二调优模型进行模型量化得到量化模型。2.根据权利要求1所述的精度调优方法,其特征在于,执行所述步骤S4之后,还包括将所述量化模型部署至一端侧设备进行精度测试,并在精度测试结果小于一预设精度时,调整所述第一权重调优方案的使用次数,或调整所述第一训练数据,或调整所述第三训练数据进行精度优化,直至所述精度测试结果不小于所述预设精度。3.根据权利要求1所述的精度调优方法,其特征在于,所述步骤S1中,在所述深度学习模型中存在至少两个所述卷积层相连接的所述网络结构时,则表示所述深度学习模型适合所述第一权重调优方案。4.根据权利要求3所述的精度调优方法,其特征在于,采用所述第一权重调优方案对各所述卷积层的权重和偏置进行权重调优时,若所述深度学习模型的所述网络结构中存在卷积分支,则对所述卷积分支内外相连接的所述卷积层的所述权重和所述偏置进行重新赋值,得到所述第一调优模型;若所述深度学习模型的所述网络结构中不存在所述卷积分支,则对连接...

【专利技术属性】
技术研发人员:张兵黄明飞王海涛
申请(专利权)人:开放智能机器上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1