深度学习模型的量化方法和相关装置制造方法及图纸

技术编号：32027618 阅读：10 留言：0更新日期：2022-01-27 12:38

本公开提供了一种深度学习模型的量化方法和相关装置。该方法包括：接收待量化深度学习模型；将待量化深度学习模型划分成子模型；针对子模型，从预先设置的候选量化算法和候选量化策略的组合中，选择与该子模型对应的量化算法和量化策略，所述量化策略是量化过程中除量化算法外需要遵循的准则；输出子模型按照对应的量化算法和量化策略量化后得到的量化后深度学习模型。本公开实施例克服了现有技术的模型量化要么精度低、要么复杂度高的问题，既能保证量化精度，又降低复杂度。又降低复杂度。又降低复杂度。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型的量化方法和相关装置

[0001]本公开涉及深度学习领域，更具体而言，涉及一种深度学习模型的量化方法和相关装置。

技术介绍

[0002]深度学习模型已经广泛应用于各种领域。在生成深度学习模型后，要将深度学习模型部署本地芯片执行或部署到云端执行。在部署过程中的性能直接影响到之后使用深度学习模型进行推理(Inference)时的性能和体验。量化是部署过程中非常关键的一个步骤。
[0003]量化是指，将深度学习模型中的每个节点的权重数据和输入数据，从高精度的量化级转换为低精度的量化级，例如从32位单精度浮点数 (FP32)转化为8位整型数据(INT8)。这样做虽然精度降低了，但有助于降低对数据吞吐量和存储空间的要求。量化算法和策略的优劣直接决定最终部署到芯片上的模型的运行精度和速度。
[0004]现有的部署框架中，通常对完整模型采用单一的量化算法和策略。例如，针对mobilenetv1模型的量化，如果选择非对称量化算法，并且校准方式选择KL散度，则对整个模型的量化将统一采用这样的算法和策略。这种方式带来的问题是，要么造成量化校准的带来的巨大时间损耗，要么使得部分模型的量化精度爆炸。

技术实现思路

[0005]有鉴于此，本公开旨在克服现有技术的模型量化要么精度低、要么复杂度高的问题，实现既能保证量化精度，又降低复杂度。
[0006]为了达到这个目的，根据本公开的一方面，本公开提供一种深度学习模型的量化方法，包括：
[0007]接收待量化深度学习模型；
[00...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的量化方法，包括：接收待量化深度学习模型；将待量化深度学习模型划分成子模型；针对子模型，从预先设置的候选量化算法和候选量化策略的组合中，选择与该子模型对应的量化算法和量化策略，所述量化策略是量化过程中除量化算法外需要遵循的准则；输出子模型按照对应的量化算法和量化策略量化后得到的量化后深度学习模型。2.根据权利要求1所述的方法，其中，在选择与该子模型对应的量化算法和量化策略之前，所述方法还包括：接收用户输入的量化方向；所述选择与该子模型对应的量化算法和量化策略，包括：选择与该子模型和所述量化方向对应的量化算法和量化策略。3.根据权利要求2所述的方法，其中，所述接收用户输入的量化方向，包括：接收用户输入的与划分成的子模型对应的量化方向；所述选择与该子模型和所述量化方向对应的量化算法和量化策略，包括：按照该子模型和与划分成的子模型对应的量化方向，选择量化算法和量化策略。4.根据权利要求1所述的方法，其中，所述将待量化深度学习模型划分成子模型，包括：将所述待量化深度学习模型输入子模型划分模型，由所述子模型划分模型输出划分的子模型。5.根据权利要求1所述的方法，其中，所述将待量化深度学习模型划分成子模型，包括：基于所述待量化深度学习模型中节点的类型和层级中的至少一个，根据预定规则，将所述节点划分到子模型。6.根据权利要求1所述的方法，其中，所述将待量化深度学习模型划分成子模型，包括：生成并显示所述待量化深度学习模型对应的静态图；接收用户对所述静态图的子模型划分指示；按照所述子模型划分指示，将所述深度学习模型划分成子模型。7.根据权利要求1所述的方法，其中，所述量化策略包括校准算法和量化后的位数中的至少一个。8.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员：陈峰，
申请(专利权)人：平头哥上海半导体技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人