量化模型的优化方法、装置、终端及存储介质制造方法及图纸

技术编号：26173092 阅读：31 留言：0更新日期：2020-10-31 13:54

本申请实施例公开了一种量化模型的优化方法、装置、终端及存储介质，属于计算机技术领域。本申请实施例能够首先对浮点计算模型进行初步的量化，得到第一定点计算模型，之后通过调整第一定点计算模型中的量化参数，得到第二定点计算模型，当调整后的定点计算模型的精度值提高时，将第二定点计算模型作为优化后的模型。由此可见，本申请实施例能够在浮点计算模型量化为第一定点计算模型之后，还能够通过调整该第一定点计算模型中的量化参数，得到精度值更高的第二定点计算模型，降低了量化浮点计算模型带来的精度下降的影响，增强了得到高精度的定点计算模型的效率。

Optimization method, device, terminal and storage medium of quantitative model

全部详细技术资料下载

【技术实现步骤摘要】
量化模型的优化方法、装置、终端及存储介质
本申请实施例涉及计算机
，特别涉及一种量化模型的优化方法、装置、终端及存储介质。
技术介绍
随着深度学习(Deeplearning)技术的发展，为了加速神经网络模型的运行速度，便于神经网络在移动端中部署，通常使用量化技术将浮点计算模型量化为定点计算模型。在一些可能的实现方式中，技术人员将浮点计算模型中参与计算的网络输入、权重、偏置和伸缩尺度参数等，均由浮点数转换为定点数，进而完成浮点计算模型量化为定点计算模型的过程。
技术实现思路
本申请实施例提供了一种量化模型的优化方法、装置、终端及存储介质。所述技术方案如下：根据本申请的一方面内容，提供了一种量化模型的优化方法，所述方法包括：根据第一数据集将浮点计算模型量化为第一定点计算模型；将第一计算节点的量化参数从第一数值更新为第二数值，得到第二定点计算模型，所述第一计算节点属于所述第一定点计算模型，所述第一数值和所述第二数值为自然数，所述第二数值小于等于目标参数；响应于所述第...

【技术保护点】
1.一种量化模型的优化方法，其特征在于，所述方法包括：/n根据第一数据集将浮点计算模型量化为第一定点计算模型；/n将第一计算节点的量化参数从第一数值更新为第二数值，得到第二定点计算模型，所述第一计算节点属于所述第一定点计算模型，所述第二数值小于等于目标参数；/n响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，将所述第一定点计算模型优化为所述第二定点计算模型。/n

【技术特征摘要】
1.一种量化模型的优化方法，其特征在于，所述方法包括：
根据第一数据集将浮点计算模型量化为第一定点计算模型；
将第一计算节点的量化参数从第一数值更新为第二数值，得到第二定点计算模型，所述第一计算节点属于所述第一定点计算模型，所述第二数值小于等于目标参数；
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，将所述第一定点计算模型优化为所述第二定点计算模型。

2.根据权利要求1所述的方法，其特征在于，所述第一定点计算模型包括所述第一计算节点和第二计算节点，所述将第一计算节点的量化参数从第一数值更新为第二数值，得到第二定点计算模型，包括：
保持所述第二计算节点的量化参数不变；
将所述第一计算节点的量化参数从所述第一数值更新为所述第二数值，得到所述第二定点计算模型。

3.根据权利要求2所述的方法，其特征在于，所述响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，将所述第一定点计算模型优化为所述第二定点计算模型，包括：
获取所述第一定点计算模型的精度值；
将第二数据集输入所述第二定点计算模型，获取所述第二定点计算模型的精度值；
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，将所述第一定点计算模型优化为所述第二定点计算模型。

4.根据权利要求3所述的方法，其特征在于，所述响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，将所述第一定点计算模型优化为所述第二定点计算模型，包括：
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值，则将所述第二数值更新为第i数值，得到第i定点计算模型，所i为大于等于3的整数；
将所述第二数据集输入所述第i定点计算模型，获取所述第i定点计算模型的精度值；
响应于所述第i定点计算模型的精度值高于所述第二定点计算模型的精度值，将所述第二定点计算模型优化...

【专利技术属性】
技术研发人员：刘君，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人