【技术实现步骤摘要】
量化模型的优化方法、装置、终端及存储介质
本申请实施例涉及计算机
,特别涉及一种量化模型的优化方法、装置、终端及存储介质。
技术介绍
随着深度学习(Deeplearning)技术的发展,为了加速神经网络模型的运行速度,便于神经网络在移动端中部署,通常使用量化技术将浮点计算模型量化为定点计算模型。在一些可能的实现方式中,技术人员将浮点计算模型中参与计算的网络输入、权重、偏置和伸缩尺度参数等,均由浮点数转换为定点数,进而完成浮点计算模型量化为定点计算模型的过程。
技术实现思路
本申请实施例提供了一种量化模型的优化方法、装置、终端及存储介质。所述技术方案如下:根据本申请的一方面内容,提供了一种量化模型的优化方法,所述方法包括:根据第一数据集将浮点计算模型量化为第一定点计算模型;将第一计算节点的量化参数从第一数值更新为第二数值,得到第二定点计算模型,所述第一计算节点属于所述第一定点计算模型,所述第一数值和所述第二数值为自然数,所述第二数值小于等于目标参数;响应于所述第 ...
【技术保护点】
1.一种量化模型的优化方法,其特征在于,所述方法包括:/n根据第一数据集将浮点计算模型量化为第一定点计算模型;/n将第一计算节点的量化参数从第一数值更新为第二数值,得到第二定点计算模型,所述第一计算节点属于所述第一定点计算模型,所述第二数值小于等于目标参数;/n响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,将所述第一定点计算模型优化为所述第二定点计算模型。/n
【技术特征摘要】
1.一种量化模型的优化方法,其特征在于,所述方法包括:
根据第一数据集将浮点计算模型量化为第一定点计算模型;
将第一计算节点的量化参数从第一数值更新为第二数值,得到第二定点计算模型,所述第一计算节点属于所述第一定点计算模型,所述第二数值小于等于目标参数;
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,将所述第一定点计算模型优化为所述第二定点计算模型。
2.根据权利要求1所述的方法,其特征在于,所述第一定点计算模型包括所述第一计算节点和第二计算节点,所述将第一计算节点的量化参数从第一数值更新为第二数值,得到第二定点计算模型,包括:
保持所述第二计算节点的量化参数不变;
将所述第一计算节点的量化参数从所述第一数值更新为所述第二数值,得到所述第二定点计算模型。
3.根据权利要求2所述的方法,其特征在于,所述响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,将所述第一定点计算模型优化为所述第二定点计算模型,包括:
获取所述第一定点计算模型的精度值;
将第二数据集输入所述第二定点计算模型,获取所述第二定点计算模型的精度值;
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,将所述第一定点计算模型优化为所述第二定点计算模型。
4.根据权利要求3所述的方法,其特征在于,所述响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,将所述第一定点计算模型优化为所述第二定点计算模型,包括:
响应于所述第二定点计算模型的精度值高于所述第一定点计算模型的精度值,则将所述第二数值更新为第i数值,得到第i定点计算模型,所i为大于等于3的整数;
将所述第二数据集输入所述第i定点计算模型,获取所述第i定点计算模型的精度值;
响应于所述第i定点计算模型的精度值高于所述第二定点计算模型的精度值,将所述第二定点计算模型优化...
【专利技术属性】
技术研发人员:刘君,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。