嵌入式智能芯片的神经网络量化方法、装置和电子设备制造方法及图纸

技术编号：38716995 阅读：14 留言：0更新日期：2023-09-08 14:59

本发明专利技术公开一种嵌入式智能芯片的神经网络量化方法、装置和电子设备，包括：获取校准数据集、onnx模型、定点量化规则；基于onnx模型对校准数据集进行浮点推理以得到浮点数据总集，以及基于智能芯片对校准数据集进行定点推理以得到定点数据总集；获取智能芯片进行定点推理的推理时长；基于校准数据集、浮点数据总集、定点量化规则、定点数据总集和推理时长确定最终小数位宽。本申请运用onnx模型的优点，自动化完成浮点类型的定点量化，基于嵌入式智能芯片开发板对浮点运算的局限性及自身工具的难用性和效果差，简化定点量化同时，实现量化精度的提高，加快推理速度。加快推理速度。加快推理速度。

全部详细技术资料下载

【技术实现步骤摘要】
嵌入式智能芯片的神经网络量化方法、装置和电子设备

[0001]本专利技术涉及深度学习训练算法
，具体涉及一种嵌入式智能芯片的神经网络量化方法、装置和电子设备。

技术介绍

[0002]目前的深度学习算法嵌入式部署中，嵌入式开发板有对浮点运算支持不佳的局限性及量化的单一性，影响嵌入式开发板推理性能的两大因素：网络结构、定点量化方式。因此“量化配置”尤为重要。
[0003]嵌入式智能芯片传统的量化流程为准备校准数据，统计每层激活值的输出；基于计算公式或阈值映射量化分布，得量化配置。但是由于神经网络不同层激活值分布，数据分布都不一样，因此现有的量化方式的单一性，无法满足所有模型量化，且基于公式或阈值的直接映射，泛化性差同时也缺乏对智能芯片推理特性和推理时间的考虑导致上板推理性能差。

技术实现思路

[0004]为解决上述
技术介绍
中的至少一个技术问题。本专利技术提出一种嵌入式智能芯片的神经网络量化方法、装置和电子设备。
[0005]根据本申请实施例的一个方面，提供了一种嵌入式智能芯片的神经网络量化方法，包括：获取校准数据集、onnx模型、定点量化规则；基于所述onnx模型对所述校准数据集进行浮点推理以得到浮点数据总集，以及基于智能芯片对所述校准数据集进行定点推理以得到定点数据总集；获取所述智能芯片进行定点推理的推理时长；基于所述校准数据集、所述浮点数据总集、所述定点量化规则、所述定点数据总集和所述推理时长确定最终小数位宽。
[0006]可选地，所述基于所述校准数据集、所述浮点数据总集...

【技术保护点】

【技术特征摘要】
1.一种嵌入式智能芯片的神经网络量化方法，其特征在于，包括：获取校准数据集、onnx模型、定点量化规则；基于所述onnx模型对所述校准数据集进行浮点推理以得到浮点数据总集，以及基于智能芯片对所述校准数据集进行定点推理以得到定点数据总集；获取所述智能芯片进行定点推理的推理时长；基于所述校准数据集、所述浮点数据总集、所述定点量化规则、所述定点数据总集和所述推理时长确定最终小数位宽。2.如权利要求1所述的嵌入式智能芯片的神经网络量化方法，其特征在于，所述基于所述校准数据集、所述浮点数据总集、所述定点量化规则、所述定点数据总集和所述推理时长确定最终小数位宽包括：基于所述浮点数据总集和所述定点量化规则确定所述校准数据集的小数位宽集；基于所述校准数据集、所述小数位宽集、所述浮点数据总集、所述定点数据总集和所述推理时长确定所述最终小数位宽。3.如权利要求2所述的嵌入式智能芯片的神经网络量化方法，其特征在于，所述基于所述校准数据集、所述小数位宽集、所述浮点数据总集、所述定点数据总集和所述推理时长确定所述最终小数位宽包括：基于所述校准数据集、所述小数位宽集、所述浮点数据总集和所述定点数据总集确定推理误差因子；基于所述推理时长确定所述智能芯片的推理总时长；基于所述推理误差因子和所述推理总时长确定所述最终小数位宽。4.如权利要求3所述的嵌入式智能芯片的神经网络量化方法，其特征在于，所述基于所述推理误差因子和所述推理总时长确定所述最终小数位宽包括：基于所述推理误差因子和所述推理总时长确定第一修正因子和第二修正因子；基于所述推理误差因子、所述推理总时长、所述第一修正因子和所述第二修正因子确定所述最终小数位宽。5.如权利要求3所述的嵌入式智能芯片的神经网络量化方法，其特征在于，所述基于所述校准数据集、所述小数位宽集、所述浮点数据总集和所述定点数据总集确定推理误差因子包括：基于所述校准数据集确定输入数据量，以及基于所述浮点数据总集和所述定点数据总集确定输出数据量；基于所述输入数据量、所述输出数据量、所述浮点数据总集、所述小数位宽集和所述定点数据总集确定所述...

【专利技术属性】
技术研发人员：宫珊珊，张本西，贾伟，赵星阳，
申请(专利权)人：潍坊潍柴动力科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人