模型加速方法、装置、集成电路和存储介质制造方法及图纸

技术编号：33968749 阅读：17 留言：0更新日期：2022-06-30 01:58

本申请涉及一种模型加速方法、装置、集成电路、存储介质和计算机程序产品。所述方法包括：根据训练后的待加速模型的激活函数类型，得到与所述训练后的待加速模型相匹配的操作融合方式；所述操作融合方式表示所述训练后的待加速模型的卷积、激活和量化操作的融合方式；根据所述训练后的待加速模型的操作融合方式，对所述训练后的待加速模型的卷积参数、激活系数和量化参数进行融合运算，得到所述卷积参数、所述激活系数和所述量化参数的融合结果；根据所述融合结果，对输入到所述训练后的待加速模型中的卷积数据进行推理加速，得到所述卷积数据的推理加速结果。采用本方法能够提升深度神经网络的推理效率。升深度神经网络的推理效率。升深度神经网络的推理效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型加速方法、装置、集成电路和存储介质

[0001]本申请涉及电子电路
，特别是涉及一种模型加速方法、装置、集成电路、存储介质和计算机程序产品。

技术介绍

[0002]在数据处理过程中，例如利用深度神经网络进行图像数据处理，需要进行大量的卷积计算，在此过程中，集成电路发挥了重要作用。由于部分场景的深度神经网络搭载平台的性能有限，所以需要降低神经网络模型的计算量。
[0003]传统技术中，卷积计算量一般占深度神经网络的总计算量的90%，通常使用量化的方式降低深度神经网络的计算精度，但是，对于深度神经网络来说，这种方法仍需要消耗大量的计算资源和运行时间，使得对深度神经网络的推理速度的加速效果较为一般。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够有效提升深度神经网络的推理效率的模型加速方法、装置、集成电路、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种模型加速方法。所述方法包括：根据训练后的待加速模型的激活函数类型，得到与所述训练后的待加速模型相匹配的操作融合方式；所述操作融合方式表示所述训练后的待加速模型的卷积、激活和量化操作的融合方式；根据所述训练后的待加速模型的操作融合方式，对所述训练后的待加速模型的卷积参数、激活系数和量化参数进行融合运算，得到所述卷积参数、所述激活系数和所述量化参数的融合结果；根据所述融合结果，对输入到所述训练后的待加速模型中的卷积数据进行推理加速，得到所述卷积数据的推理加速结果。
[0006]...

【技术保护点】

【技术特征摘要】
1.一种模型加速方法，其特征在于，所述方法包括：根据训练后的待加速模型的激活函数类型，得到与所述训练后的待加速模型相匹配的操作融合方式；所述操作融合方式表示所述训练后的待加速模型的卷积、激活和量化操作的融合方式；根据所述训练后的待加速模型的操作融合方式，对所述训练后的待加速模型的卷积参数、激活系数和量化参数进行融合运算，得到所述卷积参数、所述激活系数和所述量化参数的融合结果；根据所述融合结果，对输入到所述训练后的待加速模型中的卷积数据进行推理加速，得到所述卷积数据的推理加速结果。2.根据权利要求1所述的方法，其特征在于，所述根据训练后的待加速模型的激活函数类型，得到与所述训练后的待加速模型相匹配的操作融合方式，包括：当所述训练后的待加速模型的激活函数类型为单一处理类型时，确定与所述训练后的待加速模型相匹配的融合方式为卷积、激活和量化操作融合方式；所述根据所述训练后的待加速模型的操作融合方式，对所述训练后的待加速模型的卷积参数、激活系数和量化参数进行融合运算，得到所述卷积参数、所述激活系数和所述量化参数的融合结果，包括：利用所述训练后的待加速模型的激活系数和量化系数，对所述训练后的待加速模型的卷积权重进行融合，得到融合后的卷积权重；利用所述训练后的待加速模型的激活系数、量化系数和量化偏置值，对所述训练后的待加速模型的卷积偏置值进行融合，得到融合后的卷积偏置值；将所述融合后的卷积权重和所述融合后的卷积偏置值，作为所述卷积、激活和量化操作融合方式的融合结果。3.根据权利要求2所述的方法，其特征在于，所述根据所述融合结果，对输入到所述训练后的待加速模型中的卷积数据进行推理加速，得到所述卷积数据的推理加速结果，包括：对所述卷积数据进行卷积推理处理，并将所述卷积推理处理中所调用的卷积权重和卷积偏置值，分别对应更新为所述融合后的卷积权重和所述融合后的卷积偏置值，得到所述卷积数据的卷积推理结果；将所述卷积推理结果，作为所述推理加速结果。4.根据权利要求1所述的方法，其特征在于，所述根据训练后的待加速模型的激活函数类型，得到与所述训练后的待加速模型相匹配的操作融合方式，包括：当所述训练后的待加速模型的激活函数类型为分段处理类型时，确定与所述训练后的待加速模型相匹配的融合方式为激活和量化操作融合方式；所述根据所述训练后的待加速模型的操作融合方式，对所述训练后的待加速模型的卷积参数、激活系数和量化参数进行融合运算，得到所述卷积参数、所述激活系数和所述量化参数的融合结果，包括：利用所述训练后的待加速模型的量化系数，对所述训练后的待加速模型的激活系数进行融合，得到融合后的激活系数，作为所述激活和量化操作融合方...

【专利技术属性】
技术研发人员：张斌，沈小勇，吕江波，
申请(专利权)人：苏州思谋智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人