模型量化方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:38904275 阅读:14 留言:0更新日期:2023-09-22 14:22
本申请提供了一种模型量化方法、装置、设备、存储介质及产品,属于深度学习技术领域。方法包括:基于深度学习模型对应的目标标签和高斯噪声,通过生成器生成伪造数据,所述伪造数据的标签为所述目标标签;基于所述深度学习模型中的多个第一批归一化BN层,从代理数据集合中确定代理数据,所述代理数据集合中包括多个代理数据,所述代理数据为开源的真实数据;将所述伪造数据和所述代理数据进行混合,得到第一样本数据;基于所述第一样本数据,对所述深度学习模型进行量化。本申请能够提高量化深度学习模型的精度。学习模型的精度。学习模型的精度。

【技术实现步骤摘要】
模型量化方法、装置、设备、存储介质及产品


[0001]本申请涉及深度学习
,特别涉及一种模型量化方法、装置、设备、存储介质及产品。

技术介绍

[0002]目前,深度学习模型已经在各行各业中占据了主导应用,然而为了提高深度学习模型的精度,深度学习模型往往比较大,从而导致深度学习模型很难部署到资源受限的边缘设备上(例如,手机或者智能手表等);因此,需要对深度学习模型进行量化。

技术实现思路

[0003]本申请实施例提供了一种模型量化方法、装置、设备、存储介质及产品,能够提高量化深度学习模型的精度。所述技术方案如下:
[0004]一方面,提供了一种模型量化方法,所述方法包括:
[0005]基于深度学习模型对应的目标标签和高斯噪声,通过生成器生成伪造数据,所述伪造数据的标签为所述目标标签;
[0006]基于所述深度学习模型中的多个第一批归一化BN层,从代理数据集合中确定代理数据,所述代理数据集合中包括多个代理数据,所述代理数据为开源的真实数据;
[0007]将所述伪造数据和所述代理数据进行混合,得到第一样本数据;
[0008]基于所述第一样本数据,对所述深度学习模型进行量化。
[0009]另一方面,提供了一种模型量化装置,所述装置包括:
[0010]生成模块,用于基于深度学习模型对应的目标标签和高斯噪声,通过生成器生成伪造数据,所述伪造数据的标签为所述目标标签;
[0011]第一确定模块,用于基于所述深度学习模型中的多个第一批归一化BN层,从代理数据集合中确定代理数据,所述代理数据集合中包括多个代理数据,所述代理数据为开源的真实数据;
[0012]混合模块,用于将所述伪造数据和所述代理数据进行混合,得到第一样本数据;
[0013]量化模块,用于基于所述第一样本数据,对所述深度学习模型进行量化。
[0014]另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述所述的模型量化方法。
[0015]另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述所述的获模型量化方法。
[0016]另一方面,提供了一种计算机程序产品,所述计算机程序产品存储有至少一条程序代码,所述至少一条程序代码用于被处理器执行,以实现上述所述的模型量化方法。
[0017]在本申请实施例中,由于第一样本数据中包括了伪造数据和代理数据;而仿造数据是基于深度学习模型对应的标签生成的,因此仿造数据是符合标签要求的数据;而代理
数据是真实获取到的开源数据,而开源数据具有丰富的特征;因此代理数据在数据特征方面具有优势;因此,基于第一样本数据,对深度学习模型进行量化是结合了仿造数据和代理数据的优势,能够提高量化深度学习模型的精度。
附图说明
[0018]图1示出了本申请一个示例性实施例示出的模型量化方法的实施环境的示意图;
[0019]图2示出了本申请一个示例性实施例示出的模型量化方法的流程图;
[0020]图3示出了本申请一个示例性实施例示出的模型量化方法的示意图;
[0021]图4示出了本申请一个示例性实施例示出的模型量化方法的流程图;
[0022]图5示出了本申请一个示例性实施例示出的模型量化方法的流程图;
[0023]图6示出了本申请一个示例性实施例示出的模型量化方法的流程图;
[0024]图7示出了本申请一个示例性实施例示出的模型量化方法的流程图;
[0025]图8示出了本申请一个示例性实施例示出的模型量化装置的框图;
[0026]图9示出了本申请一个示例性实施例示出的终端的框图;
[0027]图10示出了本申请一个示例性实施例示出的服务器的框图。
具体实施方式
[0028]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0029]在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0030]需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的伪造数据和代理数据等都是在充分授权的情况下获取的。
[0031]请参考图1,其示出了本申请一个示例性实施例示出的模型量化方法的实施环境的示意图。参见图1,该实施环境包括:计算机设备101和终端102。计算机设备101用于对深度学习模型进行量化,将量化后的深度学习模型部署到终端102中。本申请实施例是模型的无数据量化方法,也即不依赖于训练深度学习模型的原始的样本数据进行量化的方法。计算机设备101可以为终端或者服务器;在图1中以计算机设备101为服务器为例进行说明的。而终端102可以为资源受限的边缘终端,例如终端102可以为手机或者穿戴设备等。
[0032]在一些实施例中,深度学习模型可以为图像识别模型,也即计算机设备101对图像识别模型进行量化,将量化后的图像识别模型部署到终端102中,使得终端102通过量化后的图像识别模型进行图像识别。在一些实施例中,深度学习模型可以为语音识别模型,也即计算机设备101对语音识别模型进行量化,将量化后的语音识别模型部署到终端102中,使得终端102通过量化后的语音识别模型进行语音识别;例如,终端102识别语音信号的语音控制指令,从而执行语音控制指令对应的操作,进而实现通过语音信号控制终端102的目
的。在一些实施例中,深度学习模型可以为图像分类模型,也即计算机设备101对图像分类模型进行量化,将量化后的图像分类模型部署到终端102中,使得终端102通过量化后的图像分类模型进行图像分类。另外,本申请实施例提供的模型量化方法可以对任一深度学习模型进行量化,以上仅仅是对深度学习模型的举例,并不对深度学习模型进行限制。
[0033]请参考图2,其示出了本申请一个示例性实施例示出的模型量化方法的流程图。参考图2,该方法包括:
[0034]步骤201:基于深度学习模型对应的目标标签和高斯噪声,通过生成器生成伪造数据,伪造数据的标签为目标标签。
[0035]伪造数据为深度学习模型对应的训练数据;在一些实施例中,在深度学习模型为图像识别模型的情况下,伪造数据可以为伪造的图像;在深度学习模型为语音识别模型的情况下,伪造数据可以为伪造的语音信号;在深度学习模型为图像分类模型的情况下,伪造数据可以为伪造的图像。...

【技术保护点】

【技术特征摘要】
1.一种模型量化方法,其特征在于,所述方法包括:基于深度学习模型对应的目标标签和高斯噪声,通过生成器生成伪造数据,所述伪造数据的标签为所述目标标签;基于所述深度学习模型中的多个第一批归一化BN层,从代理数据集合中确定代理数据,所述代理数据集合中包括多个代理数据,所述代理数据为开源的真实数据;将所述伪造数据和所述代理数据进行混合,得到第一样本数据;基于所述第一样本数据,对所述深度学习模型进行量化。2.根据权利要求1所述的方法,其特征在于,所述基于所述深度学习模型中的多个第一批归一化BN层,从代理数据集合中确定代理数据,包括:确定代理数据集合,所述代理数据集合包括多个候选代理数据;基于所述深度学习模型中的多个第一批归一化BN层,确定所述代理数据集合中的多个候选代理数据对应的归一化距离,所述候选代理数据对应的归一化距离用于表征所述候选代理数据与第二样本数据之间的相关性,所述第二样本数据为训练所述深度学习模型的样本数据;基于所述代理数据集合中的多个候选代理数据对应的归一化距离,从所述代理数据集合中确定对应归一化距离满足条件的代理数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述深度学习模型中的多个第一批归一化BN层,确定所述代理数据集合中的多个候选代理数据对应的归一化距离,包括:对于任一候选代理数据,将所述候选代理数据输入所述深度学习模型中;通过所述深度学习模型中的多个第一BN层,确定所述候选代理数据在所述多个BN层的第一均值和第一方差;基于所述候选代理数据在所述多个第一BN层的第一均值和第一方差以及预先存储在所述多个第一BN层的第二均值和第二方差,确定所述候选代理数据对应的归一化距离。4.根据权利要求3所述的方法,其特征在于,所述基于所述候选代理数据在所述多个第一BN层的第一均值和第一方差以及预先存储在所述多个第一BN层的第二均值和第二方差,确定所述候选代理数据对应的归一化距离,包括:对于任一第一BN层,基于所述候选代理数据在所述第一BN层的第一均值和预先存储在所述第一BN层的第二均值,确定第一归一化距离,以及基于所述候选代理数据所述第一BN层的第一方差和预先存储在所述第一BN层的第二方差,确定第二归一化距离,确定所述第一归一化距离和所述第二归一化距离之和,得到第三归一化距离;确定所述多个第一BN层对应的第三归一化距离的平均值,得到所述候选代理数据对应的归一化距离。5.根据权利要求1所述的方法,其特征在于,所述将所述伪造数据和所述代理数据进行混合,得到第一样本数据,包括:确定第一超参数,所述第一超参数用于约束所述伪造数据和所述代理数据的混合比例;基于所述第一超参数,对所述仿造数据和所述代理...

【专利技术属性】
技术研发人员:张光艳
申请(专利权)人:深圳市欢太科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1