用于音频降噪的后训练量化方法、装置和存储介质制造方法及图纸

技术编号:37876205 阅读:10 留言:0更新日期:2023-06-15 21:04
本申请公开了一种用于音频降噪的后训练量化方法、装置和存储介质,涉及人工智能技术领域,所述方法包括:获取训练后的浮点网络的网络权重数据,训练后的浮点网络用于对音频数据进行降噪;对网络权重数据进行量化;将音频数据集输入至训练后的浮点网络;获取浮点网络对音频数据集降噪过程中的各个激活层的网络激活值;对网络激活值进行量化;根据量化后的网络权重数据和量化后的网络激活值,确定量化后的浮点网络,量化后的浮点网络用于对音频数据进行降噪。解决了现有技术中由于浮点网络量化所需的时间消耗较大进而导致音频数据降噪效率低的问题。效率低的问题。效率低的问题。

【技术实现步骤摘要】
用于音频降噪的后训练量化方法、装置和存储介质


[0001]本专利技术涉及一种用于音频降噪的后训练量化方法、装置和存储介质,属于人工智能


技术介绍

[0002]对深度学习模型进行低比特量化,可以有效地降低模型部署时在存储、计算、通信上的开销,是一种常见的模型压缩和推理优化技术。然而,模型量化在实际应用中仍然存在不少挑战,最为常见的问题就是模型精度下降。而通过在模型训练阶段引入量化相关约束,即量化感知训练(Quantization

aware training,QAT),能够更好地解决模型量化的精度问题。
[0003]现有的一种训练感知量化方法包括:(1)对浮点网络中需要量化的部分进行伪量化处理;(2)在有伪量化处理情况下进行迭代训练;(3)获得符合预期的网络模型后,存储量化网络参数。
[0004]在上述方法中,为了保证浮点网络对音频数据的降噪精度需要对浮点网络重新训练,并且在训练过程中还需要引入伪量化等步骤,这些都会让量化步骤变得繁琐,时间消耗大,也即对音频数据的降噪效率较低。

技术实现思路

[0005]本专利技术的目的在于提供一种用于音频降噪的后训练量化方法、装置和存储介质,用于解决现有技术中存在的问题。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]根据第一方面,本专利技术实施例提供了一种音频降噪方法,所述方法包括:
[0008]获取训练后的浮点网络的网络权重数据,所述训练后的浮点网络用于对音频数据进行降噪
[0009]对所述网络权重数据进行量化;
[0010]将音频数据集输入至训练后的所述浮点网络;
[0011]获取所述浮点网络对所述音频数据集降噪过程中的各个激活层的网络激活值;
[0012]对所述网络激活值进行量化;
[0013]根据量化后的所述网络权重数据和量化后的所述网络激活值,确定量化后的所述浮点网络,量化后的所述浮点网络用于对音频数据进行降噪可选地,所述网络权重数据包括i组,i为大于1的整数,所述对所述网络权重数据进行量化,包括:
[0014]获取预设零点值;
[0015]对于每组网络权重数据,根据所述分组的网络权重数据获取缩放系数;
[0016]根据所述预设零点值和每个分组所对应的缩放系数对所述分组的各个网络权重数据进行量化。
[0017]可选地,所述根据所述分组的网络权重数据获取缩放系数,包括:
[0018]获取所述分组的网络权重数据中的最大网络权重数据;
[0019]根据所述最大网络权重数据获取所述缩放系数。
[0020]可选地,所述网络激活值包括j组,j为大于1的整数,所述对所述网络激活值进行量化,包括:
[0021]对于每组网络激活值,根据所述分组的网络激活值获取所述分组所对应的缩放系数和零点值;
[0022]根据每个分组所对应的缩放系数和零点值对所述分组的网络激活值进行量化。
[0023]可选地,所述根据所述分组的网络激活值获取所述分组所对应的缩放系数和零点值,包括:
[0024]对于所述分组的网络激活值,根据所述网络激活值的数据分布对各个网络激活值进行聚类,并得到K个分类,K为大于1的整数;
[0025]对于所述K个分类中的每个分类,获取所述分类的量化中心值;
[0026]根据计算得到的各个量化中心值,获取所述分组所对应的缩放系数和零点值。
[0027]可选地,所述对于所述K个分类中的每个分类,获取所述分类的量化中心值,包括:
[0028]对于所述K个分类中的每个分类,获取所述分类中处于聚类中心位置的网络激活值;
[0029]将获取到的各个网络激活值映射为均匀分布的K个量化中心,所述K个量化中心即为获取到的各个分类的量化中心值。
[0030]可选地,所述根据计算得到的各个量化中心值,获取所述分组所对应的缩放系数和零点值,包括:
[0031]根据所述各个量化中心值中的最大量化中心值和最小量化中心值获取所述分组所对应的缩放系数;
[0032]根据所述分类中的最小量化中心值获取所述分类所对应的零点值。
[0033]可选地,所述根据量化后的所述网络权重数据和量化后的所述网络激活值,确定量化后的所述浮点网络,包括:
[0034]根据量化后的所述网络权重数据和量化后的所述网络激活值,检测量化后的所述浮点网络是否满足目标条件;
[0035]若不满足,则更新量化后的所述网络权重数据和量化后的所述网络激活值,并再次执行所述根据量化后的所述网络权重数据和量化后的所述网络激活值,检测量化后的所述浮点网络是否满足目标条件的步骤。
[0036]第二方面,提供了一种用于音频降噪的后训练量化装置,所述装置包括存储器和处理器,所述存储器中存储有至少一条程序指令,所述处理器通过加载并执行所述至少一条程序指令以实现如第一方面所述的方法。
[0037]第三方面,提供了一种计算机存储介质,所述计算机存储介质中存储有至少一条程序指令,所述至少一条程序指令被处理器加载并执行以实现如第一方面所述的方法。
[0038]通过获取训练后的浮点网络的网络权重数据,所述训练后的浮点网络用于对音频数据进行降噪;对所述网络权重数据进行量化;将音频数据集输入至训练后的所述浮点网络;获取所述浮点网络对所述音频数据集降噪过程中的各个激活层的网络激活值;对所述网络激活值进行量化;根据量化后的所述网络权重数据和量化后的所述网络激活值,确定
量化后的所述浮点网络,量化后的所述浮点网络用于对音频数据进行降噪。解决了现有技术中由于浮点网络量化所需的时间消耗较大进而导致音频数据降噪效率低的问题,达到了可以无需对浮点网络重新训练仅需对网络权重数据和网络激活值进行统计量化,进而减少时间消耗简化量化步骤提高音频数据的降噪效率的效果。
[0039]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。
附图说明
[0040]图1为本专利技术一个实施例提供的用于音频降噪的后训练量化方法的方法流程图;
[0041]图2为本专利技术一个实施例提供的对非均匀分布的量化中心的数值进行映射时一种可能的映射示意图。
具体实施方式
[0042]下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0043]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于音频降噪的后训练量化方法,其特征在于,所述方法包括:获取训练后的浮点网络的网络权重数据,所述训练后的浮点网络用于对音频数据进行降噪;对所述网络权重数据进行量化;将音频数据集输入至训练后的所述浮点网络;获取所述浮点网络对所述音频数据集降噪过程中的各个激活层的网络激活值;对所述网络激活值进行量化;根据量化后的所述网络权重数据和量化后的所述网络激活值,确定量化后的所述浮点网络,量化后的所述浮点网络用于对音频数据进行降噪。2.根据权利要求1所述的方法,其特征在于,所述网络权重数据包括i组,i为大于1的整数,所述对所述网络权重数据进行量化,包括:获取预设零点值;对于每组网络权重数据,根据所述分组的网络权重数据获取缩放系数;根据所述预设零点值和每个分组所对应的缩放系数对所述分组的各个网络权重数据进行量化。3.根据权利要求2所述的方法,其特征在于,所述根据所述分组的网络权重数据获取缩放系数,包括:获取所述分组的网络权重数据中的最大网络权重数据;根据所述最大网络权重数据获取所述缩放系数。4.根据权利要求1所述的方法,其特征在于,所述网络激活值包括j组,j为大于1的整数,所述对所述网络激活值进行量化,包括:对于每组网络激活值,根据所述分组的网络激活值获取所述分组所对应的缩放系数和零点值;根据每个分组所对应的缩放系数和零点值对所述分组的网络激活值进行量化。5.根据权利要求4所述的方法,其特征在于,所述根据所述分组的网络激活值获取所述分组所对应的缩放系数和零点值,包括:对于所述分组的网络激活值,根据所述网络激活值的数据分布对各个网络激活值进行聚类,并得到K个分类,K为大于1的整数;对于所述K个分类中的每个分类,获取所述分...

【专利技术属性】
技术研发人员:郭星辰
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1