音量均衡方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：41293236 阅读：3 留言：0更新日期：2024-05-13 14:43

本申请涉及一种音量均衡方法、装置、计算机设备和存储介质。所述方法包括：分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域，得到参考人声音频的第一bark域信号和待均衡人声音频的第二bark域信号；根据第一bark域信号和第二bark域信号在各音频帧上的信号差异，确定针对各音频帧的响度调整参考信息；根据各音频帧的响度调整参考信息，确定音量均衡参数。采用本方法能够实时分析合唱场景下参考人声音频和待均衡人声音频在bark域上的信号差异，结合平滑处理和取值约束，确定针对待均衡人声音频的音量均衡参数，从而利用音量均衡参数对待均衡人声音频进行音量均衡，进而提高音量均衡结果的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，特别是涉及一种音量均衡方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

1、在音乐演唱场景下，存在有若干种不同来源的声音，为了避免在演唱环节中不同来源的声音混合在一起时可能存在的不自然和不贴合问题，影响音乐的品质，需要针对不同来源的声音对应的音轨进行多路的音量均衡。

2、传统技术可通过对各路音轨进行预处理和特征分析，利用分析结果进行音量均衡。

3、然而，在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题，现有技术是对各路音轨进行一遍预处理特征提取，然后基于分析结果来做音量均衡。无法实时的提供音量均衡的能力，需要等到音频全部录制完成后才能实现。且传统技术直接从时域的角度去考虑音量而忽略了人耳对应听觉的感知不是简单的参考波形的幅度，无法考虑到人耳对不同频率的响度会产生不同的听觉感知，甚至还可能导致调整后的音乐中部分女声比男声更亮更明显的问题，不利于提高音量均衡结果的准确度。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高音量均衡结果的准确度的音量均衡方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本申请提供了一种音量均衡方法，包括：

3、分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域，得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号；

4、根据所述第一bark域信号和所述

5、根据所述各音频帧的响度调整参考信息，确定音量均衡参数；所述音量均衡参数用于对所述待均衡人声音频进行音量均衡。

6、在其中一个实施例中，所述根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异，确定针对所述各音频帧的响度调整参考信息，包括：

7、对于所述各音频帧中的任一目标音频帧，在所述第一bark域信号和所述第二bark域信号中确定针对所述目标音频帧的目标峰值点；

8、根据所述目标峰值点在所述第一bark域信号中对应的信号值与所述目标峰值点在所述第二bark域信号中对应的信号值之间的差值，确定各所述目标峰值点对应的信号差值；

9、从各所述目标峰值点对应的信号差值中，确定出针对所述目标音频帧的响度调整参考信息。

10、在其中一个实施例中，所述从各所述目标峰值点对应的信号差值中，确定出针对所述目标音频帧的响度调整参考信息，包括：

11、根据各所述目标峰值点对应的信号差值，确定各所述目标峰值点对应的信号差值中的中位数；

12、在所述中位数小于预设的信号差值阈值的情况下，将针对所述目标音频帧的响度调整参考信息设置为预设的响度调整参考值；

13、在所述中位数大于或等于所述预设的信号差值阈值的情况下，将所述中位数作为针对所述目标音频帧的响度调整参考信息。

14、在其中一个实施例中，所述根据所述各音频帧的响度调整参考信息，确定音量均衡参数，包括：

15、对所述各音频帧的响度调整参考信息进行平滑处理，得到所述各音频帧对应的响度调整参数；

16、获取预设的响度调整约束范围，根据所述各音频帧对应的响度调整参数与所述响度调整约束范围之间的关系，输出所述音量均衡参数。

17、在其中一个实施例中，所述对所述各音频帧的响度调整参考信息进行平滑处理，得到所述各音频帧对应的响度调整参数，包括：

18、获取所述第二bark域信号对应的信号采样率；

19、根据所述信号采样率和所述第二bark域信号对应的第一响应时间，确定针对所述第二bark域信号的第一平滑参数，以及，根据所述信号采样率和所述第二bark域信号对应的第二响应时间，确定针对所述第二bark域信号的第二平滑参数；

20、根据所述第一平滑参数和所述第二平滑参数，对所述响度调整参考信息进行平滑处理，得到所述各音频帧对应的响度调整参数。

21、在其中一个实施例中，所述响度调整约束范围包括响度调整约束上限和响度调整约束下限，所述根据所述各音频帧对应的响度调整参数与所述响度调整约束范围之间的关系，输出所述音量均衡参数，包括：

22、在所述各音频帧对应的响度调整参数大于所述响度调整约束上限的情况下，将所述各音频帧对应的音量均衡参数设置为所述响度调整约束上限；

23、在所述各音频帧对应的响度调整参数大于或等于所述响度调整约束下限，且所述各音频帧对应的响度调整参数小于或等于所述响度调整约束上限的情况下，将所述各音频帧对应的音量均衡参数设置为所述各音频帧对应的响度调整参数；

24、在所述各音频帧对应的响度调整参数小于所述响度调整约束下限的情况下，将所述各音频帧对应的音量均衡参数设置为所述响度调整约束下限。

25、在其中一个实施例中，所述分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域，得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号，包括：

26、将所述参考人声音频转换为频域，得到所述参考人声音频对应的第一频域信号，通过预训练的bark域滤波器，将所述第一频域信号转换为所述第一bark域信号；

27、以及，将所述待均衡人声音频转换为频域，得到所述待均衡人声音频对应的第二频域信号，通过预训练的bark域滤波器，将所述第二频域信号转换为所述第二bark域信号。

28、在其中一个实施例中，所述方法还包括：

29、按照预设的人声音频选择策略，从组成所述目标合唱音频的至少两路人声音频中确定出所述参考人声音频；

30、将所述至少两路人声音频中除所述参考人声音频以外的人声音频确定为所述待均衡人声音频。

31、第二方面，本申请还提供了一种音量均衡装置，包括：

32、转换模块，用于分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域，得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号；

33、确定模块，用于根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异，确定针对所述各音频帧的响度调整参考信息；

34、均衡模块，用于根据所述各音频帧的响度调整参考信息，确定音量均衡参数；所述音量均衡参数用于对所述待均衡人声音频进行音量均衡。

35、第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

36、第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步本文档来自技高网...

【技术保护点】

1.一种音量均衡方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异，确定针对所述各音频帧的响度调整参考信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述从各所述目标峰值点对应的信号差值中，确定出针对所述目标音频帧的响度调整参考信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述各音频帧的响度调整参考信息，确定音量均衡参数，包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述各音频帧的响度调整参考信息进行平滑处理，得到所述各音频帧对应的响度调整参数，包括：

6.根据权利要求4所述的方法，其特征在于，所述响度调整约束范围包括响度调整约束上限和响度调整约束下限，所述根据所述各音频帧对应的响度调整参数与所述响度调整约束范围之间的关系，输出所述音量均衡参数，包括：

7.根据权利要求1所述的方法，其特征在于，所述分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域，得

8.根据权利要求1至7任意一项所述的方法，其特征在于，所述方法还包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

11.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种音量均衡方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述从各所述目标峰值点对应的信号差值中，确定出针对所述目标音频帧的响度调整参考信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述各音频帧的响度调整参考信息，确定音量均衡参数，包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述各音频帧的响度调整参考信息进行平滑处理，得到所述各音频帧对应的响度调整参数，包括：

6.根据权利要求4所述的方法，其特征在于，所述响度调整约束范围包括响度调整约束上限和响度调整约束下限，所述根据所述各音频帧对应的响度调整参数与所述响度调整约束...

【专利技术属性】
技术研发人员：李博文，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人