音频处理方法、装置、计算设备及介质制造方法及图纸

技术编号:34840792 阅读:15 留言:0更新日期:2022-09-08 07:37
本公开的实施方式提供了一种音频处理方法、装置、计算设备及介质。本公开通过在获取到待处理音频后,确定候选音频组中每个候选音频与待处理音频之间的音色相似度,其中,候选音频组所包括的音频两两之间的相似度之和,是每个音频组所包括的音频两两之间的相似度之和中最小的,从而使得候选音频组所包括的候选音频的音色更加多样,从而使得可以从更加多样的候选音频中实现目标音频的确定,以提高所确定出的目标音频的准确性,进而基于目标音频的预设调音参数,对待处理音频进行调音处理,实现对待处理音频的自动调音过程,无需相关技术人员手动操作,从而可以提高音频处理过程的调音效率。效率。效率。

【技术实现步骤摘要】
音频处理方法、装置、计算设备及介质


[0001]本公开的实施方式涉及音频处理
,更具体地,本公开的实施方式涉及一种音频处理方法、装置、计算设备及介质。

技术介绍

[0002]本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]调音是一种通过后期制作调整使音频更自然、更符合需要的音乐制作方式。
[0004]相关技术中,主要是由专业的调音师通过调音台来对音频进行调音,对调音师的专业要求极高,而且需要调音师手动操作,从而导致音频调音效率较低。

技术实现思路

[0005]在本上下文中,本公开的实施方式期望提供一种音频处理方法、装置、计算设备及介质,以提高音频处理过程的调音效率。
[0006]在本公开实施方式的第一方面中,提供了一种音频处理方法,该方法包括:
[0007]获取待处理音频;
[0008]确定候选音频组中每个候选音频与待处理音频之间的音色相似度,候选音频组为从多个音频组中确定出的一个音频组,候选音频组所对应的音色相似度之和在各个音频组所对应的音色相似度之和中最小,音色相似度之和为音频组所包括的音频两两之间的相似度的和,每个候选音频对应有预设调音参数;
[0009]基于待处理音频与各个候选音频的音色相似度,从多个候选音频中确定目标音频;
[0010]基于目标音频的预设调音参数,对待处理音频进行调音处理。
[0011]在本公开的一个实施例中,确定候选音频组中每个候选音频与待处理音频之间的音色相似度,包括:
[0012]获取各个候选音频的音色特征以及待处理音频的音色特征;
[0013]对于任一候选音频,基于候选音频的音色特征与待处理音频的音色特征,确定候选音频与待处理音频之间的音色相似度。
[0014]在本公开的一个实施例中,获取各个候选音频的音频音色以及待处理音频的音色特征,包括:
[0015]对于任一音频,确定音频的人声部分;
[0016]从音频的人声部分中,抽取目标数量的音频帧;
[0017]基于目标数量的音频帧的音色特征,确定音频的音色特征。
[0018]在本公开的一个实施例中,从音频的人声部分中,抽取目标数量的音频帧,包括:
[0019]基于音频的人声部分的时长,确定采样频率;
[0020]按照采样频率,在音频的人声部分中进行音频帧抽取,得到目标数量的音频帧。
[0021]在本公开的一个实施例中,基于目标数量的音频帧的音色特征,确定音频的音色特征,包括:
[0022]获取各个音频帧的音色特征,得到目标数量的音色特征;
[0023]基于目标数量的音色特征进行取平均处理,得到音频的音色特征。
[0024]在本公开的一个实施例中,对于任一候选音频,基于候选音频的音色特征与待处理音频的音色特征,确定候选音频与待处理音频之间的音色相似度,包括:
[0025]对于任一候选音频,确定候选音频的音色特征与待处理音频的音色特征之间的余弦距离,将所确定出的余弦距离作为候选音频与待处理音频之间的音色相似度。
[0026]在本公开的一个实施例中,基于待处理音频与各个候选音频的音色相似度,从多个候选音频中确定目标音频,包括:
[0027]将多个候选音频中与待处理音频的音色相似度最大的候选音频,确定为目标音频。
[0028]在本公开的一个实施例中,候选音频组的确定过程包括:
[0029]获取多个样本音频;
[0030]获取各个样本音频的音色特征;
[0031]基于多个样本音频的音色特征,确定每两个样本音频之间的音色相似度;
[0032]将设定数量的样本音频作为一个音频组,确定各个音频组所包括的设定数量的样本音频两两之间的音色相似度之和;
[0033]将音色相似度之和最小的音频组作为候选音频组。
[0034]在本公开的一个实施例中,获取多个样本音频之后,该方法还包括:
[0035]对多个样本音频进行预处理,预处理包括降噪处理、去齿音处理和音量归一化处理中的至少一项。
[0036]在本公开的一个实施例中,将音色相似度之和最小的音频组作为候选音频组之后,该方法还包括:
[0037]获取候选音频组所包括的音频的动态EQ调音参数和静态EQ调音参数,作为预设调音参数。
[0038]在本公开的一个实施例中,音频为干声音频,音色特征由梅尔频率倒谱系数MFCC特征中目标维度的特征组成。
[0039]在本公开实施方式的第二方面中,提供了一种音频处理装置,该装置包括:
[0040]获取模块,用于获取待处理音频;
[0041]相似度确定模块,用于确定候选音频组中每个候选音频与待处理音频之间的音色相似度,候选音频组为从多个音频组中确定出的一个音频组,候选音频组所对应的音色相似度之和在各个音频组所对应的音色相似度之和中最小,音色相似度之和为音频组所包括的音频两两之间的相似度的和,每个候选音频对应有预设调音参数;
[0042]音频确定模块,用于基于待处理音频与各个候选音频的音色相似度,从多个候选音频中确定目标音频;
[0043]处理模块,用于基于目标音频的预设调音参数,对待处理音频进行调音处理。
[0044]在本公开的一个实施例中,相似度确定模块,在用于确定候选音频组中每个候选音频与待处理音频之间的音色相似度时,包括:
[0045]获取子模块,用于获取各个候选音频的音色特征以及待处理音频的音色特征;
[0046]确定子模块,用于对于任一候选音频,基于候选音频的音色特征与待处理音频的音色特征,确定候选音频与待处理音频之间的音色相似度。
[0047]在本公开的一个实施例中,获取子模块,在用于获取各个候选音频的音频音色以及待处理音频的音色特征时,包括:
[0048]确定单元,用于对于任一音频,确定音频的人声部分;
[0049]抽取单元,用于从音频的人声部分中,抽取目标数量的音频帧;
[0050]确定单元,还用于基于目标数量的音频帧的音色特征,确定音频的音色特征。
[0051]在本公开的一个实施例中,抽取单元,在用于从音频的人声部分中,抽取目标数量的音频帧时,用于:
[0052]基于音频的人声部分的时长,确定采样频率;
[0053]按照采样频率,在音频的人声部分中进行音频帧抽取,得到目标数量的音频帧。
[0054]在本公开的一个实施例中,确定单元,在用于基于目标数量的音频帧的音色特征,确定音频的音色特征时,用于:
[0055]获取各个音频帧的音色特征,得到目标数量的音色特征;
[0056]基于目标数量的音色特征进行取平均处理,得到音频的音色特征。
[0057]在本公开的一个实施例中,确定子模块,在用于对于任一候选音频,基于候选音频的音色特征与待处理音频的音色特征,确定候选音频与待处理音频之间的音色相似度时,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:获取待处理音频;确定候选音频组中每个候选音频与所述待处理音频之间的音色相似度,所述候选音频组为从多个音频组中确定出的一个音频组,所述候选音频组所对应的音色相似度之和在各个音频组所对应的音色相似度之和中最小,所述音色相似度之和为音频组所包括的音频两两之间的相似度的和,每个所述候选音频对应有预设调音参数;基于所述待处理音频与各个候选音频的音色相似度,从多个候选音频中确定目标音频;基于所述目标音频的预设调音参数,对所述待处理音频进行调音处理。2.根据权利要求1所述的方法,其特征在于,所述确定候选音频组中每个候选音频与所述待处理音频之间的音色相似度,包括:获取各个候选音频的音色特征以及所述待处理音频的音色特征;对于任一候选音频,基于所述候选音频的音色特征与所述待处理音频的音色特征,确定所述候选音频与所述待处理音频之间的音色相似度。3.根据权利要求2所述的方法,其特征在于,所述获取各个候选音频的音频音色以及所述待处理音频的音色特征,包括:对于任一音频,确定所述音频的人声部分;从所述音频的人声部分中,抽取目标数量的音频帧;基于所述目标数量的音频帧的音色特征,确定所述音频的音色特征。4.根据权利要求3所述的方法,其特征在于,所述从所述音频的人声部分中,抽取目标数量的音频帧,包括:基于所述音频的人声部分的时长,确定采样频率;按照所述采样频率,在所述音频的人声部分中进行音频帧抽取,得到目标数量的音频帧。5.根据权利要求3所述的方法,其特征在于,所述基于所述目标数量的音频帧的音色特征,确定所述音频的音色特征,包括:获取各个音频帧的音色特征,得到目标数量的音色特征;基于目标数量的音色特征进行取平均处理,得到所述音频的音色特征。6.根据权利要求2所述的方法,其特征在于,所述对于任一候选音频...

【专利技术属性】
技术研发人员:熊贝尔曹偲高月洁吴迪郑博李鹏刘华平
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1