音频信号的提取方法技术

技术编号:39731913 阅读:6 留言:0更新日期:2023-12-17 23:35
本申请公开了一种音频信号的提取方法

【技术实现步骤摘要】
音频信号的提取方法、装置、设备及可读存储介质


[0001]本申请实施例涉及多媒体
,特别涉及一种音频信号的提取方法

装置

设备及可读存储介质


技术介绍

[0002]在日常生活中,有很多物体能够产生音频信号,例如,生物

车辆

电器等均能够产生音频信号

一些场景中,通过音频采集设备采集目标物体产生的目标音频信号时,如果存在其他物体产生的音频信号,会导致通过音频采集设备采集到杂乱无序的混合音频信号

基于此,需要对混合音频信号进行提取,而如何对音频信号进行提取成为一个亟需解决的问题


技术实现思路

[0003]本申请提供了一种音频信号的提取方法

装置

设备及可读存储介质,可用于从混合音频信号中提取指定角度范围和指定距离范围内的音频信号,所述技术方案包括如下内容

[0004]一方面,提供了一种音频信号的提取方法,所述方法包括:
[0005]获取多个第一音频信号的时频特征,所述多个第一音频信号通过不同的音频采集设备采集得到;
[0006]基于所述多个第一音频信号的时频特征,确定频谱差异特征,所述频谱差异特征用于描述所述多个第一音频信号中的至少一对第一音频信号在相位频谱图和幅度频谱图中的至少一项上的差异;
[0007]对于任一对音频采集设备,基于所述任一对音频采集设备之间的距离

指定角度范围和指定距离范围,确定所述任一对音频采集设备的
N
个频率差异特征,所述
N
为大于1的正整数,所述指定角度范围包括
N
个第一角度范围,所述任一对音频采集设备的一个频率差异特征用于描述所述任一对音频采集设备采集在所述指定距离范围和一个第一角度范围内的音频信号在信号频率上的差异;
[0008]根据所述任一个第一音频信号的时频特征

所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征,确定所述任一个第一音频信号在所述指定角度范围和所述指定距离范围内的第二音频信号

[0009]另一方面,提供了一种音频信号的提取装置,所述装置包括:
[0010]获取模块,用于获取多个第一音频信号的时频特征,所述多个第一音频信号通过不同的音频采集设备采集得到;
[0011]确定模块,用于基于所述多个第一音频信号的时频特征,确定频谱差异特征,所述频谱差异特征用于描述所述多个第一音频信号中的至少一对第一音频信号在相位频谱图和幅度频谱图中的至少一项上的差异;
[0012]所述确定模块,还用于对于任一对音频采集设备,基于所述任一对音频采集设备
之间的距离

指定角度范围和指定距离范围,确定所述任一对音频采集设备的
N
个频率差异特征,所述
N
为大于1的正整数,所述指定角度范围包括
N
个第一角度范围,所述任一对音频采集设备的一个频率差异特征用于描述所述任一对音频采集设备采集在所述指定距离范围和一个第一角度范围内的音频信号在信号频率上的差异;
[0013]所述确定模块,还用于根据所述任一个第一音频信号的时频特征

所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征,确定所述任一个第一音频信号在所述指定角度范围和所述指定距离范围内的第二音频信号

[0014]在一种可能的实现方式中,所述确定模块,用于针对所述指定角度范围包括的任一个第一角度范围,对所述任一对音频采集设备之间的距离

所述任一个第一角度范围和指定距离范围进行映射和激活,得到所述任一对音频采集设备的一个频率差异特征

[0015]在一种可能的实现方式中,所述确定模块,用于将所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征进行融合,得到
N
个第一融合特征,一个第一融合特征用于描述所述至少一对音频采集设备在所述指定距离范围和一个第一角度范围内采集音频信号的差异;基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
N
个第一融合特征,确定所述第二音频信号

[0016]在一种可能的实现方式中,所述确定模块,用于对于任一个第一融合特征,将所述任一个第一融合特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的第一融合子特征,所述
K
为大于1的正整数;对于任一个频带,将所述任一个频带对应的
N
个第一融合子特征进行融合,得到所述任一个频带对应的第二融合子特征;基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
K
个频带对应的第二融合子特征,确定所述第二音频信号

[0017]在一种可能的实现方式中,所述确定模块,用于将所述任一个频带对应的
N
个第一融合子特征和目标融合子特征进行拼接,得到所述任一个频带在
N+1
个第一角度范围对应的拼接子特征,所述目标融合子特征是所述任一个频带对应的
N
个第一融合子特征中第一角度范围的取值最大或者取值最小的第一融合子特征;对所述任一个频带在
N+1
个第一角度范围对应的拼接子特征进行特征提取和映射,得到所述任一个频带在
N+1
个第一角度范围对应的参考子特征;从所述任一个频带在
N+1
个第一角度范围对应的参考子特征中选择取值最小的第一角度范围对应的第一参考子特征和取值最大的第一角度范围对应的第二参考子特征;基于所述第一参考子特征和所述第二参考子特征,确定所述任一个频带对应的第二融合子特征

[0018]在一种可能的实现方式中,所述确定模块,用于将所述任一个第一音频信号的时频特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的时频子特征,将所述频谱差异特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的频谱差异子特征;对于任一个频带,将所述任一个频带对应的时频子特征

频谱差异子特征和第二融合子特征进行融合,得到所述任一个频带对应的第三融合子特征;按照时间维度和频带维度中的至少一项,对所述
K
个频带对应的第三融合子特征进行特征提取,得到所述
K
个频带对应的特征提取结果;基于所述
K
个频带对应的特征提取结果,确定所述第二音频信号

[0019]在一种可能的实现方式中,所述确定模块,用于基于所述...

【技术保护点】

【技术特征摘要】
1.
一种音频信号的提取方法,其特征在于,所述方法包括:获取多个第一音频信号的时频特征,所述多个第一音频信号通过不同的音频采集设备采集得到;基于所述多个第一音频信号的时频特征,确定频谱差异特征,所述频谱差异特征用于描述所述多个第一音频信号中的至少一对第一音频信号在相位频谱图和幅度频谱图中的至少一项上的差异;对于任一对音频采集设备,基于所述任一对音频采集设备之间的距离

指定角度范围和指定距离范围,确定所述任一对音频采集设备的
N
个频率差异特征,所述
N
为大于1的正整数,所述指定角度范围包括
N
个第一角度范围,所述任一对音频采集设备的一个频率差异特征用于描述所述任一对音频采集设备采集在所述指定距离范围和一个第一角度范围内的音频信号在信号频率上的差异;根据所述任一个第一音频信号的时频特征

所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征,确定所述任一个第一音频信号在所述指定角度范围和所述指定距离范围内的第二音频信号
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述任一对音频采集设备之间的距离

指定角度范围和指定距离范围,确定所述任一对音频采集设备的
N
个频率差异特征,包括:针对所述指定角度范围包括的任一个第一角度范围,对所述任一对音频采集设备之间的距离

所述任一个第一角度范围和指定距离范围进行映射和激活,得到所述任一对音频采集设备的一个频率差异特征
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述任一个第一音频信号的时频特征

所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征,确定所述任一个第一音频信号在所述指定角度范围和所述指定距离范围内的第二音频信号,包括:将所述频谱差异特征和至少一对音频采集设备的
N
个频率差异特征进行融合,得到
N
个第一融合特征,一个第一融合特征用于描述所述至少一对音频采集设备在所述指定距离范围和一个第一角度范围内采集音频信号的差异;基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
N
个第一融合特征,确定所述第二音频信号
。4.
根据权利要求3所述的方法,其特征在于,所述基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
N
个第一融合特征,确定所述第二音频信号,包括:对于任一个第一融合特征,将所述任一个第一融合特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的第一融合子特征,所述
K
为大于1的正整数;对于任一个频带,将所述任一个频带对应的
N
个第一融合子特征进行融合,得到所述任一个频带对应的第二融合子特征;基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
K
个频带对应的第二融合子特征,确定所述第二音频信号
。5.
根据权利要求4所述的方法,其特征在于,所述将所述任一个频带对应的
N
个第一融合子特征进行融合,得到所述任一个频带对应的第二融合子特征,包括:将所述任一个频带对应的
N
个第一融合子特征和目标融合子特征进行拼接,得到所述
任一个频带在
N+1
个第一角度范围对应的拼接子特征,所述目标融合子特征是所述任一个频带对应的
N
个第一融合子特征中第一角度范围的取值最大或者取值最小的第一融合子特征;对所述任一个频带在
N+1
个第一角度范围对应的拼接子特征进行特征提取和映射,得到所述任一个频带在
N+1
个第一角度范围对应的参考子特征;从所述任一个频带在
N+1
个第一角度范围对应的参考子特征中选择取值最小的第一角度范围对应的第一参考子特征和取值最大的第一角度范围对应的第二参考子特征;基于所述第一参考子特征和所述第二参考子特征,确定所述任一个频带对应的第二融合子特征
。6.
根据权利要求4所述的方法,其特征在于,所述基于所述任一个第一音频信号的时频特征

所述频谱差异特征和所述
K
个频带对应的第二融合子特征,确定所述第二音频信号,包括:将所述任一个第一音频信号的时频特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的时频子特征,将所述频谱差异特征在频域维度上按照
K
个频带进行切分,得到所述
K
个频带对应的频谱差异子特征;对于任一个频带,将所述任一个频带对应的时频子特征

频谱差异子特征和第二融合子特征进行融合,得到所述任一个频带对应的第三融合子特征;按照时间维度和频带维度中的至少一项,对所述
K
个频带对应的第三融合子特征进行特征提取,得到所述
K
个频带对应的特征提取结果;基于所述
K
个频带对应的特征提取结果,确定所述第二音频信号
。7.
根据权利要求6所述的方法,其特征在于,所述基于所述
K
个频带...

【专利技术属性】
技术研发人员:顾容之罗艺
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1