一种音频信号处理方法、装置及存储介质制造方法及图纸

技术编号:34088778 阅读:21 留言:0更新日期:2022-07-11 20:40
本文公开了一种音频信号处理方法、装置及存储介质,此方法包括:确定当前帧音频时域信号的第一声源在各频点上的第一协方差矩阵和第二声源在各频点上的第二协方差矩阵;判断所述第一协方差矩阵的可逆程度是否满足设定程度;在所述第一协方差矩阵的可逆程度满足设定程度时,确定所述第一协方差矩阵为当前帧音频时域信号的第一协方差矩阵;在所述第一协方差矩阵的可逆程度不满足设定程度时,根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵。本公开可以提高对盲源信号的分离效果,提高算法的鲁棒性和稳定性,提升分离性能。提升分离性能。提升分离性能。

【技术实现步骤摘要】
一种音频信号处理方法、装置及存储介质


[0001]本文涉及移动终端数据处理
,尤其涉及一种音频信号处理方法、装置及存储介质。

技术介绍

[0002]在物联网、AI时代,智能语音作为人工智能核心技术之一,可以有效地改善人机交互的模式,大大提高智能产品使用的便捷性。
[0003]目前智能产品设备的声音采集设备多采用麦克风阵列,应用麦克风波束形成技术提高语音信号处理质量,以提高真实环境下的语音识别率。
[0004]盲源分离技术利用不同声源信号间的独立性进行声源的分离,从而将目标信号和噪声源信号分开,提高信号的信噪比。
[0005]如何提高盲源分离技术的性能是需要解决的技术问题。

技术实现思路

[0006]为克服相关技术中存在的问题,本文提供了一种音频信号处理方法、装置及存储介质。
[0007]根据本文实施例的第一方面,提供一种音频信号处理方法,此方法包括:
[0008]获取至少两个麦克风采集的至少两个声源的混叠音频信号;
[0009]对所述混叠音频信号进行分帧处理,获得多帧音频时域信号;
[0010]针对每一帧音频时域信号进行以下处理:
[0011]确定当前帧音频时域信号的第一声源在各频点上的第一协方差矩阵和第二声源在各频点上的第二协方差矩阵;
[0012]判断所述第一协方差矩阵的可逆程度是否满足设定程度;
[0013]在所述第一协方差矩阵的可逆程度满足设定程度时,确定所述第一协方差矩阵为当前帧音频时域信号的第一协方差矩阵;在所述第一协方差矩阵的可逆程度不满足设定程度时,根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵;
[0014]使用所述第一协方差矩阵的逆矩阵与所述第二协方差矩阵计算中间矩阵;
[0015]根据所述中间矩阵计算分离矩阵;
[0016]使用所述分离矩阵对当前帧音频时域信号进行不同声源音频信号的分离。
[0017]在一实施方式中,所述根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵,包括以下中的一种:
[0018]将所述上一帧音频时域信号的第一协方差矩阵作为当前帧音频时域信号的第一协方差矩阵;
[0019]确定所述上一帧音频时域信号的第一协方差矩阵与系数矩阵的乘积矩阵,将所述乘积矩阵作为当前帧音频时域信号的第一协方差矩阵。
[0020]在一实施方式中,所述判断所述第一协方差矩阵的可逆程度是否满足设定程度,包括:
[0021]使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵;
[0022]确定所述第一协方差矩阵和所述辅助矩阵的乘积矩阵;
[0023]确定所述乘积矩阵与单位矩阵的第一差距值;
[0024]在所述第一差距值小于或等于设定阈值时,确定所述第一协方差矩阵的可逆程度满足设定程度。
[0025]在一实施方式中,所述使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵,包括:
[0026]确定所述第一协方差矩阵的伴随矩阵,以及确定所述第一协方差矩阵的行列式;
[0027]确定所述伴随矩阵与所述行列式的比值结果;
[0028]将所述比值结果作为所述第一协方差矩阵对应的辅助矩阵。
[0029]在一实施方式中,所述确定所述乘积矩阵与单位矩阵的第一差距值,包括:
[0030]确定所述乘积矩阵中位于主对角线上的每个元素与1的差值的绝对值,
[0031]确定所述乘积矩阵中位于主对角线之外的每个元素的绝对值;
[0032]确定各绝对值的和;
[0033]将所述和作为所述乘积矩阵与单位矩阵的第一差距值。
[0034]在一实施方式中,所述方法还包括:
[0035]确定当前帧音频时域信号之前的多个历史帧音频时域信号对应的第一差距值,根据多个历史帧音频时域信号对应的第一差距值确定第一系数,确定所述设定阈值是第一固定值与第一系数的乘积。
[0036]在一实施方式中,所述根据多个历史帧音频时域信号对应的第一差距值确定第一系数,包括:
[0037]确定每个历史帧音频时域信号对应的第一差距值与第一固定值的差值,确定每个历史帧音频时域信号对应的差值的平均值,根据所述平均值确定第一系数,所述平均值与所述第一系数正相关。
[0038]根据本文实施例的第二方面,提供一种音频信号处理装置,包括:
[0039]获取模块,被配置为获取至少两个麦克风采集的至少两个声源的混叠音频信号;
[0040]分帧模块,被配置为对所述混叠音频信号进行分帧处理,获得多帧音频时域信号;
[0041]处理模块,被配置为对每一帧音频时域信号进行处理;
[0042]所述处理模块包括:
[0043]第一确定模块,被配置为确定当前帧音频时域信号的第一声源在各频点上的第一协方差矩阵和第二声源在各频点上的第二协方差矩阵;
[0044]判断模块,被配置为判断所述第一协方差矩阵的可逆程度是否满足设定程度;
[0045]第二确定模块,被配置为在所述第一协方差矩阵的可逆程度满足设定程度时,确定所述第一协方差矩阵为当前帧音频时域信号的第一协方差矩阵;在所述第一协方差矩阵的可逆程度不满足设定程度时,根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵;
[0046]第三确定模块,被配置为使用所述第一协方差矩阵的逆矩阵与所述第二协方差矩
阵计算中间矩阵;根据所述中间矩阵计算分离矩阵;
[0047]分离模块,被配置为使用所述分离矩阵对当前帧音频时域信号进行不同声源音频信号的分离。
[0048]在一实施方式中,所述第二确定模块,还被配置为使用以下方法中的一种根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵:
[0049]将所述上一帧音频时域信号的第一协方差矩阵作为当前帧音频时域信号的第一协方差矩阵;
[0050]确定所述上一帧音频时域信号的第一协方差矩阵与系数矩阵的乘积矩阵,将所述乘积矩阵作为当前帧音频时域信号的第一协方差矩阵。
[0051]在一实施方式中,所述判断模块包括:
[0052]第四确定模块,被配置为使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵;
[0053]第五确定模块,被配置为确定所述第一协方差矩阵和所述辅助矩阵的乘积矩阵;
[0054]第六确定模块,被配置为确定所述乘积矩阵与单位矩阵的第一差距值;
[0055]第七确定模块,被配置为在所述第一差距值小于或等于设定阈值时,确定所述第一协方差矩阵的可逆程度是否满足设定程度。
[0056]在一实施方式中,所述第四确定模块,还被配置为采用以下方法使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵:
[0057]确定所述第一协方差矩阵的伴随矩阵,以及确定所述第一协方差矩阵的行列式;
[0058]确定所述伴随矩阵与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,包括:获取至少两个麦克风采集的至少两个声源的混叠音频信号;对所述混叠音频信号进行分帧处理,获得多帧音频时域信号;针对每一帧音频时域信号进行以下处理:确定当前帧音频时域信号的第一声源在各频点上的第一协方差矩阵和第二声源在各频点上的第二协方差矩阵;判断所述第一协方差矩阵的可逆程度是否满足设定程度;在所述第一协方差矩阵的可逆程度满足设定程度时,确定所述第一协方差矩阵为当前帧音频时域信号的第一协方差矩阵;在所述第一协方差矩阵的可逆程度不满足设定程度时,根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵;使用所述第一协方差矩阵的逆矩阵与所述第二协方差矩阵计算中间矩阵;根据所述中间矩阵计算分离矩阵;使用所述分离矩阵对当前帧音频时域信号进行不同声源音频信号的分离。2.如权利要求1所述的方法,其特征在于,所述根据上一帧音频时域信号的第一协方差矩阵更新当前帧音频时域信号的第一协方差矩阵,包括以下中的一种:将所述上一帧音频时域信号的第一协方差矩阵作为当前帧音频时域信号的第一协方差矩阵;确定所述上一帧音频时域信号的第一协方差矩阵与系数矩阵的乘积矩阵,将所述乘积矩阵作为当前帧音频时域信号的第一协方差矩阵。3.如权利要求1所述的方法,其特征在于,所述判断所述第一协方差矩阵的可逆程度是否满足设定程度,包括:使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵;确定所述第一协方差矩阵和所述辅助矩阵的乘积矩阵;确定所述乘积矩阵与单位矩阵的第一差距值;在所述第一差距值小于或等于设定阈值时,确定所述第一协方差矩阵的可逆程度满足设定程度。4.如权利要求3所述的方法,其特征在于,所述使用求逆公式确定所述第一协方差矩阵对应的辅助矩阵,包括:确定所述第一协方差矩阵的伴随矩阵,以及确定所述第一协方差矩阵的行列式;确定所述伴随矩阵与所述行列式的比值结果;将所述比值结果作为所述第一协方差矩阵对应的辅助矩阵。5.如权利要求3所述的方法,其特征在于,所述确定所述乘积矩阵与单位矩阵的第一差距值,包括:确定所述乘积矩阵中位于主对角线上的每个元素与1的差值的绝对值,确定所述乘积矩阵中位于主对角线之外的每个元素的绝对值;确定各绝对值的和;将所述和作为所述乘积矩阵与单位矩阵的第一差距值。
6.如权利要求3所述的方法,其特征在于,所述方法还包括:确定当前帧音频时域信号之前的多个历史帧音频时域信号对应的第一差距值,根据多个历史帧音频时域信号对应的第一差距值确定第一系数,确定所述设定阈值是第一固定值与第一系数的乘积。7.如权利要求6所述的方法,其特征在于,所述根据多个历史帧音频时域信号对应的第一差距值确定第一系数,包括:确定每个历史帧音频时域信号对应的第一差距值与第一固定值的差值,确定每个历史帧音频时域信号对应的差值的平均值,根据所述平均值确定第一系数,所述平均值与所述第一系数正相关。8.一种音频信号处理装置,应用于移动终端,其特征在于,包括:获取模块,被配置为获取至少两个麦克风采集的至少两个声源的混叠音频信号;分帧模块,被配置为对所述混叠音频信号进行分帧处理,获得多帧音频时域信号;处理模块,被配置为对每一帧音频时域信号进行处理;所述处理模块包括:第一确定模块,被配置为确定当前帧音频时域信号的第一声源在各频点上的第一协方差矩阵和第二声...

【专利技术属性】
技术研发人员:侯海宁
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1