语音活动检测方法、系统、语音增强方法以及系统技术方案

技术编号:37579541 阅读:11 留言:0更新日期:2023-05-15 07:54
本说明书提供的语音活动检测方法、系统、语音增强方法以及系统中,麦克风阵列输出的麦克风信号满足噪声信号对应的第一模型或目标语音信号与所述噪声信号混合对应的第二模型。所述方法和系统可以以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标,分别对第一模型以及第二模型进行优化,确定所述第一模型的噪声协方差矩阵的第一估计值以及第二模型的噪声协方差矩阵的第二估计值,并通过统计假设检验的方法判断麦克风信号满足第一模型还是第二模型,从而确定麦克风信号中是否存在目标语音信号,并确定麦克风信号的噪声协方差矩阵,进而对麦克风信号进行语音增强。所述方法和系统可以使噪声协方差估计精度,进而提高语音增强效果。提高语音增强效果。提高语音增强效果。

【技术实现步骤摘要】
语音活动检测方法、系统、语音增强方法以及系统


[0001]本说明书涉及目标语音信号处理
,尤其涉及一种语音活动检 测方法、系统、语音增强方法以及系统。

技术介绍

[0002]在基于波束成形算法的语音增强技术中,特别是最小方差无失真响应 (Minimum Variance Distortionless Response,简称MVDR)的自适应波束形 成算法中,怎么求解描述不同麦克风之间噪声统计特性关系的参量——噪 声协方差矩阵至关重要。现有技术中的主要方法是基于语音存在概率的方 法计算噪声协方差矩阵,比如通过语音活动检测方法(Voice ActivityDetection,简称VAD)估计语音存在概率,进而计算噪声协方差矩阵。但 是现有技术中的语音存在概率估计准确率不够,导致噪声协方差矩阵估计 精度较低,进而导致MVDR算法的语音增强效果较差。尤其当麦克风数目 较少,比如小于5个时,效果急剧下降。因此,现有技术中的MVDR算法 多用于手机、智能音箱等麦克风数量多且间距大的麦克风阵列设备中,而 对于耳机这种麦克风数量少且间距小的设备语音增强效果较差。
[0003]因此,需要提供一种精度更高的语音活动检测方法、系统、语音增强 方法以及系统。

技术实现思路

[0004]本说明书提供一种精度更高的语音活动检测方法、系统、语音增强方 法以及系统。
[0005]第一方面,本说明书提供一种语音活动检测方法,用于呈预设阵列形 状分布的M个麦克风,所述M为大于1的整数,包括:获取所述M个麦 克风输出的麦克风信号,所述麦克风信号满足不存在目标语音信号对应的 第一模型或存在目标语音信号对应的第二模型;以似然函数最大化以及噪 声协方差矩阵的秩最小化为联合优化目标,分别对所述第一模型以及所述 第二模型进行优化,确定所述第一模型的噪声协方差矩阵的第一估计值以 及所述第二模型的噪声协方差矩阵的第二估计值;以及基于统计假设检验, 确定所述麦克风信号对应的目标模型以及噪声协方差矩阵,所述目标模型 包括所述第一模型和所述第二模型中的一个,所述麦克风信号的噪声协方 差矩阵为所述目标模型的噪声协方差矩阵。
[0006]在一些实施例中,所述麦克风信号包括K帧连续的音频信号,所述K 为大于1的正整数,所述麦克风信号包括M
×
K的数据矩阵。
[0007]在一些实施例中,所述麦克风信号为完整观测信号或非完整观测信号, 所述完整观测信号中所述M
×
K的数据矩阵中的所有数据完整,所述非完整 观测信号中所述M
×
K的数据矩阵中的部分数据缺失,当所述麦克风信号为 所述非完整观测信号时,所述获取所述M个麦克风输出的麦克风信号,包 括:获取所述非完整观测信号;基于所述M
×
K的数据矩阵中的每一列中的 数据缺失位置,对所述麦克风信号进行行列置换,并将所述麦克风信号划 分为至少一个子麦克风信号,所述麦克风信号包括所述至少一个子麦克风 信号。
[0008]在一些实施例中,所述以似然函数最大化以及噪声协方差矩阵的秩最 小化为联合优化目标,分别对所述第一模型以及所述第二模型进行优化, 包括:以所述麦克风信号为样本数据,建立所述第一模型对应的第一似然 函数,所述似然函数包括所述第一似然函数;以所述第一似然函数最大化 以及所述第一模型的噪声协方差矩阵的秩最小化为优化目标,对所述第一 模型进行优化,确定所述第一估计值;以所述麦克风信号为样本数据,建 立所述第二模型的第二似然函数,所述似然函数包括所述第二似然函数; 以及以所述第二似然函数最大化以及所述第二模型的噪声协方差矩阵的秩 最小化为优化目标,对所述第二模型进行优化,确定所述第二估计值以及 所述目标语音信号的幅度估计值。
[0009]在一些实施例中,所述麦克风信号包括噪声信号,所述噪声信号服从 高斯分布,所述噪声信号至少包括:有色噪声信号,服从零均值的高斯分 布,其对应的噪声协方差矩阵为低秩半正定矩阵。
[0010]在一些实施例中,所述基于统计假设检验,确定所述麦克风信号对应 的目标模型以及噪声协方差矩阵,包括:基于所述麦克风信号,建立二元 假设检验模型,其中,所述二元假设检验模型的原假设包括所述麦克风信 号满足所述第一模型,所述二元假设检验模型的备择假设包括所述麦克风 信号满足所述第二模型;将所述第一估计值、所述第二估计值以及所述幅 度估计值代入所述二元假设检验模型的检测器的判决准则中,获取检验统 计量;以及基于所述检验统计量判断所述麦克风信号的所述目标模型。
[0011]在一些实施例中,所述基于所述检验统计量判断所述麦克风信号的所 述目标模型,包括:确定所述检验统计量大于所述预设的判决门限,判定 所述麦克风信号中存在所述目标语音信号,确定所述目标模型为所述第二 模型,所述麦克风信号的噪声协方差矩阵为所述第二估计值;或者确定所 述检验统计量小于所述预设的判决门限,判定所述麦克风信号中不存在所 述目标语音信号,确定所述目标模型为所述第一模型,所述麦克风信号的 噪声协方差矩阵为所述第一估计值。
[0012]第二方面,本说明书还提供一种语音活动检测系统,包括至少一个存 储介质以及至少一个处理器,所述至少一个存储介质存储有至少一个指令 集用于语音活动检测;所述至少一个处理器同所述至少一个存储介质通信 连接,其中当所述语音活动检测系统运行时,所述至少一个处理器读取所 述至少一个指令集并实施本说明书第一方面所述的语音活动检测方法。
[0013]第三方面,本说明书还提供一种语音增强方法,用于呈预设阵列形状 分布的M个麦克风,所述M为大于1的整数,包括:获取所述M个麦克 风输出的麦克风信号;基于权利要求1

8中任一项所述的语音活动检测方法, 确定所述麦克风信号的所述目标模型以及所述麦克风信号的噪声协方差矩 阵,所述麦克风信号的噪声协方差矩阵,为所述目标模型的噪声协方差矩 阵;基于MVDR方法以及所述麦克风信号的噪声协方差矩阵,确定所述麦 克风信号对应的滤波系数;以及基于所述滤波系数对所述麦克风信号进行 合并,输出目标音频信号。
[0014]第四方面,本说明书还提供一种语音增强系统,包括至少一个存储介 质以及至少一个处理器,所述至少一个存储介质存储有至少一个指令集用 于进行语音增强;所述至少一个处理器同所述至少一个存储介质通信连接, 其中当所述语音增强系统运行时,所述至少一个处理器读取所述至少一个 指令集并实施本说明书第三方面所述的语音增强方法。
[0015]由以上技术方案可知,本说明书提供的语音活动检测方法、系统、语 音增强方法以及系统,用于由多个麦克风组成的麦克风阵列。其中,所述 麦克风阵列输出的麦克风信号满足噪声信号对应的第一模型或目标语音信 号与所述噪声信号混合对应的第二模型。为了获取所述麦克风信号中是否 存在目标语音信号,所述方法和系统可以以似然函数最大化以及噪声协方 差矩阵的秩最小化为联合优化目标,分别对第一模型以及第二模型进行优 化,确定所述第一模型的噪声协方差矩阵的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音活动检测方法,其特征在于,用于呈预设阵列形状分布的M个麦克风,所述M为大于1的整数,包括:获取所述M个麦克风输出的麦克风信号,所述麦克风信号满足不存在目标语音信号对应的第一模型或存在目标语音信号对应的第二模型;以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标,分别对所述第一模型以及所述第二模型进行优化,确定所述第一模型的噪声协方差矩阵的第一估计值以及所述第二模型的噪声协方差矩阵的第二估计值;以及基于统计假设检验,确定所述麦克风信号对应的目标模型以及噪声协方差矩阵,所述目标模型包括所述第一模型和所述第二模型中的一个,所述麦克风信号的噪声协方差矩阵为所述目标模型的噪声协方差矩阵。2.如权利要求1所述的语音活动检测方法,其特征在于,所述麦克风信号包括K帧连续的音频信号,所述K为大于1的正整数,所述麦克风信号包括M
×
K的数据矩阵。3.如权利要求2所述的语音活动检测方法,其特征在于,所述麦克风信号为完整观测信号或非完整观测信号,所述完整观测信号中所述M
×
K的数据矩阵中的所有数据完整,所述非完整观测信号中所述M
×
K的数据矩阵中的部分数据缺失,当所述麦克风信号为所述非完整观测信号时,所述获取所述M个麦克风输出的麦克风信号,包括:获取所述非完整观测信号;基于所述M
×
K的数据矩阵中的每一列中的数据缺失位置,对所述麦克风信号进行行列置换,并将所述麦克风信号划分为至少一个子麦克风信号,所述麦克风信号包括所述至少一个子麦克风信号。4.如权利要求1所述的语音活动检测方法,其特征在于,所述以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标,分别对所述第一模型以及所述第二模型进行优化,包括:以所述麦克风信号为样本数据,建立所述第一模型对应的第一似然函数,所述似然函数包括所述第一似然函数;以所述第一似然函数最大化以及所述第一模型的噪声协方差矩阵的秩最小化为优化目标,对所述第一模型进行优化,确定所述第一估计值;以所述麦克风信号为样本数据,建立所述第二模型的第二似然函数,所述似然函数包括所述第二似然函数;以及以所述第二似然函数最大化以及所述第二模型的噪声协方差矩阵的秩最小化为优化目标,对所述第二模型进行优化,确定所述第二估计值以及所述目标语音信号的幅度估计值。5.如权利要求4所述的语音活动检测方法,其特征在于,所述麦克风信号包括噪声信号,所述噪声信号服从高斯分布,所...

【专利技术属性】
技术研发人员:肖乐张承乾廖风云齐心
申请(专利权)人:深圳市韶音科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1