语音活动检测方法、系统、语音增强方法以及系统技术方案

技术编号：37579541 阅读：11 留言：0更新日期：2023-05-15 07:54

本说明书提供的语音活动检测方法、系统、语音增强方法以及系统中，麦克风阵列输出的麦克风信号满足噪声信号对应的第一模型或目标语音信号与所述噪声信号混合对应的第二模型。所述方法和系统可以以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标，分别对第一模型以及第二模型进行优化，确定所述第一模型的噪声协方差矩阵的第一估计值以及第二模型的噪声协方差矩阵的第二估计值，并通过统计假设检验的方法判断麦克风信号满足第一模型还是第二模型，从而确定麦克风信号中是否存在目标语音信号，并确定麦克风信号的噪声协方差矩阵，进而对麦克风信号进行语音增强。所述方法和系统可以使噪声协方差估计精度，进而提高语音增强效果。提高语音增强效果。提高语音增强效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音活动检测方法、系统、语音增强方法以及系统

[0001]本说明书涉及目标语音信号处理
，尤其涉及一种语音活动检测方法、系统、语音增强方法以及系统。

技术介绍

[0002]在基于波束成形算法的语音增强技术中，特别是最小方差无失真响应 (Minimum Variance Distortionless Response，简称MVDR)的自适应波束形成算法中，怎么求解描述不同麦克风之间噪声统计特性关系的参量——噪声协方差矩阵至关重要。现有技术中的主要方法是基于语音存在概率的方法计算噪声协方差矩阵，比如通过语音活动检测方法(Voice ActivityDetection，简称VAD)估计语音存在概率，进而计算噪声协方差矩阵。但是现有技术中的语音存在概率估计准确率不够，导致噪声协方差矩阵估计精度较低，进而导致MVDR算法的语音增强效果较差。尤其当麦克风数目较少，比如小于5个时，效果急剧下降。因此，现有技术中的MVDR算法多用于手机、智能音箱等麦克风数量多且间距大的麦克风阵列设备中，而对于耳机这种麦克风数量少且间距小的设备语音增强效果较差。
[0003]因此，需要提供一种精度更高的语音活动检测方法、系统、语音增强方法以及系统。

技术实现思路

[0004]本说明书提供一种精度更高的语音活动检测方法、系统、语音增强方法以及系统。
[0005]第一方面，本说明书提供一种语音活动检测方法，用于呈预设阵列形状分布的M个麦克风，所述M为大于1的整数，包括：获取所述M个麦克风输出...

【技术保护点】

【技术特征摘要】
1.一种语音活动检测方法，其特征在于，用于呈预设阵列形状分布的M个麦克风，所述M为大于1的整数，包括：获取所述M个麦克风输出的麦克风信号，所述麦克风信号满足不存在目标语音信号对应的第一模型或存在目标语音信号对应的第二模型；以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标，分别对所述第一模型以及所述第二模型进行优化，确定所述第一模型的噪声协方差矩阵的第一估计值以及所述第二模型的噪声协方差矩阵的第二估计值；以及基于统计假设检验，确定所述麦克风信号对应的目标模型以及噪声协方差矩阵，所述目标模型包括所述第一模型和所述第二模型中的一个，所述麦克风信号的噪声协方差矩阵为所述目标模型的噪声协方差矩阵。2.如权利要求1所述的语音活动检测方法，其特征在于，所述麦克风信号包括K帧连续的音频信号，所述K为大于1的正整数，所述麦克风信号包括M
×
K的数据矩阵。3.如权利要求2所述的语音活动检测方法，其特征在于，所述麦克风信号为完整观测信号或非完整观测信号，所述完整观测信号中所述M
×
K的数据矩阵中的所有数据完整，所述非完整观测信号中所述M
×
K的数据矩阵中的部分数据缺失，当所述麦克风信号为所述非完整观测信号时，所述获取所述M个麦克风输出的麦克风信号，包括：获取所述非完整观测信号；基于所述M
×
K的数据矩阵中的每一列中的数据缺失位置，对所述麦克风信号进行行列置换，并将所述麦克风信号划分为至少一个子麦克风信号，所述麦克风信号包括所述至少一个子麦克风信号。4.如权利要求1所述的语音活动检测方法，其特征在于，所述以似然函数最大化以及噪声协方差矩阵的秩最小化为联合优化目标，分别对所述第一模型以及所述第二模型进行优化，包括：以所述麦克风信号为样本数据，建立所述第一模型对应的第一似然函数，所述似然函数包括所述第一似然函数；以所述第一似然函数最大化以及所述第一模型的噪声协方差矩阵的秩最小化为优化目标，对所述第一模型进行优化，确定所述第一估计值；以所述麦克风信号为样本数据，建立所述第二模型的第二似然函数，所述似然函数包括所述第二似然函数；以及以所述第二似然函数最大化以及所述第二模型的噪声协方差矩阵的秩最小化为优化目标，对所述第二模型进行优化，确定所述第二估计值以及所述目标语音信号的幅度估计值。5.如权利要求4所述的语音活动检测方法，其特征在于，所述麦克风信号包括噪声信号，所述噪声信号服从高斯分布，所...

【专利技术属性】
技术研发人员：肖乐，张承乾，廖风云，齐心，
申请(专利权)人：深圳市韶音科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人