用于减少来自音频信号的噪声的基于话音特征的单信道语音活动检测方法和系统技术方案

技术编号:43106543 阅读:28 留言:0更新日期:2024-10-26 09:48
单信道的基于话音特征的语音活动检测(SFVAD)系统是鲁棒低时延系统,其生成每框的话音和噪声指示,连同计算一对话音和噪声时‑频掩码。SFVAD系统控制针对波束赋形系统控制模块的适配机制,并通过鲁棒地处理瞬态噪声来改进诸如虚拟辅助(VA)和免提(HF)呼叫之类的自动话音识别应用的话音质量和噪声减少能力。系统从输入音频信号提取话音状模式,并且它对输入音频信号的功率水平来说不变。噪声计算由一对基于话音特征的检测器(语音的和非语音的)控制。使用基于倒谱的音高检测器和中心计算方法以防止由话音内容对所计算的噪声的污染。SFVAD系统鲁棒地处理背景噪声水平的瞬时改变并具有显著更低的误检测率。

【技术实现步骤摘要】

本公开涉及数字信号处理(dsp)和自动话音识别(asr)系统。具体而言,本公开涉及在具有显著背景噪声的机动车环境中的用于语音活动检测(vad)的自适应滤波的使用。


技术介绍

1、语音活动检测是任何自动话音识别(asr)、免提或ip语音(voip)系统中的关键组分。vad方法是一类数字信号处理方法,其检测话音在音频信号的短段中的存在(或不存在)。vad系统分析传入音频信号并识别话音和非话音(例如,噪声)的段。vad系统被用在话音通信系统中,并且它们的使用:(1)改进信道容量;(2)减少蜂窝无线电系统中的便携式电子设备中的同信道干扰和功耗;以及(3)实现多媒体通信中的同时语音和数据应用。“自适应滤波”意味着:所应用的滤波器在输入音频信号的实时顺序分析期间随时间改变。

2、基本vad系统通过从传入音频信号提取所测量的特征来工作,该传入音频信号被划分成具有等于例如5-40毫秒持续时间的固定时间窗口的顺序系列的短时间框。然后,将从输入音频信号提取的特征与阈值界限(常常是根据输入音频信号的仅噪声时段确定的)进行比较,并且计算vad判决(0或1)。如果输入音本文档来自技高网...

【技术保护点】

1.一种数字信号处理的计算机化方法,包括:

2.如权利要求1所述的计算机化方法,进一步包括:

3.如权利要求1所述的计算机化方法,进一步包括:

4.如权利要求1所述的计算机化方法,进一步包括:

5.如权利要求1所述的计算机化方法,进一步包括:

6.如权利要求1所述的计算机化方法,其中识别所述噪声段包括:

7.如权利要求6所述的计算机化方法,进一步包括:

8.如权利要求6所述的计算机化方法,进一步包括:

9.如权利要求1所述的计算机化方法,进一步包括:

10.一种计算机化音频波束赋形...

【技术特征摘要】

1.一种数字信号处理的计算机化方法,包括:

2.如权利要求1所述的计算机化方法,进一步包括:

3.如权利要求1所述的计算机化方法,进一步包括:

4.如权利要求1所述的计算机化方法,进一步包括:

5.如权利要求1所述的计算机化方法,进一步包括:

6...

【专利技术属性】
技术研发人员:M·祖尔E·哈达
申请(专利权)人:通用汽车环球科技运作有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1