一种门限自适应的语音检测系统技术方案

技术编号：3046616 阅读：243 留言：0更新日期：2012-04-11 18:40

一种门限自适应的语音检测系统，采用模糊聚类和贝叶斯信息准则，该语音检测系统包括：　　　　一个语音采集装置，用于采集说话者的语音信号；　　　　一个录音缓存装置，用于将从上述语音采集装置中接收的最近录音数据缓存；　　　　一个能量特征提取装置，用于对上述录音缓存装置中存储的输入语音信号进行能量特征提取；　　　　一个模糊聚类装置，用于对上述录音缓存装置中存储的录音数据进行模糊聚类；　　　　一个贝叶斯信息准则装置，用于对经所述模糊聚类装置处理后的数据进行聚类结果后处理；　　　　一个门限估计装置，用于根据贝叶斯信息准则装置处理后的结果进行在线的检测门限计算和更新；　　　　一个逐帧比较装置，用于根据能量特征提取装置及门限估计装置的处理结果，对每帧的能量和门限进行比较，得到分帧检测的结果；　　　　一个平滑装置，用于把逐帧检测的结果经过平滑规则得到最后的基于句子的语音检测。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种门限自适应的语音检测系统，尤其是涉及一种基于模糊聚类的语音检测系统。
技术介绍
语音是未来用户界面的主流。实用的语音信号处理系统必须能够在千差万别的声学环境中稳健地运行。语音检测是语音信号处理中比较重要的一部分，其稳健性将极大地影响后续的语音识别和语音编码的性能。基于门限的语音检测算法逐帧求取语音检测特征，然后把特征的数值和门限进行比较，最后将得到的帧判决结果平滑。门限对于最后的检测结果是至关重要的，过高或者过低的门限都无法给出正确的检测结果。对于能量特征来说，采用固定门限的方法是不可取的，因为语音识别系统在不同的环境下使用会有不同的背景噪声，用户录音的音量和信噪比也会不一样，因此需要在使用时在线实时的计算语音检测门限。已有的语音检测门限估计算法的研究主要集中在以下的三个方面1.基于无声段的门限估计算法，这种门限估计算法需要在识别的开始阶段录制环境噪声，然后由环境噪声的平均能量加上一个域值估计检测的高低门限。这种方法物理意义明确，能量高于无声段平均能量一定程度的即为语音，实现简单，计算量小，而且在高信噪比环境下可以得到好的检测结果。但是这种方法需要初始化的无声段。对于真正的实用系统，这是一个比较严格的要求。而且这种方法估计的门限值是固定不变的，因此不适合非平稳的背景噪声情况。2.基于能量直方图的门限估计算法，利用能量分布直方图确定语音检测的门限。对于一段录音，计算每帧的能量，然后根据所有的帧能量求取分布直方图，然后由直方图的峰值确定背景噪声和语音的平均能量。基于能量直方图的门限估计算法比基于初始化无声段的门限估计方法要稳健，因为它从直...

【技术保护点】

【技术特征摘要】
1.一种门限自适应的语音检测系统，采用模糊聚类和贝叶斯信息准则，该语音检测系统包括一个语音采集装置，用于采集说话者的语音信号；一个录音缓存装置，用于将从上述语音采集装置中接收的最近录音数据缓存；一个能量特征提取装置，用于对上述录音缓存装置中存储的输入语音信号进行能量特征提取；一个模糊聚类装置，用于对上述录音缓存装置中存储的录音数据进行模糊聚类；一个贝叶斯信息准则装置，用于对经所述模糊聚类装置处理后的数据进行聚类结果后处理；一个门限估计装置，用于根据贝叶斯信息准则装置处理后的结果进行在线的检测门限计算和更新；一个逐帧比较装置，用于根据能量特征提取装置及门限估计装置的处理结果，对每帧的能量和门限进行比较，得到分帧检测的结果；一个平滑装置，用于把逐帧检测的结果经过平滑规则得到最后的基于句子的语音检测...

【专利技术属性】
技术研发人员：吴及，王作英，田野，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人